EmbeddingGemma sur ShareAI : 300M d'Incorporations Multilingues

EmbeddingGemma est maintenant sur ShareAI
Nous annonçons que IntégrationGemma, le modèle compact d'intégration ouvert de Google, est maintenant disponible sur ShareAI.
Avec 300 millions de paramètres, EmbeddingGemma offre des performances de pointe pour sa taille. Il est construit à partir de Gemma 3 avec initialisation T5Gemma et utilise la même recherche et technologie derrière les modèles Gémeaux . Le modèle produit des représentations vectorielles de texte, ce qui le rend bien adapté aux tâches de recherche et de récupération, y compris classification, regroupement, et similarité sémantique. Il a été entraîné avec des données en Plus de 100 langues parlées.
Pourquoi c'est important
La petite taille du modèle et son focus sur l'appareil le rendent pratique à déployer dans des environnements avec des ressources limitées—téléphones mobiles, ordinateurs portables ou de bureau—démocratisant l'accès aux modèles IA de pointe et favorisant l'innovation pour tous.
Référence

Ensemble de données d'entraînement
EmbeddingGemma a été entraîné avec des données en plus de 100 langues parlées.
- Documents web
Une collection diversifiée de textes web garantit une exposition à des styles linguistiques, des sujets et des vocabulaires variés. L'ensemble de données inclut du contenu en Plus de 100 langues. - Code et documents techniques
Inclure des langages de programmation et du contenu scientifique spécialisé aide le modèle à apprendre des structures et des schémas qui améliorent la compréhension du code et des questions techniques. - Données synthétiques et spécifiques aux tâches
Des données synthétiques sélectionnées enseignent des compétences spécifiques pour la recherche d'informations, la classification et l'analyse des sentiments, optimisant les performances pour les applications courantes d'intégration.
Cette combinaison de sources diversifiées est cruciale pour un modèle d'intégration multilingue puissant capable de gérer une large gamme de tâches et de formats de données.
Ce que vous pouvez construire
Utilisez EmbeddingGemma pour la recherche et la récupération, similarité sémantique, les pipelines de classification, et regroupement—surtout lorsque vous avez besoin d'intégrations de haute qualité pouvant fonctionner sur des dispositifs contraints.
Référence
Disponible maintenant sur ShareAI.
Exécutez-le. Testez-le. Expédiez-le.