EmbeddingGemma pe ShareAI: 300M Încapsulări Multilingve

EmbeddingGemma este acum pe ShareAI
Anunțăm că ÎncorporareGemma, modelul compact de embedding deschis al Google, este acum disponibil pe ShareAI.
La 300 de milioane de parametri, EmbeddingGemma oferă performanță de ultimă generație pentru dimensiunea sa. Este construit pe baza Gemma 3 cu inițializării T5Gemma și folosește aceeași cercetare și tehnologie din spatele modelelor Gemeni . Modelul produce reprezentări vectoriale ale textului, ceea ce îl face potrivit pentru sarcini de căutare și regăsire, inclusiv clasificare, grupare, și similaritate semantică. A fost antrenat cu date în Peste 100 de limbi vorbite.
De ce este important
Dimensiunea mică a modelului și concentrarea pe dispozitive îl fac practic de implementat în medii cu resurse limitate—telefoane mobile, laptopuri sau desktopuri—democratizând accesul la modele AI de ultimă generație și încurajând inovația pentru toată lumea.
Reper

Set de date de antrenament
EmbeddingGemma a fost antrenat cu date în peste 100 de limbi vorbite.
- Documente web
O colecție diversă de texte web asigură expunerea la stiluri lingvistice, subiecte și vocabular variate. Setul de date include conținut în Peste 100 de limbi. - Cod și documente tehnice
Includerea limbajelor de programare și a conținutului științific specializat ajută modelul să învețe structura și tiparele care îmbunătățesc înțelegerea codului și a întrebărilor tehnice. - Date sintetice și specifice sarcinilor
Datele sintetice selectate învață abilități specifice pentru regăsirea informațiilor, clasificare și analiză a sentimentelor, optimizând performanța pentru aplicațiile comune de încorporare.
Această combinație de surse diverse este crucială pentru un model puternic de încorporare multilingv care poate gestiona o gamă largă de sarcini și formate de date.
Ce poți construi
Utilizează EmbeddingGemma pentru căutare și regăsire, similaritate semantică, fluxuri de clasificare, și grupare—mai ales când ai nevoie de încorporări de înaltă calitate care pot rula pe dispozitive cu resurse limitate.
Referință
Disponibil acum pe ShareAI.
Rulează-l. Testează-l. Livrează-l.