ShareAI'de EmbeddingGemma: 300M Çok Dilli Gömülü Öğeler

1. EmbeddingGemma artık ShareAI'de
2. Duyuruyoruz ki 3. EmbeddingGemma, 4. , Google'ın kompakt açık gömme modeli, artık ShareAI'de mevcut.
-de/-da 6. 300 milyon parametre, 7. ile, EmbeddingGemma boyutuna göre son teknoloji performans sunar. Bu, 8. Gemma 3 ile 9. T5Gemma başlatması 10. ve 11. Gemini 12. modellerinin arkasındaki aynı araştırma ve teknolojiyi kullanır. Model, metnin vektör temsillerini üretir ve bu da onu arama ve alma görevleri için, 13. sınıflandırma, 14. kümeleme, ve 15. anlamsal benzerlik dahil olmak üzere, oldukça uygun hale getirir.. Veri ile eğitildi 100+ konuşulan dil.
Neden önemli
Modelin küçük boyutu ve cihaz odaklı olması, sınırlı kaynaklara sahip ortamlarda kullanılmasını pratik hale getiriyor—mobil telefonlar, dizüstü bilgisayarlar veya masaüstü bilgisayarlar—en son teknoloji AI modellerine erişimi demokratikleştiriyor ve herkes için yeniliği teşvik ediyor.
Karşılaştırma

Eğitim veri seti
EmbeddingGemma, 100+ konuşulan dildeki veri ile eğitildi.
- Web belgeleri
Çeşitli bir web metni koleksiyonu, geniş dil stillerine, konulara ve kelime dağarcığına maruz kalmayı sağlar. Veri seti şunları içerir: 100+ dil. - Kod ve teknik belgeler
Programlama dilleri ve özel bilimsel içeriklerin dahil edilmesi, modelin kod ve teknik soruları anlama yeteneğini geliştiren yapı ve desenleri öğrenmesine yardımcı olur. - Sentetik ve görev odaklı veri
Özenle hazırlanmış sentetik veriler, bilgi alma, sınıflandırma ve duygu analizi gibi belirli becerileri öğretir, yaygın gömme uygulamaları için performansı iyileştirir.
Çeşitli kaynakların bu kombinasyonu, geniş bir görev ve veri formatı yelpazesini işleyebilen güçlü bir çok dilli gömme modeli için çok önemlidir.
Neler oluşturabilirsiniz
EmbeddingGemma'yı kullanın arama ve alma, 15. anlamsal benzerlik dahil olmak üzere, oldukça uygun hale getirir., sınıflandırma hatları, ve 14. kümeleme—özellikle kısıtlı cihazlarda çalışabilen yüksek kaliteli gömmelere ihtiyacınız olduğunda.
Referans
Şimdi ShareAI'de mevcut.
Çalıştırın. Test edin. Gönderin.