EmbeddingGemma di ShareAI: 300M Embedding Multilingual

EmbeddingGemma sekarang ada di ShareAI
Kami mengumumkan bahwa MenanamkanGemma, model embedding terbuka yang ringkas dari Google, sekarang tersedia di ShareAI.
Dengan 300 juta parameter, EmbeddingGemma memberikan performa mutakhir untuk ukurannya. Model ini dibangun dari Gemma 3 dengan inisialisasi T5Gemma dan menggunakan penelitian dan teknologi yang sama di balik model Gemini. Model ini menghasilkan representasi vektor dari teks, membuatnya sangat cocok untuk tugas pencarian dan pengambilan, termasuk klasifikasi, pengelompokan, dan kesamaan semantik. Itu dilatih dengan data dalam 100+ bahasa lisan.
Mengapa ini penting
Ukuran model yang kecil dan fokus pada perangkat membuatnya praktis untuk diterapkan di lingkungan dengan sumber daya terbatas—ponsel, laptop, atau desktop—mendemokratisasi akses ke model AI mutakhir dan mendorong inovasi untuk semua orang.
Tolok ukur

Dataset pelatihan
EmbeddingGemma dilatih dengan data dalam 100+ bahasa lisan.
- Dokumen web
Koleksi teks web yang beragam memastikan paparan terhadap gaya linguistik, topik, dan kosakata yang luas. Dataset ini mencakup konten dalam 100+ bahasa. - Kode dan dokumen teknis
Termasuk bahasa pemrograman dan konten ilmiah khusus membantu model mempelajari struktur dan pola yang meningkatkan pemahaman tentang kode dan pertanyaan teknis. - Data sintetis dan spesifik tugas
Data sintetis yang dikurasi mengajarkan keterampilan spesifik untuk pengambilan informasi, klasifikasi, dan analisis sentimen, menyempurnakan kinerja untuk aplikasi embedding umum.
Kombinasi sumber yang beragam ini sangat penting untuk model embedding multibahasa yang kuat yang dapat menangani berbagai tugas dan format data.
Apa yang dapat Anda bangun
Gunakan EmbeddingGemma untuk pencarian dan pengambilan, kesamaan semantik, pipeline klasifikasi, dan pengelompokan—terutama ketika Anda membutuhkan embedding berkualitas tinggi yang dapat berjalan pada perangkat dengan keterbatasan.
Referensi
Tersedia sekarang di ShareAI.
Jalankan. Uji. Kirimkan.