تضمين Gemma على ShareAI: 300M تضمينات متعددة اللغات

EmbeddingGemma متاح الآن على ShareAI
نحن نعلن أن تضمينGemma, ، نموذج التضمين المضغوط من Google، متاح الآن على ShareAI.
عند 300 مليون معلمة, ، يقدم EmbeddingGemma أداءً متقدمًا بالنسبة لحجمه. تم بناؤه من Gemma 3 مع تهيئة T5Gemma ويستخدم نفس البحث والتكنولوجيا وراء نماذج Gemini . ينتج النموذج تمثيلات متجهة للنص، مما يجعله مناسبًا لمهام البحث والاسترجاع، بما في ذلك التصنيف, التجميع, ، و التشابه الدلالي. تم تدريبه باستخدام بيانات في أكثر من 100 لغة منطوقة.
لماذا يهم
الحجم الصغير للنموذج والتركيز على الجهاز يجعله عمليًا للنشر في بيئات ذات موارد محدودة—الهواتف المحمولة، أجهزة الكمبيوتر المحمولة، أو أجهزة الكمبيوتر المكتبية—مما يتيح الوصول إلى نماذج الذكاء الاصطناعي المتقدمة ويعزز الابتكار للجميع.
معيار

مجموعة بيانات التدريب
تم تدريب EmbeddingGemma باستخدام بيانات في أكثر من 100 لغة منطوقة.
- وثائق الويب
تضمن مجموعة متنوعة من نصوص الويب التعرض لأنماط لغوية واسعة، ومواضيع، ومفردات. تتضمن مجموعة البيانات محتوى في أكثر من 100 لغة. - الأكواد والوثائق التقنية
تضمين لغات البرمجة والمحتوى العلمي المتخصص يساعد النموذج على تعلم الهيكل والأنماط التي تحسن فهم الأكواد والأسئلة التقنية. - بيانات اصطناعية ومحددة المهام
البيانات الاصطناعية المنتقاة تعلم مهارات محددة لاسترجاع المعلومات، التصنيف، وتحليل المشاعر، وتحسين الأداء لتطبيقات التضمين الشائعة.
هذا الجمع بين المصادر المتنوعة ضروري لنموذج تضمين متعدد اللغات قوي يمكنه التعامل مع مجموعة واسعة من المهام وصيغ البيانات.
ما يمكنك بناؤه
استخدم EmbeddingGemma لـ البحث والاسترجاع, التشابه الدلالي, خطوط أنابيب التصنيف, ، و التجميع—خاصة عندما تحتاج إلى تضمينات عالية الجودة يمكن تشغيلها على الأجهزة المحدودة.
المرجع
متوفر الآن على ShareAI.
قم بتشغيله. اختبره. أرسله.