ShareAI वरील EmbeddingGemma: 300M बहुभाषिक एम्बेडिंग्ज

EmbeddingGemma आता ShareAI वर आहे
आम्ही जाहीर करत आहोत की एम्बेडिंगजेम्मा, Google चे कॉम्पॅक्ट ओपन एम्बेडिंग मॉडेल, आता ShareAI वर उपलब्ध आहे.
येथे 300 दशलक्ष पॅरामीटर्स, EmbeddingGemma त्याच्या आकारासाठी अत्याधुनिक कार्यक्षमता प्रदान करते. हे जेम्मा 3 सह T5Gemma प्रारंभिकरण आणि यामागील समान संशोधन आणि तंत्रज्ञानाचा वापर करते जेमिनी मॉडेल्स. हे मॉडेल मजकुराचे व्हेक्टर प्रतिनिधित्व तयार करते, ज्यामुळे ते शोध आणि पुनर्प्राप्ती कार्यांसाठी, यासह चांगले अनुकूल आहे वर्गीकरण, क्लस्टरिंग, आणि सिमॅंटिक साम्य. हे डेटा सह प्रशिक्षित केले गेले होते 100+ बोलल्या जाणाऱ्या भाषा.
का महत्त्वाचे आहे
मॉडेलचा लहान आकार आणि ऑन-डिव्हाइस फोकस मर्यादित संसाधनांसह वातावरणात तैनात करणे व्यावहारिक बनवते—मोबाइल फोन, लॅपटॉप, किंवा डेस्कटॉप—राज्य-ऑफ-द-आर्ट AI मॉडेल्ससाठी प्रवेश लोकशाहीकरण आणि सर्वांसाठी नवकल्पना वाढवणे.
बेंचमार्क

प्रशिक्षण डेटासेट
EmbeddingGemma 100+ बोलल्या जाणाऱ्या भाषांमध्ये डेटा सह प्रशिक्षित केले गेले होते.
- वेब दस्तऐवज
वेब मजकुराचा विविध संग्रह विस्तृत भाषिक शैली, विषय, आणि शब्दसंग्रहाचा अनुभव सुनिश्चित करतो. डेटासेटमध्ये सामग्री समाविष्ट आहे 100+ भाषा. - कोड आणि तांत्रिक दस्तऐवज
प्रोग्रामिंग भाषा आणि विशेष वैज्ञानिक सामग्री समाविष्ट करणे मॉडेलला कोड आणि तांत्रिक प्रश्नांची समज सुधारण्यासाठी रचना आणि नमुने शिकण्यास मदत करते. - सिंथेटिक आणि कार्य-विशिष्ट डेटा
माहिती पुनर्प्राप्ती, वर्गीकरण, आणि भावना विश्लेषणासाठी विशिष्ट कौशल्ये शिकवण्यासाठी तयार केलेला सिंथेटिक डेटा, सामान्य एम्बेडिंग अनुप्रयोगांसाठी कार्यक्षमता सुधारतो.
विविध स्रोतांचे हे संयोजन शक्तिशाली बहुभाषिक एम्बेडिंग मॉडेलसाठी महत्त्वाचे आहे जे विविध कार्ये आणि डेटा स्वरूप हाताळू शकते.
तुम्ही काय तयार करू शकता
EmbeddingGemma वापरा शोध आणि पुनर्प्राप्ती, सिमॅंटिक साम्य, वर्गीकरण पाइपलाइन, आणि क्लस्टरिंग—विशेषतः जेव्हा तुम्हाला उच्च-गुणवत्तेची एम्बेडिंग्स आवश्यक असतात जी मर्यादित उपकरणांवर चालवता येतात.
संदर्भ
आता ShareAI वर उपलब्ध.
ते चालवा. चाचणी करा. पाठवा.