جاسازی Gemma در ShareAI: 300M جاسازی چندزبانه

EmbeddingGemma اکنون در ShareAI موجود است
ما اعلام میکنیم که جاسازیGemma, ، مدل فشرده و باز تعبیه گوگل، اکنون در ShareAI در دسترس است.
با 300 میلیون پارامتر, ، EmbeddingGemma عملکرد پیشرفتهای را برای اندازه خود ارائه میدهد. این مدل از Gemma 3 با مقداردهی اولیه T5Gemma ساخته شده و از همان تحقیقات و فناوری پشت جِمینی مدلها استفاده میکند. این مدل نمایشهای برداری از متن تولید میکند که آن را برای وظایف جستجو و بازیابی، از جمله طبقهبندی, خوشهبندی, ، و شباهت معنایی. با دادههایی آموزش دیده است که در بیش از 100 زبان گفتاری.
چرا این مهم است
اندازه کوچک مدل و تمرکز بر روی دستگاه آن را برای استفاده در محیطهایی با منابع محدود عملی میکند—تلفنهای همراه، لپتاپها یا دسکتاپها—دموکراتیزه کردن دسترسی به مدلهای پیشرفته هوش مصنوعی و تقویت نوآوری برای همه.
معیار

مجموعه داده آموزشی
EmbeddingGemma با دادههایی در بیش از 100 زبان گفتاری آموزش دیده است.
- اسناد وب
مجموعهای متنوع از متنهای وب تضمین میکند که مدل با سبکهای زبانی، موضوعات و واژگان گستردهای آشنا شود. مجموعه داده شامل محتوایی در بیش از 100 زبان. - کد و اسناد فنی
شامل زبانهای برنامهنویسی و محتوای علمی تخصصی به مدل کمک میکند تا ساختارها و الگوهایی را یاد بگیرد که درک کد و سوالات فنی را بهبود میبخشد. - دادههای مصنوعی و خاص وظیفه
دادههای مصنوعی انتخابشده مهارتهای خاصی را برای بازیابی اطلاعات، طبقهبندی و تحلیل احساسات آموزش میدهد و عملکرد را برای کاربردهای رایج تعبیه بهینه میکند.
این ترکیب از منابع متنوع برای یک مدل تعبیه چندزبانه قدرتمند که میتواند طیف گستردهای از وظایف و فرمتهای داده را مدیریت کند، حیاتی است.
آنچه میتوانید بسازید
از EmbeddingGemma استفاده کنید برای جستجو و بازیابی, شباهت معنایی, خطوط لوله طبقهبندی, ، و خوشهبندی—بهویژه زمانی که به تعبیههای باکیفیت نیاز دارید که بتوانند روی دستگاههای محدود اجرا شوند.
مرجع
اکنون در ShareAI موجود است.
آن را اجرا کنید. آزمایش کنید. ارسال کنید.