EmbeddingGemma на ShareAI: 300M многоязычных встраиваний

EmbeddingGemma теперь на ShareAI
Мы объявляем, что ВстраиваниеGemma, компактная открытая модель эмбеддинга от Google, теперь доступна на ShareAI.
При 300 миллионах параметров, EmbeddingGemma обеспечивает передовую производительность для своего размера. Она создана на основе Gemma 3 с и инициализации T5Gemma и использует те же исследования и технологии, что и модели Gemini. Модель создает векторные представления текста, что делает её подходящей для задач поиска и извлечения, включая классификацию, кластеризацию, и семантическое сходство. Он был обучен на данных в 100+ разговорных языков.
Почему это важно
Небольшой размер модели и ориентация на устройство делают её практичной для использования в средах с ограниченными ресурсами—мобильные телефоны, ноутбуки или настольные компьютеры—демократизируя доступ к передовым моделям ИИ и способствуя инновациям для всех.
Эталон

Обучающий набор данных
EmbeddingGemma был обучен на данных в 100+ разговорных языков.
- Веб-документы
Разнообразная коллекция веб-текста обеспечивает знакомство с широким спектром языковых стилей, тем и словарного запаса. Набор данных включает контент на 100+ языков. - Код и технические документы
Включение языков программирования и специализированного научного контента помогает модели изучать структуру и шаблоны, которые улучшают понимание кода и технических вопросов. - Синтетические и специфичные для задач данные
Курированные синтетические данные обучают конкретным навыкам для поиска информации, классификации и анализа настроений, оптимизируя производительность для общих приложений с использованием эмбеддингов.
Это сочетание разнообразных источников имеет решающее значение для мощной многоязычной модели эмбеддингов, способной справляться с широким спектром задач и форматов данных.
Что вы можете создать
Используйте EmbeddingGemma для поиска и извлечения, семантическое сходство, классификационных конвейеров, и кластеризацию—особенно когда вам нужны высококачественные эмбеддинги, которые могут работать на ограниченных устройствах.
Справка
Доступно сейчас на ShareAI.
Запустите. Проверьте. Отправьте.