EmbeddingGemma en ShareAI: 300M Embeddings Multilingües

EmbeddingGemma ahora está en ShareAI
Estamos anunciando que IncrustandoGemma, el modelo compacto de incrustación abierta de Google, ahora está disponible en ShareAI.
Con 300 millones de parámetros, EmbeddingGemma ofrece un rendimiento de última generación para su tamaño. Está construido a partir de Gemma 3 con inicialización T5Gemma y utiliza la misma investigación y tecnología detrás de los modelos Gemini. El modelo produce representaciones vectoriales de texto, lo que lo hace muy adecuado para tareas de búsqueda y recuperación, incluyendo clasificación, agrupamiento, y similitud semántica. Fue entrenado con datos en Más de 100 idiomas hablados.
Por qué importa
El pequeño tamaño del modelo y su enfoque en el dispositivo lo hacen práctico para implementarlo en entornos con recursos limitados—teléfonos móviles, laptops o computadoras de escritorio—democratizando el acceso a modelos de IA de última generación y fomentando la innovación para todos.
Referencia

Conjunto de datos de entrenamiento
EmbeddingGemma fue entrenado con datos en más de 100 idiomas hablados.
- Documentos web
Una colección diversa de texto web asegura exposición a estilos lingüísticos, temas y vocabulario amplios. El conjunto de datos incluye contenido en Más de 100 idiomas. - Código y documentos técnicos
Incluir lenguajes de programación y contenido científico especializado ayuda al modelo a aprender estructuras y patrones que mejoran la comprensión de código y preguntas técnicas. - Datos sintéticos y específicos de tareas
Datos sintéticos seleccionados enseñan habilidades específicas para la recuperación de información, clasificación y análisis de sentimientos, ajustando el rendimiento para aplicaciones comunes de incrustaciones.
Esta combinación de fuentes diversas es crucial para un modelo de incrustación multilingüe potente que pueda manejar una amplia gama de tareas y formatos de datos.
Lo que puedes construir
Usa EmbeddingGemma para búsqueda y recuperación, similitud semántica, flujos de clasificación, y agrupamiento—especialmente cuando necesitas incrustaciones de alta calidad que puedan ejecutarse en dispositivos con limitaciones.
Referencia
Disponible ahora en ShareAI.
Ejecútalo. Pruébalo. Envíalo.