在ShareAI上的EmbeddingGemma:3亿多语言嵌入

此页面中的 简体中文 是使用 TranslateGemma 从英文自动翻译的。翻译可能不完全准确。.
EmbeddingGemma 现已上线 ShareAI
我们宣布 嵌入式Gemma, ,Google 的紧凑型开放嵌入模型,现已在 ShareAI 上可用。.
在 3 亿参数, 的情况下,EmbeddingGemma 在其规模内提供了最先进的性能。它基于 Gemma 3 与 T5Gemma 初始化 并使用了 双子座 模型背后的相同研究和技术。该模型生成文本的向量表示,使其非常适合搜索和检索任务,包括 分类, 聚类, ,并且 语义相似性. 它使用的数据进行训练 100+ 种口语语言.
为什么重要
该模型的小尺寸和设备上的专注使其在资源有限的环境中部署变得实用——手机、笔记本电脑或台式机——使最先进的AI模型的访问民主化,并促进每个人的创新。.
基准

训练数据集
EmbeddingGemma 使用 100+ 种口语语言的数据进行训练。.
- 网络文档
多样化的网络文本集合确保了对广泛语言风格、主题和词汇的接触。数据集包括内容在 100+ 种语言中. - 代码和技术文档
包括编程语言和专业科学内容有助于模型学习结构和模式,从而提高对代码和技术问题的理解。. - 合成和任务特定数据
精心制作的合成数据教授信息检索、分类和情感分析的特定技能,为常见的嵌入应用微调性能。.
这种多样化来源的结合对于一个强大的多语言嵌入模型至关重要,该模型可以处理广泛的任务和数据格式。.
您可以构建的内容
使用 EmbeddingGemma 进行 搜索和检索, 语义相似性, 分类流程, ,并且 聚类——特别是在您需要能够在受限设备上运行的高质量嵌入时。.
参考
现在可在 ShareAI 上使用。.
运行它。测试它。发布它。.
本文属于以下类别: 新闻
在 ShareAI 上试用 EmbeddingGemma
在 ShareAI Playground 中启动 300M 多语言嵌入模型,或通过 API 集成用于搜索、相似性和聚类。.
相关文章
在 ShareAI 上试用 EmbeddingGemma
在 ShareAI Playground 中启动 300M 多语言嵌入模型,或通过 API 集成用于搜索、相似性和聚类。.