ShareAI上のEmbeddingGemma: 300M多言語埋め込み

このページは日本語で英語から自動翻訳されました。翻訳が完全に正確でない場合があります。.
EmbeddingGemmaがShareAIで利用可能になりました
私たちは発表します 埋め込みGemma, 、Googleのコンパクトなオープン埋め込みモデルがShareAIで利用可能になりました。.
パラメータ数 3億, のEmbeddingGemmaは、そのサイズで最先端のパフォーマンスを発揮します。それは Gemma 3 と T5Gemma初期化 に基づいて構築され、 ジェミニ モデルの背後にある同じ研究と技術を使用しています。このモデルはテキストのベクトル表現を生成し、検索や取得タスクに適しており、 分類, クラスタリング, 、そして 意味的類似性. それはデータで訓練されました 100以上の話し言葉の言語.
なぜ重要なのか
モデルの小型サイズとデバイス上での焦点は、リソースが限られた環境での展開を実現します—携帯電話、ノートパソコン、またはデスクトップ—最先端のAIモデルへのアクセスを民主化し、すべての人にイノベーションを促進します。.
ベンチマーク

トレーニングデータセット
EmbeddingGemmaは100以上の話し言葉の言語でデータを使用して訓練されました。.
- ウェブドキュメント
多様なウェブテキストのコレクションは、幅広い言語スタイル、トピック、語彙への露出を保証します。データセットには以下が含まれます 100以上の言語. - コードと技術文書
プログラミング言語や専門的な科学コンテンツを含むことで、モデルがコードや技術的な質問の理解を向上させる構造やパターンを学ぶのを助けます。. - 合成およびタスク特化型データ
キュレーションされた合成データは、情報検索、分類、感情分析の特定のスキルを教え、一般的な埋め込みアプリケーションの性能を微調整します。.
この多様なソースの組み合わせは、幅広いタスクとデータ形式に対応できる強力な多言語埋め込みモデルにとって重要です。.
あなたが構築できるもの
EmbeddingGemmaを使用して 検索と取得, 意味的類似性, 分類パイプライン, 、そして クラスタリング—特に制約のあるデバイスで実行可能な高品質な埋め込みが必要な場合に。.
参考文献
現在、ShareAIで利用可能です。.
実行してください。テストしてください。出荷してください。.
この記事は以下のカテゴリの一部です: ニュース
ShareAIでEmbeddingGemmaを試してください
ShareAI Playgroundで300M多言語埋め込みモデルを起動するか、APIを介して検索、類似性、クラスタリングに統合してください。.
関連投稿
ShareAIでEmbeddingGemmaを試してください
ShareAI Playgroundで300M多言語埋め込みモデルを起動するか、APIを介して検索、類似性、クラスタリングに統合してください。.