EmbeddingGemma บน ShareAI: 300M การฝังหลายภาษา

EmbeddingGemma พร้อมใช้งานบน ShareAI แล้ว
เราขอประกาศว่า การฝังตัวเจมม่า, โมเดล embedding แบบกะทัดรัดของ Google, พร้อมใช้งานบน ShareAI แล้ว.
ที่ 300 ล้านพารามิเตอร์, EmbeddingGemma มอบประสิทธิภาพระดับแนวหน้าสำหรับขนาดของมัน ถูกสร้างขึ้นจาก เจมม่า 3 ด้วย การเริ่มต้น T5Gemma และใช้การวิจัยและเทคโนโลยีเดียวกันที่อยู่เบื้องหลัง โมเดล Gemini โมเดลนี้สร้างการแสดงผลแบบเวกเตอร์ของข้อความ ทำให้เหมาะสมสำหรับงานค้นหาและดึงข้อมูล รวมถึง การจัดประเภท, การจัดกลุ่ม, และ ความคล้ายคลึงเชิงความหมาย. ได้รับการฝึกด้วยข้อมูลใน มากกว่า 100 ภาษา.
ทำไมถึงสำคัญ
ขนาดเล็กของโมเดลและการเน้นใช้งานบนอุปกรณ์ทำให้สามารถใช้งานได้ในสภาพแวดล้อมที่มีทรัพยากรจำกัด—โทรศัพท์มือถือ, แล็ปท็อป, หรือเดสก์ท็อป—ทำให้การเข้าถึงโมเดล AI ที่ทันสมัยเป็นไปอย่างทั่วถึงและส่งเสริมการสร้างสรรค์สำหรับทุกคน.
การวัดผล

ชุดข้อมูลการฝึก
EmbeddingGemma ได้รับการฝึกด้วยข้อมูลในมากกว่า 100 ภาษา.
- เอกสารบนเว็บ
การรวบรวมข้อความบนเว็บที่หลากหลายช่วยให้สัมผัสกับรูปแบบภาษา หัวข้อ และคำศัพท์ที่กว้างขวาง ชุดข้อมูลรวมถึงเนื้อหาใน มากกว่า 100 ภาษา. - โค้ดและเอกสารทางเทคนิค
การรวมภาษาโปรแกรมและเนื้อหาวิทยาศาสตร์เฉพาะทางช่วยให้โมเดลเรียนรู้โครงสร้างและรูปแบบที่ช่วยเพิ่มความเข้าใจในโค้ดและคำถามทางเทคนิค. - ข้อมูลสังเคราะห์และข้อมูลเฉพาะงาน
ข้อมูลสังเคราะห์ที่คัดสรรมาอย่างดีช่วยสอนทักษะเฉพาะสำหรับการดึงข้อมูล การจัดประเภท และการวิเคราะห์ความรู้สึก ปรับปรุงประสิทธิภาพสำหรับการใช้งานฝังตัวทั่วไป.
การผสมผสานแหล่งข้อมูลที่หลากหลายนี้มีความสำคัญสำหรับโมเดลฝังตัวหลายภาษาที่ทรงพลังซึ่งสามารถจัดการงานและรูปแบบข้อมูลที่หลากหลายได้.
สิ่งที่คุณสามารถสร้างได้
ใช้ EmbeddingGemma สำหรับ การค้นหาและการดึงข้อมูล, ความคล้ายคลึงเชิงความหมาย, กระบวนการจัดประเภท, และ การจัดกลุ่ม—โดยเฉพาะเมื่อคุณต้องการการฝังตัวคุณภาพสูงที่สามารถทำงานบนอุปกรณ์ที่มีข้อจำกัด.
อ้างอิง
พร้อมใช้งานแล้วบน ShareAI.
เรียกใช้ ทดสอบ ส่งมอบ.