首页 家电维修 实时讯息 生活常识 百科知识 范文大全 经典语录

谷歌Gemini Embedding登顶MTEB,问鼎最强文本嵌入AI模型

0次浏览     发布时间:2025-03-10 09:30:00    

IT之家 3 月 10 日消息,谷歌公司于 3 月 7 日发布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本处理模型,现已集成至 Gemini API。

该模型在 Massive Text Embedding Benchmark(MTEB)中拔得头筹,超越了 Mistral、Cohere 和 Qwen 等竞争对手,成为当前性能最强的文本嵌入模型。

在构建 AI 知识库中,嵌入式 AI 模型是必不可少的一环。IT之家简要介绍如下,嵌入式模型 AI(Embedded Artificial Intelligence,简称 EAI)是指将人工智能技术嵌入到硬件设备中,让其不依赖于云端计算,能够在本地进行数据处理和推理。

Gemini Embedding 将文本转换为数值表示(向量),从而支持语义搜索、推荐系统和文档检索等功能。它在 MTEB 基准测试中表现出色,平均任务得分为 68.32,显著高于 Linq-Embed-Mistral 和 gte-Qwen2-7B-instruct 等模型,达到 State-of-the-art。

State-of-the-art(SOTA)AI 模型是指在特定任务或领域中,当前表现最优的模型或方法。这些模型通常通过在各种基准测试中取得最高分来证明其优越性,并且往往在准确性、效率或能力上超越了之前的模型,甚至在某些任务中达到了人类水平的表现。

该模型在配对分类上得分为 85.13;在检索上得分 67.71,在重排序得分为 65.58,表明 Gemini Embedding 在 AI 搜索引擎、文档分析和聊天机器人优化等实际应用中具有显著优势。

MTEB 由 Hugging Face 创建,通过 50 多个数据集评估 AI 模型在文本数据排名、分类和检索方面的能力。作为行业标准,MTEB 排行榜为企业在选择 AI 模型时提供了重要参考。Gemini Embedding 的优异表现不仅巩固了谷歌在 AI 领域的领导地位,也为其在商业应用中的推广奠定了基础。

Gemini Embedding 的高性能使其在以下领域具有广泛的应用前景:

  • 搜索引擎:提升搜索结果的相关性,支持谷歌正在测试的纯 AI 驱动搜索模式。

  • 多语言应用:增强跨语言翻译、客户服务自动化和内容排名能力。

  • 企业服务:优化基于 Google Cloud 的 AI 分析、语义搜索和自动化数据检索功能。

相关文章:

可可西里库赛湖连通5G信号,2个月建成无人区基站04-28

环湖赏花 逛集市 住高端民宿酒店 阳宗海文旅业态正在蝶变04-27

兴宁市黄槐镇与联通公司达成全面合作,共推“百千万工程”再上新台阶04-27

专家为湖南中小企业应对专利风险支招04-27

生态环境法典草案亮相04-27

宁波建工:2024 年成果斐然 迈向新征程04-25

晨会观点速递:宁德时代快充、钠电等新品发布,打开负极材料新空间04-22

吉林省公布焊接与热切割动火作业六条禁令04-21