最近,阿里巴巴在AI领域的动作频频!6月6日,阿里正式开源了千问3向量模型系列——Qwen3-Embedding。这款基于千问3底座的全新模型,专为文本表征、检索和排序任务优化,堪称AI界的“利器”。

相比前代,Qwen3-Embedding在核心任务上的性能提升了40%以上!这意味着它不仅技术上更强大,在MTEB等权威榜单中也一举超越谷歌Gemini Embedding、OpenAI的text-embedding-3-large以及微软的multilingual-e5-large-instruct等顶尖模型,成功登顶同类最佳(SOTA)。

图源备注:图片由AI生成

简单来说,向量模型就像AI的“翻译官”,能将文本、图片等非结构化数据转化为机器可理解的向量形式,从而实现高效分类、检索和排序。通义团队通过对比训练、SFT和模型融合等多种技术手段,打造了这一新型向量模型,包括Qwen3-Embedding(文本嵌入)和Qwen3-Reranker(文本排序)两大模块。

值得一提的是,千问3向量模型支持超过100种语言,甚至涵盖多种编程语言,展现出强大的多语言、跨语言及代码检索能力。这对全球开发者来说无疑是一个福音。

此次开源的千问3向量模型共有9款,覆盖不同尺寸(如0.6B、4B、8B等),还提供GGUF版本。开发者可以根据需求自由选择、组合模块,甚至自定义向量或指令,满足特定任务和场景的需求。

目前,Qwen3-Embedding和Reranker模型已在魔搭社区、Hugging Face和GitHub等多个平台上线,开发者还能通过阿里云百炼直接调用API服务。自4月29日开源以来,千问3大模型已多次在国际榜单中夺冠,成为开源领域的明星项目。