与OpenAI竞争？Jina AI推出开源8K文本嵌入模型

愤怒的蜗牛

2023-10-28 831阅读 0评论

与OpenAI竞争？Jina AI推出开源8K文本嵌入模型

10月27日消息，外媒报道称，人工智能公司Jina AI日前宣布推出其第二代文本嵌入模型“Jina-embeddings-v2”。这个开源模型支持8K(8192个token)的上下文长度，使其在大规模文本嵌入基准(MTEB)排行榜和功能方面与OpenAI的专有模型text-embedding-ad-002直接竞争。

值得注意的是，jina-embedding-v2在分类平均值、重新排序平均值、检索平均值和汇总平均值方面超过了OpenAI。

jina-embeddings-v2经过深入的研发、数据收集和微调，从头开始精心打造。其结果是一个模型，它代表了与前代模型相比的重大飞跃。

除了技术成就之外，jina-embeddings-v2的8K上下文长度为各种行业应用打开了新的大门，包括法律文件分析、医学研究、文学分析、财务预测和对话人工智能。基准测试表明，这种扩展的上下文使jina-embettings-v2在几个数据集中优于其他领先的基础嵌入模型，突出了较长上下文能力的实际优势。

Jina AI计划发表一篇学术论文，详细介绍“Jina-embeddings-v2”的技术复杂性和基准，开发类似OpenAI的嵌入式API平台，并推出德国-英国模型。

联合国高级别人工智能咨询机构成立，曾毅张凌寒入选专家组成员

相关阅读

ACL 2025 | 基于Token预算感知的大模型高效推理技术

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

被疯传的“恶趣味”：看Copilot这款“熊孩子”把微软工程师逼疯！Agent 刚上线就翻车？网友：微软工程师成了“人肉保姆” 译文

1步碾压250步！何恺明新作祭出MeanFlow，一行公式让 FID 狂降近 70%

奥特曼：Codex 让我感到 AGI！最新谈话罕见透露下一代“完美模型”，大胆预测 Agent 明年突破边界！

OpenAI深夜宣布ChatGPT支持MCP、会议记录，万物互联时代来了！

使用Claude 4提升程序员生产力的五种高级方式译文

AI+数字经济的核心三要素

您需要登录账户后才能发表评论

发表评论取消回复

评论列表（暂无评论，831人围观）

还没有评论，来说两句吧...

目录[+]

微信二维码

微信二维码

支付宝二维码