Jina AI開源第二代文字嵌入模型,整體表現接近OpenAI同級模型
· 2023-10-27

Jina AI最新第二代文字嵌入模型jina-embeddings-v2,已可處理多達8,192個token,在多項自然語言處理任務中,表現已超越OpenAI同級模型text-embedding-ada-002

德國人工智慧新創Jina AI開源了該公司的第二代文字嵌入模型jina-embeddings-v2,新模型現在可以處理多達8,192個token上下文長度。以大規模文字嵌入基準(Massive Text Embedding Benchmark)評估jina-embeddings-v2的能力,整體來說已非常接近同等級模型OpenAI text-embedding-ada-002的表現。

jina-embeddings-v2是完全由Jina AI開發團隊研發、收集資料集和調校的新模型,能力較前一版本大幅提升,其最重要的進步,便是能夠處理8,192個token上下文長度。可以處理更長的上下文,也就代表模型可以應用的領域更為廣泛,像是可以分析法律文件,更細緻地捕捉法律文件中的細節,或是從財務報表中解析關鍵資訊,進行財務預測,也能夠用於開發對話機器,以應對複雜的用戶查詢。

在大規模文字嵌入基準的排名中,開源的jina-embeddings-v2排名第17,與商用的OpenAI text-embedding-ada-002的15名相去不遠,而且在分類、重新排序、檢索和摘要生成等自然語言處理任務,jina-embeddings-v2的表現已經超越text-embedding-ada-002。

目前用戶可以從Huggingface免費下載jina-embeddings-v2模型,官方釋出兩個模型版本,第一個是針對學術研究或是商業分析等高準確性需求任務設計,大小為0.27 GB的基礎模型,另一個則是適用於輕量級應用程式,能夠整合行動應用程式或是供運算資源資源有限的裝置使用的小型模型,容量只有0.07 GB。

Jina AI持續擴展jina-embeddings-v2模型,正著手開發API平臺,供用戶能夠根據需求簡單擴展使用規模,同時Jina AI也將擴增jina-embeddings-v2的能力,支援更多的語言。

热门文章
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
英国确认各垂直行业的赌博税税率
游戏风向
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
BETFAIR 网络攻击80万用户资料泄露
游戏风向
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
首页
游戏
合作
发现
我的