合合信息Embedding模型荣登C-MTEB榜单榜首

科技 2024-03-29 17:09 阅读:13

合合信息最新发布的文本向量化模型acge_text_embedding在C-MTEB榜单中夺得第一,成为业内瞩目的焦点。这一成果将有助于大模型更快速地在各行各业中产生应用价值,为信息处理领域带来新的突破。

MTEB(Massive Text Embedding Benchmark)是业内评测文本向量模型性能的重要参考,而C-MTEB则是专门针对中文文本向量的评测基准,被公认为最权威的中文语义向量评测基准之一。合合信息的acge模型在这一榜单中脱颖而出,展现出其在文本向量化领域的领先地位。

Embedding模型的重要性不言而喻,它能将高维的离散数据转换为低维的连续向量,捕捉数据的语义特征和关系,被广泛应用于搜索、推荐、问答等领域。在信息量急剧膨胀的互联网时代,Embedding模型的应用更显得重要,能够提高信息搜索和问答的质量、效率和准确性,让搜索引擎真正理解用户意图。

合合信息的acge模型相比于其他开源模型更小巧、资源占用更少,且支持可变输出维度,为企业提供更灵活的应用选择。团队成员介绍,acge模型不仅支持构建通用分类模型,还能提升长文档信息抽取的精度,应用成本相对较低,为大模型在多个行业中创造价值提供了强有力的技术支持。

合合信息作为一家人工智能及大数据科技企业,凭借自主研发的智能文字识别及商业大数据核心技术,为全球用户和企业客户提供数字化、智能化的产品和服务。公司的C端产品覆盖了全球亿级用户,B端服务涵盖了近30个行业的企业客户。在2022年《财富》杂志发布的世界500强公司名单中,合合信息的客户已超过125家,展现出其在行业中的强大影响力。