基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」

2025-01-23 来源|AI图库吧

AI奇点网5月23日报道丨5月22日,百川智能在北京总部举行了一场媒体沟通会,对外发布了新一代基座大模型——Baichuan 4,并基于该版本的基础大模型,打造了该公司成立之后的首款AI助手应用“百小应”,这是一款类AI搜索的产品。

Baichuan 4相较Baichuan 3在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。

此外,Baichun 4还具备行业领先的多模态能力,在各大评测基准上表现优异,领先Gemini 1.5 Pro、Claude 3-Sonnet等多模态模型。

在Baichuan 4强大能力的基础上,百川智能将搜索技术与大模型深度融合,推出懂搜索、会提问的AI助手“百小应”。

百小应不仅可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力,能更精准地理解用户需求,为用户提供专业、丰富的知识和资源。此外还会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,给出更精准的答案。百小应现在已经在Web端(ying.ai)及移动端各大应用商店同步上线。

Baichuan 4模型能力国内第一,多项能力超国外

作为百川智能发布的最新一代基座大模型,Baichuan 4在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一,相较上一代大模型Baichuan 3提升显著。

不仅如此,与国外主流大模型对比,Baichuan4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。

Baichuan 4能在较短的时间内取得突破,源于其在训练过程中引入了诸多业界领先的技术优化手段。

例如,在预训练阶段采用了基于Model-based+Human-based的协同数据筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对数据的利用;在对齐阶段重点优化了模型Reasoning、Planning、Instruct following能力,通过loss驱动的数据选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。同时突破RLHF和RLAIF融合的RLxF强化学习对齐技术,大幅提升模型的指令遵循等能力。

此外,Baichuan 4还具备行业领先的多模态能力,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上表现优异,大幅领先Gemini Pro、Claude3-sonnet等多模态模型。

推出AI搜索助理应用“百小应”:懂搜索、会提问

“百小应”是百川智能成立之后推出的首款AI应用,在此之前,百川智能一直专注以开源大模型的开发与训练。

百川智能认为,不同于信息时代工具属性的产品,大模型创造的是新物种,让AI从工具变为伙伴。虽然受限于模型能力,当下的AI应用还无法完全做到如同人一样,能够使用工具、会思考、有情感等,但随着模型能力的持续提升,相关应用一定会逐步具备完整能力。

为了让用户能够拥有更优质的智能体验,“百小应”很好地融合了Baichan 4行业领先的通用能力与百川智能前沿的搜索技术,具备多步搜索、智能定向搜索等能力,将百小应打造成一款懂搜索、会提问的AI助手。

多轮搜索指的是针对用户提出的问题,“百小应”逐步解析,深入探究,解锁问题的核心答案。相比单轮搜索,在市场调研、产业分析等复杂场景下,多轮搜索能够有效地获取更专业、更有深度的信息。定向搜索则能让百小应精准定位问题领域,直接访问权威站点,快速、准确的找到相关信息。

在搜索结果呈现方面,“百小应”同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为观点、论据直接应用到问答结果中。与此同时,其结果的结构化也非常优秀,能够将搜索结果以表格等结构化形式呈现,优化信息布局,便于用户快速定位、解读所需信息,可以为行业分析、调研工作提供强大助力。

此外,“百小应”还在搜索结果中增加了来源参考,用户只需点击引用角标即可快速校验搜索结果,十分便捷。

不仅如此,针对一部分用户无法明确表述出自身需求,或者问题过于笼统、抽象的情况,“百小应”还贴心的用提问功能构建了个性化解决方案,“百小应”会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,然后再给出更精准的答案。

除了强大的搜索和提问功能以外,用户还能在“百小应”中上传PDF、Word文档,或者直接输入网页链接,阅读并分析书籍、报告、学术论文等长篇内容,仅用一分钟便能读完上市公司财报。

在Baichuan 4多模态能力的支持下,用户在提问的同时还可以同步上传图片,对图片内容进行解读,或者将图片作为补充材料,获取更精准的回答;并且,它还支持用户通过语音的方式进行交互。

根据百川智能的介绍,“百小应”的命名源自于中国成语“一呼百应”,寓意有温度的人工智能。

打造企业级MaaS+AaaS服务

百川智能认为,企业客户需要的并不是大模型,而是生产力、生产效率的提升,拥有 MaaS+ AaaS(Agent as a service)双重能力,企业才能构建出智能化的最佳方案。

秉持这一理念,百川智能推出了全新的MaaS+AaaS服务。

MaaS版块由基座模型组成,分为旗舰版和专业版。旗舰版将全量开放Baichuan 4的各项能力,Baichuan 4不仅拥有国内第一的中文能力,并且具备行业领先的金融知识和问答能力,在SuperCLUE的金融知识百科能力上Baichuan 3就已取得了A+的最高评级。

专业版包含Baichuan3-Turbo和Baichuan3-Turbo-128K两款模型,在价格方面相比旗舰版Baichuan 4更实惠,且均针对企业用的高频场景进行了针对性优化,综合测试相比GPT-3.5整体效果提升8.9%。百川智能表示,即日起,MaaS 的新用户可以获得1000万免费token。

未来,百川智能还计划推出零代码Agent创建平台产品,让业务人员通过自然语言的方式,也能创建AI Agent,更好地赋能企业智能化发展。

在发布会的最后,百川智能不忘给各位媒体介绍一下自己目前已经获得的客户名录。据称已经服务了数千家客户, 包括完美世界游戏、爱奇艺、 创梦、什么值得买等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据等多家行业生态伙伴,以及华为、曙光等硬件厂商和中国移动、电信、联通等运营商达成了合作,携手构建百川大模型生态。

最新
更多

基准测评国内第一:百川智能发布新一代大模型Baichuan 4,发布旗下首款AI智能搜索助理「百小应」

5月22日,百川智能对外发布了新一代基座大模型——Baichuan 4,打造了该公司成立之后的首款AI助手应用“百小应”,这是一款类AI搜索的产品。

AI大模型发展遇瓶颈:字节百度腾讯阿里讯飞智谱AI等国内头部企业纷纷降价,正式进入API价格“内卷”时代

继百度、腾讯云、阿里云和字节跳动之后,5月22日,科大讯飞发文宣布,讯飞星火大模型API能力正式免费开放。AI大模型产品的同质化也加剧了价格战。

实锤!OpenAI离职员工被要挟不得批评公司否则没收股权,CEO奥特曼火速道歉,自称“非常尴尬的一天”

外媒曝光了OpenAI的离职霸王条款,今天实锤了。一名前员工在网上贴出了离职沟通邮件,全网哗然。根据HR的说法,离职后批评OpenAI将有可能损失一大笔钱。

OpenAI与新闻集团达成战略合作:可直接使用《华尔街日报》《纽约邮报》《泰晤士报》《太阳报》等知名媒体内容

ChatGPT 聊天机器人的回复,将可以直接引用《华尔街日报》《泰晤士报》等知名国际媒体的报道内容。解决了与主流媒体长久以来的内容版权纠纷。

李彦宏:中国AI产业发展与西方国家最大区别的在于应用落地的重视

李彦宏在法国接受采访谈到,中国AI与西方的最大区别在于应用。中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。

谷歌发布3D建模生成大模型「CAT3D」:开局一张图,1分钟构建精美3D建模成像

近日,谷歌在GitHub平台发布了一款3D生成模型「CAT3D」,这次大模型的发布,彰显了3D影像重建领域取得了显著的进展。

网站地图