百度文心大模型4.0训练最新内幕_万卡集群”开启万亿参数级训练_对标GPT-4

2025-04-02 来源|AI图库吧

AI奇点网10月9日报道丨AI奇点网获悉,百度公司正在加紧训练旗下的AI大模型——文心大模型4.0,很可能会在10月17日举办的百度世界大会上发布。而最新的情报显示,文心大模型 4.0 正在加紧训练,已经接近可发布状态。

今天,更多关于文心大模型4.0的内幕被曝光,涉及了底层架构、基础设施、训练数据集、成本等关键信息。

先总结一下核心的讯息点:

文心大模型 4.0 实际上已经在小规模灰度测试文心大模型 4.0 的参数量大于所有已对外公布参数信息的LLM大模型(不包括GPT-4),也是国内首次使用万卡集群训练的大模型推理成本相比文心大模型 3.5 增加很多,据传成本增长了 8-10 倍

文心大模型 4.0 的参数规模要大于目前所有公开发布参数的 LLM,这意味着文心大模型 4.0 的参数规模有望突破万亿级别。

如果要比较的话,对比GPT-4被曝光,训练参数量可能在 1.8 万亿左右,文心大模型 4.0 仍然是一个单一体系的大模型,并没有采用类似 ChatGPT 和很多其他大语言模型目前正在应用的所谓”混合专家模型(MoE)”。

这么大参数量的模型,对算力要求注定不会小。现在的消息是,文心 4.0 是在万卡 AI 集群上训练出来的,可能是——超万张GPU集群训练,创建史上最大的LLM参数大模型。应该也算上是国内首次使用万卡规模集群进行训练的大语言模型。

所谓的“万卡集群”,国内目前只有华为、阿里能够实现。据分析称,正是因为百度飞桨的深度联合,才能基于“万卡集群”训练出如此巨大规模的LLM大模型。

最后,根据内部员工的说法,百度实际上已经开始秘密小流量测试文心大模型4.0。有小部分的文心一言用户其实正在使用的就是最新的4.0版本模型。

如无意外的话,文心大模型4.0最快将在10月17日下周的百度世界大会上正式公布。让我们拭目以待,看看能否与目前的行业标杆GPT-4背水一战?

最新
更多

百度文心大模型4.0训练最新内幕_万卡集群”开启万亿参数级训练_对标GPT-4

文心大模型 4 0 正在加紧训练,已经接近可发布状态。今天,更多关于文心大模型4 0的内幕被曝光,涉及了底层架构、基础设施、训练数据集、成本等关键信息。

百度李彦宏提出18条AI创业的基本方法论,AI产业创业者必看!

大模型时代已来,未来AI的产业机会在哪?AI原生应用究竟长什么样?基础模型与Killer Apps如何共融共生?垂类模型与基础模型是互为竞争关系吗?

美图发布视觉大模型Miracle Vision3.0丨华为“小艺”将支持通话语音转文本丨视觉中国与华为研发视觉大模型

【AI奇点网2023年10月10日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

美图发布MiracleVision 3.0自研视觉大模型,赋能电商广告游戏动漫影视

美图公司15周年生日会现场,美图公司创始人、董事长兼首席执行官吴欣鸿发布了自研AI视觉大模型MiracleVision3 0版本。并将助力电商、广告、游戏、动漫、影视五大行业。

美图绘画大模型升级3.0:AI技能点拉爆,APP一站解锁地表最全装逼玩法

美图自研大模型3 0 正式发布!并且全面应用于美图旗下影像与设计产品。小白AI修图神器最强担当,美图这波升级,爽飞了!

谷歌Pixel 8手机将迎来多项AI新功能丨上海AI实验室开源多模态创作大模型丨ChatGPT全球流量高居第一

【AI奇点网2023年10月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

网站地图