AI数字人的潜力:我认为,这可能是一种很新的未来

2025-04-02 来源|AI图库吧

说起AI数字人,大家应该有所耳闻。之前因为脸书CEO扎克伯格重点押宝元宇宙,而作为大家在元宇宙的化身,数字人引来了一波关注。结果小扎一年烧了100亿美金,最后得出的元宇宙形象是下图的质量,大家顿时炸锅了,画质和2007年的PC游戏一个水准。。。

从那时起,元宇宙的概念基本就破产了……

然而数字人却没有跟随元宇宙沉寂,而是在AI时代,成为了一个非常重要的发展方向。

数字人简介

数字人一般是指具有数字化外形的虚拟人,它和传统的线下机器人不同,数字人依赖于现有的显示设备而存在,比如手机、电脑、电视等。

数字人一般有以下的特点:

①具备人的外形:质量肯定得比小扎的元宇宙形象好,现在的技术能做到跟真人非常类似。

②具备人的一些行为:数字人需要具备人类的一些最基本的能力,比如语言沟通、面部表情、动作等。

③具备一定的人类思维:数字人需要有一定的人类思维能力,不然无法进行简单的交流。

一个最基础的数字人,肯定是需要具备上述能力,才能够有娱乐、商业价值。而AI时代的发展,使上述大家幻想中的要求,逐步变为了现实。

一方面,AI绘画、AI视频、面部肌肉模拟等技术,使得人的外形、表情、动作等,越来越像真人。另一方面,AI大模型的发展,也让数字人的思维能力,有了质的飞跃。

数字人在AI领域的第一个重要出圈的案例,就是今年3月份,有人用AI技术“复活”了自己已经过世的奶奶。通过AI绘画、AI视频技术实现了外形和互动,通过接入大模型并且定向训练了已过世***数据资料,让数字人能够以非常类似作者***身份和思维跟作者进行沟通。

这个案例非常重要,一方面让大家看到了数字人的最新技术,已经真的可以生产出非常逼真的效果,某种意义上能让人永生;另一方面,数字人如此好的效果,也让大家开始关注它在商业上的可能性。

两类数字人

组成一个数字人,一般由五个模块组成,包含:人物形象、语音生成、动画生成、音视频合成、互动交互。这里又以交互模块的差异性,可以将数字人分为两种,即非交互型数字人和交互型数字人。

(图源:2020年虚拟数字人发展白皮书)

非交互型数字人是最简单的数字人类型,将人物形象和语音合成视频即可。这类数字人国内外的产品有很多,还有一款开源项目SadTalker,我之前也分享过制作的整合包,感兴趣的朋友可以出门左拐看看。

(图源:2020年虚拟数字人发展白皮书)

这类数字人制作简单,可以生成一些有趣的短视频内容,然而这类数字人也有一定的缺陷。

一方面,这类数字人生成的速度较慢,生成一条1分钟左右的视频往往需要30分钟以上,如此长的时间就决定了这类数字人不可能拿来直播,因为没有直播间能接受30分钟以上的延时(一个观众问了一个问题,结果30分钟后数字人才能回复,黄花菜都凉了)。

另外,生成的算法是比较低端的,仅仅可以基于图片来生成动嘴视频,肢体和头部都没有更多的交互,效果一般。

交互型数字人才是真正意义上大家理想中的数字人,这种类型的数字人,预先通过AI技术采集和训练真人形象,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。而且,交互型数字人,还能接入AI大模型,自动读取并理解外界输入信息,然后交给大模型来思考和回答并输出文本,之后AI算法再驱动人物模型生成相应的语音与动作来使数字人跟用户互动。

交互型数字人,能做到非常低的延时与观众进行交互,跟平常大家聊天的感觉没差别,而且定制训练的大模型也可以回答出非常专业的问题,并且数字人的肢体动作也非常自然。

(图源:2020年虚拟数字人发展白皮书)

交互型数字人线下采集数据,用于生成逼真的人物模型:可以去线下的场地采集图像素材和声音素材,目前也能做到远程采集视频素材和声音素材,一般只需要几分钟的素材,即可用于训练效果逼真的数字人形象。

生成数字人模型后,就可以应用于各种各样的娱乐&商业场景:

快速持续生成短视频内容,搭建IP建立矩阵流量池。

数字人直播:可以做到7*24小时低成本直播,互动性跟真人主播接近,且通过技术手段防止被封,成本大幅降低,效率大幅提升。

数字人的优势:工资成本低、场地成本低、设备成本低、直播时长长,不会生病也不用交五险一金……

数字人+大模型:交互型数字人,接入了AI大模型,可以针对特定的领域进行训练,比如服装店主,可以将自己店铺的商品信息喂给AI大模型,后续数字人在直播时,可以回答观众提的特定的问题,甚至可以作为智能客服使用。

以下是数字人直播间的一个案例:

上述所描述的交互型数字人产品,是由我多年的好友公司研发的AI产品,如果你对数字人感兴趣,对于AI时代的商业模式感兴趣,欢迎大家扫码联系,也可以私聊我了解细节。

AI人工智能时代已经到来,互联网、移动互联网时代,均产生了很多商业机会,让很多人实现阶层跃升。AI时代这次机会,你还想错过吗?


作者的公众号二维码丨扫一扫,关注我

关注我,不懂技术也可以学习AI。

资深大厂产品经理Glen,鹅厂、字节、华为工作经历。

让一部分人,看见AI并连接。

最新
更多

AI数字人的潜力:我认为,这可能是一种很新的未来

元宇宙的概念基本就破产了……然而数字人却没有跟随元宇宙沉寂,而是在AI时代,成为了一个非常重要的发展方向。

ChatGPT最新更新_ChatGPT更新绘画_跟ChatGPT对话是一种什么体验

最近,ChatGPT又有非常炸裂的更新了 OpenAI发布了他们家的一个AI绘画软件 Dell E3 并且这次的Dell E3要和TrackGPT正式合体了,这一更新可能会颠覆之前所有的AI绘画软件

Getty Images发布AI图像生成器_版权永久+全球使用+商用无限制

全球知名的在线商业图库Getty Images曾经表示不接受人工智能生成的图像。9月25日,Getty Images正式官宣,将与英伟达合作开发一款人工智能图像生成器。

谷歌发布首款AI大模型手机Pixel 8系列丨Photoshop网页版上线,支持多项AI功能丨OPPO推出自研大模型

【AI奇点网2023年10月7日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

Adobe Photoshop网页版_PS网页版官方上线_支持AI生成填充和生成扩展图像

经过近两年的测试后,Adobe公司近日正式上线在线版Photoshop服务。为用户带来了Photoshop 网络服务(PS在线网页版本),现已面向用户全面推出。

微软Windows 12明年发布,将加入AI功能丨谷歌Bard智能聊天机器人将发布手机客户端丨雷军投资百川智能

【AI奇点网2023年10月8日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

网站地图