AI奇点网2024年3月20日报道丨AI资讯早报
当地时间3月19日报道,OpenAI CEO奥特曼本周作客科技博主Lex Fridman 的访谈中表示,一年前上线的GPT-4 其实“有点糟糕(kind sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。
当被问及 GPT-4 及其最令人印象深刻的能力时,他说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT-4 的成就,也不想夸大其词,”奥特曼说,“正因我们正处于指数级发展的曲线上,所以很快我们就会像现在看待 GPT-3 一样看待 GPT-4。”
奥特曼还认为,GPT-4的确存在“令人惊鸿一瞥的闪光点”,但他指出,ChatGPT 在处理复杂的多步骤问题时几乎没什么用处。令他感到”神奇“的情况少之又少。
知名开源大模型公司Stability AI又上新了!当地时间3月18日,该公司网站发布用于渲染3D视频的生成式AI视频工具Stable Video 3D(SV3D)。
据了解,Stability AI一直在开发其Stable Video技术的视频功能,使用户能够从图像或文本提示生成短视频。SV3D在Stability AI之前的Stable Video Diffusion模型的基础上进行了改进,适用于新视角合成任务(Novel View Synthesis) 和3D生成的任务。
通过SV3D,Stability AI通过能够根据单一输入图像创建和转换多视图3D网格,为其视频生成模型增加了新的深度。
在去年12月,Stability AI曾经推出Stable Zero123三维建模模型,该模型基于Stable Diffusion开发,并且一次输出一张图像。SV3D基于Stable Video Diffusion模型,并且同时输出多个新视角,而这也是SV3D的关键优势。根据Stability AI的说法,SV3D能够从任何给定角度提供连贯的视角。
SV3D现已可供商业使用,订阅Stability AI Professional的会员每月20美元(对于年收入不到100万美元的创作者和开发者)。该模型最低的显卡运行要求为英伟达GeForce RTX 4090及以上。
近日,谷歌在其 GitHub 页面发布博文介绍一款名为 VLOGGER AI 的新模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
项目主页:
https://enriccorona.github.io/vlogger/
上一篇:谷歌发布首个多模态视频生成模型VLOGGER AI:让静态人物肖像图像开口“说话”
【AI奇点网2024年3月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
近日,谷歌一款名为 VLOGGER AI 的新模型上线,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
【AI奇点网2024年3月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
3月21日,开发平台dora宣布,首个生成式AI网站开发平台dora AI,结束候补内测全面开启公测。
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
3月19日,微软CEO纳德拉宣布,AI创企Inflection AI的联合创始人兼CEO穆斯塔法·苏莱曼(Mustafa Suleyman)已加入微软公司,领导Microsoft AI的新团队
AI开搭
星河易创AI
Flowith
思乎AI助理
ChatArt Pro
Siuuu.Ai
Anime gf
畅问AI
灵办Ai
网站地图
奥特曼认为GPT-4“有点糟糕”丨Stability AI推出3D渲染视频模型Stable Video 3D丨谷歌推出多模态视频模型VLOGGER
AI奇点网2024年3月20日报道丨AI资讯早报
奥特曼评价GPT-4:“有点糟糕”
当地时间3月19日报道,OpenAI CEO奥特曼本周作客科技博主Lex Fridman 的访谈中表示,一年前上线的GPT-4 其实“有点糟糕(kind sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。
当被问及 GPT-4 及其最令人印象深刻的能力时,他说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT-4 的成就,也不想夸大其词,”奥特曼说,“正因我们正处于指数级发展的曲线上,所以很快我们就会像现在看待 GPT-3 一样看待 GPT-4。”
奥特曼还认为,GPT-4的确存在“令人惊鸿一瞥的闪光点”,但他指出,ChatGPT 在处理复杂的多步骤问题时几乎没什么用处。令他感到”神奇“的情况少之又少。
Stability AI推出3D渲染视频模型Stable Video 3D
知名开源大模型公司Stability AI又上新了!当地时间3月18日,该公司网站发布用于渲染3D视频的生成式AI视频工具Stable Video 3D(SV3D)。
据了解,Stability AI一直在开发其Stable Video技术的视频功能,使用户能够从图像或文本提示生成短视频。SV3D在Stability AI之前的Stable Video Diffusion模型的基础上进行了改进,适用于新视角合成任务(Novel View Synthesis) 和3D生成的任务。
通过SV3D,Stability AI通过能够根据单一输入图像创建和转换多视图3D网格,为其视频生成模型增加了新的深度。
在去年12月,Stability AI曾经推出Stable Zero123三维建模模型,该模型基于Stable Diffusion开发,并且一次输出一张图像。SV3D基于Stable Video Diffusion模型,并且同时输出多个新视角,而这也是SV3D的关键优势。根据Stability AI的说法,SV3D能够从任何给定角度提供连贯的视角。
SV3D现已可供商业使用,订阅Stability AI Professional的会员每月20美元(对于年收入不到100万美元的创作者和开发者)。该模型最低的显卡运行要求为英伟达GeForce RTX 4090及以上。
谷歌推出多模态视频模型VLOGGER AI:让人物肖像会“说话”
近日,谷歌在其 GitHub 页面发布博文介绍一款名为 VLOGGER AI 的新模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
项目主页:
https://enriccorona.github.io/vlogger/
上一篇:谷歌发布首个多模态视频生成模型VLOGGER AI:让静态人物肖像图像开口“说话”
奥特曼认为GPT-4“有点糟糕”丨Stability AI推出3D渲染视频模型Stable Video 3D丨谷歌推出多模态视频模型VLOGGER
【AI奇点网2024年3月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
谷歌发布首个多模态视频生成模型VLOGGER AI:让静态人物肖像图像开口“说话”
近日,谷歌一款名为 VLOGGER AI 的新模型上线,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
库克今年首次访华,国内首谈生成式AI丨微软收购OpenAI竞争对手Inflection AI丨黄仁勋回应中国算力芯片出货问题
【AI奇点网2024年3月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
只用文本,3分钟生成一个网站!首个ChatGPT版网站开发平台dora AI发布
3月21日,开发平台dora宣布,首个生成式AI网站开发平台dora AI,结束候补内测全面开启公测。
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
太暴力了!微软成立Microsoft AI团队,将OpenAI竞争对手、AI创业公司Inflection AI研发团队纳入麾下
3月19日,微软CEO纳德拉宣布,AI创企Inflection AI的联合创始人兼CEO穆斯塔法·苏莱曼(Mustafa Suleyman)已加入微软公司,领导Microsoft AI的新团队
AI开搭
星河易创AI
Flowith
思乎AI助理
ChatArt Pro
Siuuu.Ai
Anime gf
AI开搭
星河易创AI
Flowith
思乎AI助理
ChatArt Pro
Siuuu.Ai
Anime gf
畅问AI
灵办Ai