谷歌发布3D建模生成大模型「CAT3D」:开局一张图,1分钟构建精美3D建模成像

2025-01-23 来源|AI图库吧

AI奇点网5月24日报道丨近日,谷歌在GitHub平台发布了一款3D生成模型「CAT3D」,通过使用多视角扩散模型来创建3D场景。

「CAT3D」通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。这次大模型的发布,彰显了3D影像重建领域取得了显著的技术进展。

在过去,3D重建场景是一项非常繁琐而复杂的工作,需要耗费巨大的人力物力算力。现如今,用户只需要提供一些包含具体对象元素的图片,「CAT3D」就能够利用这些图片生成新的视角,然后通过一个强大的3D重建流程,将这些视角转换成一个可以实时渲染的3D表示。

据介绍,「CAT3D」能够在一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。

只需在模型内上传一定数量的图像,就可以这些图像为条件的多视图扩散模型来生成场景的新视图。生成的视图被馈送到强大的3D重建管线,生成可以支持交互式实时渲染的3D成像文档。总处理时间(包括视图生成和3D重建)仅仅只需一分钟而已。

该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。CAT3D利用多视图扩散模型,可以根据任意数量的输入图像和目标新视图生成高度一致的场景新视图。

与竞争对手相比,「CAT3D」输出的3D图像渲染速度又快又清晰,细节保留程度较高,重复修改的工作量少。也不会出现明显的空间景深误差与视觉上的不和谐。

谷歌表示,生成的新视图可以作为3D重建技术的输入,实现从任何视点实时渲染3D表示,这对于虚拟现实、游戏开发和建筑设计等领域非常有用。

主要特点:

快速生成:CAT3D能够在最短的时间内,即一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。多视图支持:该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。高质量的3D捕获:CAT3D利用多视图扩散模型,可以根据任意数量的输入图像和目标新视图生成高度一致的场景新视图。实时渲染:生成的新视图可以作为3D重建技术的输入,实现从任何视点实时渲染3D表示,这对于虚拟现实、游戏开发和建筑设计等领域非常有用。结构优势:CAT3D使用视频扩散模型的结构,但与时间嵌入不同,每个图像都嵌入了相机姿态,这有助于更准确地捕捉场景的3D结构。3D重建管道:生成的视图被传递到3D重建管道,以创建精确的3D表示,这对于后续的3D建模和可视化至关重要。

项目主页:

https://cat3d.github.io/index.html

最新
更多

谷歌发布3D建模生成大模型「CAT3D」:开局一张图,1分钟构建精美3D建模成像

近日,谷歌在GitHub平台发布了一款3D生成模型「CAT3D」,这次大模型的发布,彰显了3D影像重建领域取得了显著的进展。

李彦宏谈中西方AI产业的区别丨阿里披露投资“月之暗面”8亿美元丨李开复谈大模型价格战:宁愿出海也不参与

【AI奇点网2024年5月24日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

OpenAI「超级对齐团队」正式解散丨ChatGPT Plus将加入表格创建功能丨Kimi智能助手推出付费计划

【AI奇点网2024年5月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

OpenAI人事地震多名高管离职:CEO奥特曼被指PUA下属,对离职员工要求签订「负面封口」条款

OpenAI的「宫斗大戏」即将开启第二季。本周二,原OpenAI首席科学家Ilya Sutskever官宣离职,OpenAI的安全主管Jan Leike也一同离职。

Sora最强竞品!谷歌最新AI视频生成模型Veo详解:时长超1分钟、1080P丝滑丨附内测体验链接

5月15日,谷歌举办一年一度的I O开发者大会,对OpenAI展开了军火库的狂轰滥炸。其中最受网友关注的无疑是AI视频生成模型,代号「Veo」。

苹果计划自建AI服务器数据中心:苹果COO访问台积电总部,探讨AI芯片开发与代工

苹果COO Jeff Williams低调拜访台积电,台积电总裁魏哲家亲自接待。双方主要讨论了苹果自研AI芯片的开发,以及台积电使用先进制程技术生产芯片等事宜。

网站地图