阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图

2025-02-06 来源|AI图库吧

AI奇点网3月19日报道丨今日,阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。

通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟,对最高 6 小时、6G 大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。作为一个“懂你”的 AI,小悟还会智能推荐问题。

针对用户需求,通义听悟还上线了一键 AI 改写、思维导图生成等新能力。

例如,一键 AI 改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级 xmind 脑图,适合播客摘要。产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。

此外,“通义听悟”现宣布推出“高校公益计划”,针对所有中国大陆高校师生提供服务,师生们可以通过后缀为 edu.cn 的教育邮箱进行认证后,均可直接免费获赠 500 小时转写时长,存储空间从 20G 拓展至 200G。

最新
更多

阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图

阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。

“宝藏AI神器”阿里通义听悟最新更新丨支持超长音视频问答,高校师生可获500小时免费时长

通义听悟最新更新啦,能对所有音视频内容进行全面“解剖”,播客、会议、学习、访谈各种视频均可对其多语言自由提问。不仅可以针对单一记录向它提问,最长6小时、6G大小,还可以跨记录、让“小悟”扫描上百个音视频一起总结回答问题,目前“小悟”支持内容问答的音视频时长和文件数都是业界上限。

奥特曼认为GPT-4“有点糟糕”丨Stability AI推出3D渲染视频模型Stable Video 3D丨谷歌推出多模态视频模型VLOGGER

【AI奇点网2024年3月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

谷歌发布首个多模态视频生成模型VLOGGER AI:让静态人物肖像图像开口“说话”

近日,谷歌一款名为 VLOGGER AI 的新模型上线,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。

库克今年首次访华,国内首谈生成式AI丨微软收购OpenAI竞争对手Inflection AI丨黄仁勋回应中国算力芯片出货问题

【AI奇点网2024年3月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

只用文本,3分钟生成一个网站!首个ChatGPT版网站开发平台dora AI发布

3月21日,开发平台dora宣布,首个生成式AI网站开发平台dora AI,结束候补内测全面开启公测。

网站地图