打工人“摸鱼”的秘密都在这个宝藏AI工具里

“通义听悟”升级: 超长视频自由问 还会做思维导图

2024-03-21

记者用通义听悟将采访录音转写成文字,还可自动生成关键词、全文概要和发言总结

商报记者 王彬彬

课程音视频、工作会议找不到重点?采访录音、学习笔记整理繁琐?在AI大模型的赋能下,就算“摸鱼”也能事半功倍。

阿里大模型产品“通义听悟”最新上线的音视频问答助手“小悟”,不仅支持为单独一条最长6小时、6G大小的音视频整理金句、梳理总结,还可以同时扫描理解上百条音视频内容。此外,还有一键AI转写、思维导图自动生成等一大批新功能发布。

课代表“小悟”上线 AI秒速总结知识点、做脑图

通义听悟被许多用户称为“宝藏AI工具”,接入通义千问大模型后,融合了十多项AI功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等,并支持标重点、记笔记,都是打工人在职场生活中能够派上用场的技能包。

这里就不得不强调通义听悟的转写功能,作为一名新闻工作者,时常需要外出采访,将对话先用手机或者录音笔录下,然后再使用通义听悟将音频转写成文字,转写过程中,还能自动生成关键词、全文概要、发言总结等,大大提高了记者的工作效率。

在通义听悟本次升级中,最重磅的是音视频问答助手“小悟”,关键信息可以直接“问”出来。“小悟”通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答。

记者体验后发现,不仅可向“小悟”针对单独一条最长6小时、6G大小的音视频记录,提问任何相关话题,或者直接要求其整理金句、梳理结论、写会议纪要;还可以在首页直接唤醒“小悟”,一次性扫描、理解上百条音视频内容,解答你的提问。记者曾采访多位做出海贸易的商家,“小悟”能从多个半小时以上的采访录音中,迅速、准确地整理出了“这几位商家做跨境电商的优势分别在哪?”

此外,通义听悟还上线了一键AI改写、思维导图生成等新能力。例如,一键AI改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级xmind脑图,适合播客摘要。产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。

“高校公益计划”推出

认证可得500小时免费时长

记者了解到,自去年6月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。

一位管理学博士生蔡同学在社交媒体上写道,“通义听悟绝对是最强科研神器”,她向身边几乎所有亲朋好友推荐了这款产品。通义听悟发布才9个月,她的使用时长已近7000小时,平均每天转写20小时以上,包括分析网络视频进行学术研究,以及日常学习工作随时使用,这款软件已成为她沉淀知识和科研成果的重要平台。

阿里通义听悟产品负责人杨帆介绍,调研中发现约一半用户是学生,他们活跃度相当高。有的同学上课、开组会“无时无刻不听悟”;有的用通义听悟两倍速上网课备考;有的每天在“发现”栏目中阅读数十档播客节目;“后台每天收到大量私信求时长。”

学生和科研群体对AI新工具有普遍需求,但目前音视频AI转写工具普遍收费,或仅提供如每月1小时的少量免费时长。为推动AI算力普惠,通义听悟推出“高校公益计划”。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。按目前市面上语音厂商9.9元每小时的折扣价,这一教育福利价值数千元。