阿里云通义听悟新增自动提取PPT等三大功能

  8月2日消息,阿里云通义听悟上线三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序。

1.jpg

  截自通义大模型官网

  今年6月,阿里云首次宣布通义听悟开放公测。此次升级,在原有实时记录、音视频文件转写、全文概要、章节速览等功能之上,新增“提取PPT”功能。该功能通过引入视觉AI算法,自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。

  通义听悟还增加了浏览器插件和移动端的支持。用户开会、上网课、看直播、看视频时,Chrome和Edge浏览器插件功能可全程录制,并实时生成双语字幕,帮助用户更轻松地浏览视频内容。

2.jpg

  截自通义大模型官网

  在移动端,通义听悟钉钉和微信小程序不仅支持PC端的基础功能,还可以一键转写手机和聊天记录的音视频文件。

  本次新功能上线期间,阿里云继续联合各大平台和社区推出定制口令码,用户根据口令码可随机抽取20h、30h、66h、88h、100h的免费转写时长。通义听悟集成了阿里云的语音、语言和视觉AI技术,未来还将陆续上线适用于更多场景的新功能。

  据悉,阿里云自2019年启动大模型研发以来,通义大模型逐步从单一模态真正升级为多模态大模型。今年4月,阿里云正式推出大语言模型“通义千问”,它能够响应人类以自然语言提出的指令,完成回答问题、创作文字、编写代码、角色扮演对话等各项任务。

  在7月举行的2023世界人工智能大会期间,阿里云宣布推出通义大模型家族新成员通义万相,用户可以在通义万相中输入提示词,以输出相应图像。除文生图以外,通义万相也推出了包括风格迁移、相似图生成等功能。

3.jpg

  截自通义大模型官网

  阿里云智能集团首席技术官周靖人在2023世界人工智能大会透露,通义千问已有累计超30的申请用户,超过100家深度共创企业,而通义听悟发布首月已有36万用户。

电商资讯*版权声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。 本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。
文章网址:http://www.cnecn.com.cn/service/tech/2023-08-02/12997.html
赞 | 0