您当前位置: 首页 - 软件新闻 - 《通义》App迎来数字诗人李白,古今对话尽在指尖,吟诗谈史两相宜

《通义》App迎来数字诗人李白,古今对话尽在指尖,吟诗谈史两相宜

文章来源:互联网 作者:稻谷资源网 发布时间:2024-09-11 15:35:52

近日消息,通义近期发布了数字人李白,该数字人依托于通义大模型及先进的多模态技术,不仅外形传神地复现了唐代伟大诗人李白的中年时期样貌,更通过细腻的眼神交流与举止动作,深度诠释了李白诗词独有的意境美。

《通义》App迎来数字诗人李白,古今对话尽在指尖,吟诗谈史两相宜

数字人李白刚上线,便于近期进入杭州刀茅巷小学,化身新学期一位特别的“语文老师”上了一堂公开课。“您写过的*长的诗是哪一首?”“《蜀道难》背后有什么故事?”……面对一个个的好奇提问,李白不仅有问必答,而且引经据典,与学生们诗词接龙。

这种寓教于乐的方式使语文课变得更加有趣且高效。杭州市刀茅巷小学语文老师王敏蕾表示,“平时的语文课堂中就是课本,还有多媒体教学,像数字人一起参与,我觉得小孩子不仅从数字人身上感受到不一样的课堂以外,还能学到课本以外的知识。”

和需要大量视频作为训练数据,对真实人物进行复刻的传统数字人不同,通义推出的李白数字人,只需要一张图就可以生成具有全身动态的数字人,在这背后,是阿里通义大模型能力的“六剑客”。

大脑来自通义的模型Qwen,其语⾔理解、知识、代码、数学及多语⾔等多项能⼒显著领先。表情跟自然呼吸态来自EMO模型,*大化地保留模型创造力,使人脸表现力大大提升。肢体动作上,通义采用了强控制方法AnimateAnyone,用针对人体建模的骨架图片来驱动人物动作,也是曾爆火全网的“全民舞王”背后的技术。

语言模型来自通义语音实验室的CosyVoice技术,基于海量数据训练的生成式语音大模型,能够实现1-3句话声音克隆。为了让数字人有更好的实时对话能力,数字人李白还采用了VideoReTalking技术,它可以根据音频自动匹配嘴型。

未来,视觉语言大模型VL(Vision-Language)也将被应用在数字人交互领域,在情感识别、虚拟现实交互上提供更优质的互动体验。未来打开摄像头,用户便能与李白打破时空结界、体验身处一世的实时视频通话。

“李白是中国传统文化的一张名片,数字人李白让这位跨越千年的文学巨匠以全新的形态‘活’在当下,与全球观众互动,激发更多人对古典文学的兴趣与热爱。”通义数字人产品经理龙慧表示,未来,从线上教学到虚拟旅游,数字人将在教育、文化旅游、数字娱乐等多个领域展开*应用的计划。

手机登录《通义千问》轻松方便,让你随时查询(无日期限)

通义千问怎么用手机登录?很多朋友可能还不知道,阿里的这款软件目前已经正式公布了,还有不少网友可能还是一头雾水,下面就给大家带来通义千问的使用教程,一起来看看吧。

《通义千问》怎么用手机登录

网页版地址:https://tongyi.aliyun.com/

通义千问使用教程分享

1、目前通义千问功能包含效率类,生活类与娱乐类三部分,其中效率类包括自定义主题生成提纲,

2、SWOT分析和根据商品名称生成商品描述文案等功能;生活类如根据菜名生成菜谱,

3、根据作文题目生成小学生风格的作文以及根据首句生成下文等;

4、娱乐类如生成彩虹屁文案,写情书以及根据三个中文关键词写诗等。

5、目前,通义千问暂时不支持AI绘画功能。

“通义千问”将核心功能分为四个大类:撰写短文、职场助理、电影脚本和写封邮件。可以看出,虽然“通义千问”仅仅上线了内测版本,但已经具备人工智能协助工具的雏形。当然,毕竟是比较初期的版本,基本使用逻辑和形式还是与ChatGPT类似,一问一答,但答案基于互联网检索,出错的情况较少。

事实上,自Open AI开发的chatgpt走红以来,几乎所有头部科技企业都在人工智能领域找到了新方向,百度和谷歌交出的首份答卷,使用体验比较流畅,但功能偏向单一,从用户的角度看,这样的工具还没法真正与工作挂上钩。而“通义千问”直接了当地告诉用户自己可以做什么,这一点还是值得赞扬的。不过,相比起“文心一言”早早就准备好了商业运用模式,阿里的动作还是略显缓慢。

阿里的进度虽然不算快,但首次公开亮相就展现出不俗的完成度,这一点还是挺让人吃惊的。早前,谷歌的人工智能项目高管杰克・克劳奇克在一项采访时表示,人工智能聊天机器人不是简单的信息整合工具,它应该展现出更多能够成为协助工具的特性。实际上,百度、阿里和微软都在基于这个方向进行研发,“通义千问”能够提供的协助方案还是比较多的,但还在职场工作上还是稍有欠缺。

复制本文链接 攻略文章为稻谷资源网所有,未经允许不得转载。