您当前位置: 首页 - 科技动态 - 微软Azure AI语音革新:虚拟形象登场,无缝转换文本为视频

微软Azure AI语音革新:虚拟形象登场,无缝转换文本为视频

文章来源:互联网 作者:稻谷资源网 发布时间:2024-08-26 16:51:01

8月23日消息,微软Azure AI语音服务再度升级,推出了令人瞩目的文本到语音虚拟人功能,为开发者解锁了创造多语言生成式AI语音应用的新可能。

微软Azure AI语音革新:虚拟形象登场,无缝转换文本为视频

这一创新技术能够将简单文本无缝转化为逼真的自然语言视频,极大地丰富了人机交互的维度,为企业和个人用户在内容创作、客户服务等领域带来前所未有的沉浸式体验。

今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。

Text to Speech Avatar 具有以下功能:

将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自然的声音。

提供不同的人物预设形象。

形象的声音由 Azure AI 文本转语音生成。

使用批量合成 API 异步或实时合成文本到语音人像视频。

在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。

通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。

定价方面,文本转视频服务的收费将根据视频输出的长度计算并按秒收费。该服务现已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。

微软正式发布使用Rust语言重写的开发工具,安装体积缩小1/100

在之前的消息中,微软在 2017 年发布了 Azure Quantum 开发工具(QDK),主要用于 Azure 量子开发。到了 2023 年微软宣布使用 Rust 语言重写相关工具,目前官方发布新闻稿,声称已经完成相关重写工作。

微软正式发布使用Rust语言重写的开发工具,安装体积缩小1/100

据悉,官方宣称使用 Rust 重写的 Azure Quantum 开发工具 1.0 版本“速度提升超过 100 倍、安装体积缩小 1/100”,整体安装和开发流程更简便,甚至相关工具在浏览器中都可以适用。

旧版开发工具基于 .NET,开发者使用该工具时,需要先学习 .NET,这增加了额外的学习成本,除此之外,旧版开发工具不完全兼容 Apple Silicon 和 ARM64 版 Windows,因此安装使用成本较为复杂。

因此微软决定通过重新设计开发工具降低开发门槛,主要简化“安装、学习、开发、维护”等任务,并尽可能利用 Rust 语言重写整个项目,这是因为“Rust 语言相对更普适化,并允许相关应用可以在浏览器中工作”。

新版开发工具改进成果相当显著,号称“体积缩小超过 100 倍”,微软同时提到,“原本的开发工具会在本地产生超过 180 MB 的占用,现在新的 VS Code 扩充套件的 VSIX 只有约为 700KB,其中包含开发所需要的所有内容,而安装也仅需要几秒钟”。

在效率方面,新版开发工具也有大幅提升,微软宣称,过去编译需要以分钟计时,而现在编译只要“毫秒时间”,甚至“在浏览器中也能获得这样的高效体验”。

复制本文链接 攻略文章为稻谷资源网所有,未经允许不得转载。