Google Cloud lança Text-to-Speech

Google Cloud lança converter texto em mais de 32 vozes

Google Cloud expande seu portfólio de produtos em inteligência artificial e lança o Text-to-Speech, nova ferramenta que permite aos clientes a conversão de fala em texto em mais de 32 vozes em 12 idiomas diferentes, inclusive português. É a primeira vez que a empresa disponibiliza o WaveNet, um produto inovador de pesquisa de síntese de voz da DeepMind, para o público.

“Muitos produtos do Google como, por exemplo, o Google Assistant, Search e Maps, vêm com uma síntese de texto para fala incorporada, de alta qualidade, que produz fala com som natural. Os desenvolvedores nos disseram que gostariam de adicionar texto para voz a seus próprios aplicativos. Por isso, hoje estamos trazendo essa tecnologia para o Google Cloud Platform, com o Cloud Text-to-Speech”, declara Dan Aharon, gerente de produto de Google Cloud AI.

Além de permitir que os usuários escolham entre 32 vozes diferentes de 12 idiomas, o Cloud Text-to-Speech também traz pronúncias mais assertivas em  textos complexos, como nomes, datas, horários e endereços. O produto, já utilizado por empresas como Cisco e Dolphin ONE, permite a personalização do tom, a taxa de fala e o ganho de volume da voz, além de oferecer suporte a diversos formatos de áudio, incluindo MP3 e WAV.

Com o Cloud Text-to-Speech é possível selecionar vozes de alta fidelidade construídas com base no o WaveNet, um modelo generativo para áudio bruto criado pela DeepMind. O WaveNet traz uma fala mais natural, fazendo com que os usuários prefiram o seu áudio ao invés de outras tecnologias de conversão de texto em voz que já existem no mercado.

Quem quiser experimentar a ferramenta, basta clicar aqui.

 

  • Via Assessoria de imprensa 

Rafael Mota

*Tech/creator do Inteligência Móvel (IM) * Nerd/geek (Pete Mineiro ⛏ da Cavalaria Geek). * [email protected]

Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.