Google разработала современный синтезатор речи нового поколения - Tacotron 2. Технологию, скорее всего, сразу начнут использовать в продуктах компании.
Система преобразования текста в голосовое вещание справляется с задачами значительно качественнее предшественников - Tacotron и WaveNet. Последние имели ряд недостатков: WaveNet выдавала очень резкие звуки, а Tacotron лучше справлялся с интонациями, но не мог производить качественный "языковой продукт".
Алгоритм Tacotron 2 работает благодаря двум нейронным сетям. Печатная версия трансформируется в специальную Tacotron-спектрограмму, в которой правильно распределяют ритм и ударения в словах, пишет nv.ua.
Аудиозапись действительно напоминает язык живого человека, а не машины. Темп, интонация и ударения звучат убедительно. Основные запинки происходят на словах с нетрадиционным произношением.
ЧИТАЙТЕ ТАКЖЕ: Что украинцы чаще всего искали в Google в 2017 году
В комментариях отдельные пользователи утверждают, что некоторые слова система произносит достаточно "ломано" и неправильно. Один из основных недостатков новой системы - отсутствие регулятора тона речи. Нельзя предсказать, какую фразу программа проговорит возвышенно, а какую - грубо.
Образцы аудиозаписей нового синтезатора речи Tacorton 2 можно прослушать на официальном сайте Google.
Компания Google разработала 3 новых приложения, которые можно уже использовать пользователям смартфонов с операционными системами Android и iOS. Программы предназначены для фотографии. Новый софт для смартфонов подходит для любителей фотографировать. Новинки основаны на технологии распознавания людей, объектов и предметов. Первое приложение называется Storyboard. Оно подойдет для тех, кто хочет набрать популярности в социальных сетях путем публикации интересного контента. Программа позволяет обрабатывать видеозаписи и делать из них комиксы. Такое нововведение будет доступно только пользователям Android.
Комментарии