В минувший четверг 21 ноября в Петербурге была представлена технология синтеза речи на основе нейросетей.
Отмечается, что благодаря усовершенствованной системе предложения при прочтении текста звучат плавно и выразительно. Дело в том, что аудиосигналы генерируются нейросетевыми моделями. В технологии присутствует модуль, предсказывающий ударения в словах, не имеющихся во вложенной базе словаря, а также возможно автоисправление орфографических ошибок.
В Сбербанке отметили, что система работает на трех языках – русском, английском и казахском. Планируется после 2020 года начать развитие технологии, которая будет имитировать человека почти на 100%.