Нейросеть от Microsoft научилась создавать изображение по его описанию

Фото: arXiv 2017

Фото: arXiv 2017

Специалисты Microsoft разработали порождающую состязательную нейросеть (GAN – generative adversarial networks), которая может создавать изображение по его текстовому описанию и ключевым словам. Технология подробно описана в препринте на arXiv.

В отличие от аналогичных систем новая разработка анализирует каждое слово, а не генерирует изображение из целого описания, уточняет издание N+1. Таким образом, нейросеть способна создавать реалистичные, более точные изображения по ключевым словам.

Как отмечает издание, улучшенная нейросеть превосходит существующие алгоритмы на  170,25%, при использовании базы данных COCO, которая содержит текст и описание. При использовании базы данных CUB, содержащей изображения птиц, — на 14,14%.

В начале 2018 года ученые из Киотского университета разработали нейросеть, способную воспроизводить изображения, которые видел человек, пишет Republic. Для работы нейросеть анализирует мозговую активность человека в тот момент, когда он видел картинку. В результате, нейросети удалось сформировать изображения букв, геометрических фигур и предметов.

Автор:

Новости партнеров