Специалисты Microsoft разработали порождающую состязательную нейросеть (GAN – generative adversarial networks), которая может создавать изображение по его текстовому описанию и ключевым словам. Технология подробно описана в препринте на arXiv.
В отличие от аналогичных систем новая разработка анализирует каждое слово, а не генерирует изображение из целого описания, уточняет издание N+1. Таким образом, нейросеть способна создавать реалистичные, более точные изображения по ключевым словам.
Как отмечает издание, улучшенная нейросеть превосходит существующие алгоритмы на 170,25%, при использовании базы данных COCO, которая содержит текст и описание. При использовании базы данных CUB, содержащей изображения птиц, — на 14,14%.
В начале 2018 года ученые из Киотского университета разработали нейросеть, способную воспроизводить изображения, которые видел человек, пишет Republic. Для работы нейросеть анализирует мозговую активность человека в тот момент, когда он видел картинку. В результате, нейросети удалось сформировать изображения букв, геометрических фигур и предметов.