Компьютер сможет разбирать фотографии своего пользователя, а затем автоматически генерировать описания к ним и инструкции. Именно такая вероятность существует для нас в самом ближайшем будущем, по словам представителей Google, которые в свою очередь, работают над решением данной проблемы.
Исследователи компании выложили несколько докладов в блог, согласно которым Google планирует разработать сложную систему автоматического написания комментариев к изображениям, которые будут содержать точное описание, а так же содержание кадра. По их словам, они уже достаточно близки к достижению поставленной цели.
Система машинного обучения Google будет «видеть» фото, а потом автоматически генерировать его описание и инструкцию к нему. Система идентификации изображений объектов и их положения по отношению друг к другу от перечисления содержания перейдет к более подробной интерпретации, что и позволит делать более естественные описания. Новшеством компания называет объединение системы компьютерного зрения с режимом программы естественного языка.
Система, в конечном итоге, позволит слабовидящим людям понять, что изображено на фотографии, предоставив им альтернативный текст с подробным описанием нужной фотографии.
Новую систему, по словам представителей Google, еще предстоит улучшать, дорабатывать и совершенствовать, а так же развивать и в других направлениях. Но любая работа в этом направлении будет стоит того, чтобы ее проделать, так как она позволит значительно продвинуться в плане создания новых компьютерных систем. Это развитие современных технологий.