Главная :: Новости индустрии :: Создан искусственный интеллект, умеющий находить объекты на картинках по голосовому описанию

Создан искусственный интеллект, умеющий находить объекты на картинках по голосовому описанию

Ученые из MIT (Массачусетский технический университет) представили очередное изобретение. На этот раз это нейросеть, которая умеет распознавать объекты на снимке, основываясь только на их простом словесном описании. Дополнительные пояснения при этом не требуются.

Имеющиеся на данный момент системы распознавания речи не могут эффективно выполнять задачи без массы аннотаций и транскрипций. Новый же алгоритм гораздо проще. Ему можно просто сказать "красный торшер", и он найдет его на картинке.

Фактически ИИ состоит из пары нейросетей, одна из которых делит картинку на сетку с маленькими ячейками, а вторая дробит звуковую спектрограмму на короткие части по 1-2 секунды. После этого алгоритм проверяет точность соответствия аудиодорожки картинке на сетке.

Разработчики считают, что их изобретение можно будет использовать при создании переводчиков, которые смогут распознавать язык и подбирать подходящий перевод со 100 % точностью.

Создан искусственный интеллект, умеющий находить объекты на картинках по голосовому описанию





Задать вопрос

В целях защиты от отправки сообщений роботами, введите в поле цифры, которые Вы видите на картинке

Обновить код

Заказать обратный звонок

В целях защиты от отправки сообщений роботами, введите в поле цифры, которые Вы видите на картинке

Обновить код
Создание бота для автоматизации
Москва
ул. Покровка, д. 50/2, стр. 5

Тула
ул. Первомайская, д. 1
+7 (495) 7777-986
(многоканальный)

+7 (4872) 70-40-65
[email protected]
(по общим вопросам)
[email protected]
(по вопросам трудоустройства)


Вся представленная на сайте информация носит информационный характер и не является публичной офертой.

© Алексфилл, 2005-2024

Рейтинг@Mail.ru