«Национальная технологическая инициатива» (НТИ) — госпрограмма по поддержке развития перспективных отраслей в России — представила гарант на 270 млн рублей российскому разработчику голосовой биометрии «ЦРТ-инновации» на создание технологии анализа звуковой среды с помощью искусственного интеллекта «Нейроухо».

«ЦРТ-инновации» занимается разработкой систем для распознавания лиц и речи, которые умеют распознавать отдельно взятую речь, анализировать сложные звуковые картины и отделять речь от шумов. Компания на 100% принадлежит подконтрольной «Газпромбанку» «Центру речевых технологий».

Предполагается, что «Нейроухо» поможет устройствам слушать, что происходит вокруг, а также при наличии нехарактерных шумов система будет рассылать уведомления или управлять видеокамерами. Помимо этого система сможет распознавать возраст и пол.

Весь проект создания системы стоит 390 млн рублей, однако НТИ выделяет средства лишь при наличии 30% частных инвестиций. Необходимые 120 млн рублей вложит «ЦРТ-инновации». По прогнозам, проект должен окупиться к 2022 году, а к 2024 году должен выйти на получения выручки в 2 млрд рублей.

Руководитель отдела разработки голосовых технологий и продуктов «Яндекса» Денис Филиппов полагает, что озвученных средств хватит только на прототип, а промышленная реализация потребует новых инвестиций. Также он подчеркивает сложность в сборе данных, необходимых для обучения ИИ: для распознавания по характерному звуку нужно сотни часов записывать каждый объект в разных шумовых окружениях и на различных расстояниях от микрофона.

Источник: Rusbaze