Лучшие технологии машинного чтения по точности ответов на вопросы сравнимы с человеком, но уступают в понимании нюансов языка.

По информации компании Microsoft, исследовательская команда Microsoft Research Asia и исследователи компании Alibaba создали одни из лучших технологий машинного чтения на основе искусственного интеллекта.

Результаты точности ответов на вопросы, полученные двумя группами исследователей, сравним с результатами ответов человека.

Оценка результатов

Для оценки использовался набор данных SQuAD (Stanford Question Answering Dataset), разработанный специалистами из Стэнфордского университета. Этот набор данных для машинного чтения и понимания текстов содержит вопросы, основанные на статьях из Википедии.

3 января Microsoft представила модель, получившую в тесте на поиск точного соответствия результат 82,650. Средний результат людей, отвечавших на тот же набор вопросов — 82,304. 5 января исследователи из китайской интернет-компании Alibaba получили результат 82,440, тоже сравнимый с человеческим.

Сейчас эти две компании занимают первые места в списке лидеров SQuAD, показывающем результаты исследовательских организаций.

Значение технологии машинного чтения

Технологии машинного чтения и понимания текстов позволят компьютерам быстро обрабатывать содержание книг и документов, а затем предоставлять людям необходимую информацию в простом и понятном виде.

Например, водители смогут быстро найти ответ в обширном справочнике по автомобилю, сэкономив время и усилия в сложных ситуациях. Врачи, юристы и другие специалисты будут быстрее справляться с задачами, требующими изучения многих документов для поиска редких прецедентов и прочих специфических данных.

Новые технологии повысят эффективность их работы и позволят уделять больше времени лечению пациентов и урегулированию юридических вопросов.

В целом, новые достижения в этой сфере позволят технологическим сервисам взаимодействовать с людьми более естественно.

Направления разработок

Microsoft делает большие инвестиции в развитие средств машинного чтения и понимания текста, стремясь создавать больше технологий, с которыми люди могут взаимодействовать простыми, интуитивно понятными способами.

Например, разработчики поисковой системы Microsoft Bing работают над тем, чтобы люди могли вводить запрос и получать в ответ не просто список ссылок, но и прямые ответы или список из разных источников информации, если вопрос сложный или спорный.

Предыдущие версии моделей Microsoft, использованных для прохождения теста SQuAD, уже применяются в поисковой системе Bing. Сейчас компания работает над их применением для решения более сложных задач.

Например, Microsoft разрабатывает технологии, позволяющие компьютеру отвечать не только на исходный вопрос, но и на последующие. Предположим, вы спрашиваете компьютер: «В каком году родилась премьер-министр Германии?», а потом хотите, чтобы он понял и следующий вопрос: «В каком городе она родилась?»

Эта технология позволит давать естественные ответы, требующие обработки информации из нескольких предложений. Например, если спросить: «Является ли Джон Смит гражданином США?», ответ может быть взят из двух предложений: «Джон Смит родился на Гавайях. Гавайи относятся к США».

Как сообщали «Индустриальные новости», недавно Microsoft разработала бот-художника на основе искусственного интеллекта, который умеет рисовать изображения по текстовым описаниям 

Сложности в развитии машинного чтения

Несмотря на то, что результаты теста SQuAD представляют собой важную веху, в целом люди по-прежнему гораздо лучше компьютеров справляются с пониманием нюансов и сложностей языка. Видимо, пока анализ разнообразия и богатства языка трудно алгоритмизировать.