Показаны сообщения с ярлыком Наносемантика. Показать все сообщения
Показаны сообщения с ярлыком Наносемантика. Показать все сообщения

14 апреля 2015

ИНТЕЛЛЕКТ АКАДЕМИЧЕСКИЙ И ИСКУССТВЕННЫЙ (Интервью Игоря Ашманова)

Как вы думаете, голосовой поиск Google станет популярным?
Есть технологии, которые всем кажутся очевидными и полезными, а на самом деле они не нужны. Простой пример: во всех фантастических романах и фильмах, которые снимались в 60-70-х годах, есть видеофон. В реальности, несмотря на то, что видеофон по сути — это Skype, у него оказалось очень узкое применение: совещания, общение с удаленными родственниками. А повседневное использование, да еще на дому в виде экранов на кухне, в спальне и кабинете, оказалось ненужным. Фантасты, которые придумывали видеофон, не задумались о том, что на самом деле он в быту очень неудобен.
Та же самая история с помощниками типа Siri. В реальности человеку не нужно устройство, которое позволяет общаться голосом с телефоном. Во-первых, кнопками удобнее, во-вторых, кричать в экран само по себе бессмысленное действие.
Это дополнительный уровень сложности, а не помощь. Есть некоторое количество применений в отдельном аудиоканале, которые в основном связаны с занятыми руками, например, в машине. Но опять же повседневного ежесекундного использования не получилось.
Кроме того, надо понимать, что распознавание речи пока еще нерешенная задача. Вы можете заметить, что Google это делает специфическим образом. Он решает эту задачу не за счет распознавания речи, а за счет базы «мозгов» — за счет доступа к большому массиву готовых человеческих текстов, из которых пытается подобрать нужный вариант. Та же история с его «Переводчиком». Там, где есть образцы параллельных текстов, он переводит почти гладко, но стоит уйти в сторону — все разваливается. В такой ситуации порог качества, при котором системой будут пользоваться, может быть просто не достигнут.
У всех систем распознавания, будь то проверка правописания, поиск, антивирус или голос, есть порог использования. Условно говоря, если этот порог меньше 95-98% , использовать систему нельзя, потому что она только раздражает и отнимает время. Есть предположение, что голосовой поиск Google еще не достиг нужного порога.
Насколько сегодня популярен интернет вещей?
Я пока определение интернета вещей для себя не выработал. Возможно, под этим подразумевается, что бытовые устройства будут соединены с интернетом и получат некие встроенные «мозги».
На самом деле, я совершенно уверен, что голосовой интерфейс будет не в мобильнике, а в стиральной машине. Потому что уже сейчас есть платежные автоматы, которые пытаются с вами разговаривать на улице, есть стиральные машины, которые голосом комментируют свои действия. В конце концов все меню в устройствах будут заменены голосовым интерфейсом. Это нетрудно, мы будем делать это в «Наносемантике» (компания, специализирующаяся на технологиях искусственного интеллекта, в частности, прикладной лингвистике и интернет-технологиях — прим. ред.). И уже кое-что делаем. Для человека голосовой интерфейс гораздо удобнее кнопок. Большинство людей инструкций не читают — поэтому нужен узко ориентированный инф (интернет-робот, управляющий искусственным интеллектом — прим. ред.), который будет «сидеть» в стиральной машине и знать ответы на все вопросы о стирке. Голос в технике будет, но это будет нишевое применение.
Помимо этого мы в «Наносемантике» в рамках проекта «Лекси» делаем виртуальных собеседников. Но это не для помощи, а для общения. Так что в виртуального собеседника-дворецкого я верю, а вот в голосовое управление мобильным устройством не верю.
Когда роботы нас поработят?
Мне кажется, никогда. Что такое искусственный интеллект? С точки зрения разработчика, это набор методов оптимизации, машинного обучения и так далее, которое позволяет имитировать какую-то человеческую функцию. И все. Как правило, она имитируется совершенно не так, как это делает человек. Но это логично: автомобиль не на ногах бегает, и вертолет — это не стрекоза. Все делается по-другому, иногда эффективнее, чем в природе, иногда нет.
Так вот, какое-то количество методов, имитирующих человеческую деятельность, уже реализовано, а есть и такие, которые мы пока видим только в фантастических фильмах. Реализованные стразу теряют романтику. Например, проверка правописания. 50 лет назад этим могли заниматься только высокообразованные люди, а сейчас это делает Word. Или алгоритм т9,