Цифровой помощник с открытым кодом позволит почувствовать себя Железным человеком

16 марта 2015

Цифровой помощник с открытым кодом позволит почувствовать себя Железным человеком

Цифровой помощник Siri от компании Apple — далеко не единственная программа, которой может воспользоваться владелец гаджета. Идея создания искусственного интеллекта, способного ответить почти на любой вопрос, используя данные из Интернета, разрабатывается инженерами довольно давно.

Исследователи из Мичиганского университета создали нового цифрового помощника с открытым кодом. То есть теперь каждый пользователь может адаптировать его под свои потребности. Это открывает новые возможности как для индивидуальных пользователей, так и для центров обработки данных.

Новая программа получила название Sirius. По своему принципу работы она схожа с Siri, Microsoft Cortana и Google Now: устройство выслушивает голосовой запрос пользователя, после чего обрабатывает его и выдаёт ответ, как в устной форме, так и в виде документов из Сети.

"Главное отличие нашей программы Sirius от её коммерческих аналогов — она полностью бесплатна и может быть адаптирована под нужды пользователей", — поясняет автор разработки Джейсон Марс (Jason Mars).

Впервые достижение команды информатиков будет продемонстрировано 14 марта 2015 года на технологической конференции в Стамбуле. Выпуск программы состоится

на следующий день, сообщается в пресс-релизе.

Работа алгоритма Sirius заключается не только в распознавании речи, но и идентификации изображений, обработке естественного языка и обеспечении работы системы вопросов и ответов, которая выполняется в "облаке". Пользователи программы смогут вводить голосовые запросы или показывать Sirius изображения. К примеру, программе можно показать фото ресторана и спросить, во сколько он закрывается.

Любые фактические вопросы, например, о размерах планет или годах жизни знаменитостей, получают ответ с "Википедии". В этом Sirius похож на коммерческие аналоги.

Отличие новой программы, прежде всего, заключается в том, что пользователи смогут сделать свой Sirius "экспертом" в какой-то узкой области. Чтобы позволить новой программе также давать пользователям академические консультации, специалисты из Мичиганского университета начали сотрудничество с компанией IBM.

"Фактически, мы создали Linux среди умных цифровых помощников", — утверждает Марс.

Для создания своего алгоритма исследователи объединили несколько уже существующих проектов с открытым исходным кодом, которые используют аналогичные принципы работы с коммерческими Siri, Microsoft Cortana и Google Now.

Sirius работает не только с голосовыми командами, но и с картинками (фото Joseph Xu, Michigan Engineering, Communications & Marketing).

Функция распознавания речи пришла из программы университета Карнеги-Меллона Sphinx, система вопросов и ответов была взята из программыOpenEphyra, которая, кстати, легла в основу легендарного суперкомпьютера Watson, а способность распознавания изображений авторы позаимствовали у алгоритма SURF компании Qualcomm.

Эксперты прочат большое будущее технологиям с системой голосового управления. По недавним оценкам, носимые гаджеты будут использовать именно такую функцию, и объем продаж таких устройств будет составлять около 485 миллионов штук в год уже к 2018 году.

В то время, как голосовые запросы делают жизнь пользователей проще, сам процесс их обработки и выдачи ответов намного сложнее, чем простой текстовый запрос в поисковике. Смартфон или любое другое устройство, обладающее функцией голосового помощника, распознаёт слова и превращает их в речь, но основная работа по обработке этого запроса протекает в облаке.

Специалисты из Мичиганского университета подсчитали, что если голосовые команды вытеснят обычный веб-поиск, то инфраструктура центров обработки данных должна будет вырасти в 165 раз.

"К тому моменту нам необходимо будет найти оптимальный способ модернизации облачных платформ, чтобы они подходили под новый тип нагрузки", — поясняет Марс.

Авторы Sirius попытались найти решение и для этой проблемы. Они подбирали оптимальный процессор, который операторы центров обработки данных могли бы использовать для расширения своей инфраструктуры. Инженеры обнаружили, что графические процессоры, которые изначально создавались для работы с графикой, но позднее оказались полезны и в других сферах, могут ускорить процесс обработки данных в десять раз. Разумеется, это ещё далеко от идеала, но специалисты уже понимают, в каком направлении стоит двигаться.

Подробное описание разработки нового цифрового помощника и поиска оптимального решения для дата-центров можно почитать в PDF-документена сайте Джейсона Марса.

Источник

Комментариев нет:

Отправить комментарий

Спасибо за ваш комментарий.
Он будет опубликован после проверки.

Искусственный интеллект - реальность и перспективы

Страницы

16 марта 2015