|
|
N°44, 18 марта 2009 |
|
ИД "Время" |
|
|
|
|
Роботы - говоруны
В России разработан обучаемый виртуальный собеседник
Компания "Наносемантика" занялась разработкой разговаривающих роботов около трех лет назад. Теперь на сайте "Ай-я-яй" (www.iii.ru) можно создавать виртуального собеседника -- так называемого инфа. Инф представляет собой странное сочетание нетривиального графического интерфейса с примитивным интерфейсом командной строки. Анимированный персонаж ведет письменную беседу с пользователем.
Виртуальный собеседник обучаем. Его словарный запас и разговорные навыки пополняются путем анализа "бесед" инфа с людьми. Для усиления аналитических способностей инфа можно подключить поисковые системы.
Сайт "Ай-я-яй", несмотря на то, что официально запущен только теперь, фактически существует почти год. На данный момент функционал, который предоставляется пользователю для создания и обучения собственного персонажа, гораздо проще того, который используют профессиональные лингвисты для создания "коммерческих" инфов, которые уже работают на сайтах некоторых компаний. Но игрушка все равно забавная.
В планах авторов проекта разнообразить варианты внешнего вида инфов, дать возможность "вживлять" их в страницы социальных сетей, научить их работать в качестве виртуальных собеседников в службах мгновенного обмена сообщениями, разработать инфа-переводчика. А еще устроить соревнования инфов в умении вести диалог и разработать автоматическую систему обучения виртуальных собеседников по текстам и веб-страницам.
Бюджет проекта в компании не раскрывают. Говорят, что зарабатывать на "Ай-я-яй" в ближайшее время не собираются. "Нашей главной задачей является привлечение аудитории. Мне сложно предсказывать, "выстрелит" "Ай-я-яй" или нет. Но если нам удастся собрать значительную аудиторию на сайте, то заработать мы сможем", -- говорит один из инвесторов проекта Игорь Ашманов («Ашманов и партнеры»).
Сейчас на сайте "живут" уже более трех тысяч инфов, ежедневно появляется еще около 200. Софт находится в стадии бета-тестирования. "Каждые две недели появляются новые возможности. Недавно появилась новая функция -- на почту хозяина инфа доставляется уведомление о текущих разговорах. В настоящее время мы разрабатываем более дружественный интерфейс", -- рассказал генеральный директор "Наносемантики" Александр Клячин.
Бизнес-голос
На данный момент коммерческие инфы обладают приличным словарным запасом. В их базовой комплектации содержится 12 тыс. вариантов диалога. В основном это нейтральные реплики и ответы на часто задаваемые вопросы. К ответам, заложенным в базовой комплектации, виртуальный собеседник будет обращаться и после обучения, если не сможет найти подходящего ответа среди вариантов, предусмотренных пользователем -- владельцем инфа.
По словам руководителя проекта "Ай-я-яй" Ильи Гельфенбейна, на данный момент коммерческие инфы непринципиально отличаются от тех, которых можно создать и обучить на сайте: "Прежде всего коммерческие виртуальные собеседники узко специализированы: большинство их ответов содержит информацию о компании, на сайте которой они "живут". Коммерческие инфы могут быть также подключены к базе данных о наличии товара на складе, например на сайте интернет-магазина, и выдавать эту информацию пользователям".
Инфы на сайте "Ай-я-яй" в своей базовой комплектации имеют нейтральный набор фраз, поэтому по желанию пользователя их можно переучить, создав виртуального сотрудника службы поддержки.
Обучать инфа можно как по стандартному набору тем (книги, музыка, цветы, алкоголь, вредные привычки), которые предлагаются администрацией сайта, так и по собственным темам. Во втором случае придется придумывать не только ответы инфа, но и реплики его собеседников. Возможности программирования робота представляют собой стандартные приемы работы с масками символьных обозначений: "*" заменяет любую последовательность символов, "~" -- окончания слов, "?" -- любой символ, но стоящий в строго определенном месте слова etc.
Инф может быть «вживлен» в страницу любого сайта, например, в блог. Это очень просто: достаточно записать несложный HTML-код.
Предки инфов
Первый робот-собеседник был создан еще в 1966 году. Программа "Элиза" Джозефа Вейзенбаума пародировала диалог с психотерапевтом, выступая в роли активного, хотя и не блещущего умом слушателя. Основным принципом работы "Элизы" было перефразирование реплик собеседника. Например, на заявление человека "У меня болит голова" "Элиза" отвечала: "Почему вы говорите, что у вас болит голова?"
В 1995 году началась разработка другого виртуального собеседника -- программы A.L.I.C.E. Этот виртуальный собеседник сопоставляет фразы, написанные собеседником, с репликами в своей базе знаний. Сегодня A.L.I.C.E. считается одной из лучших в своем роде. Однако ни ей, ни "Элизе" так и не удалось пройти тест Тьюринга, в ходе которого человек должен определить, кто является его собеседником -- человек или компьютер. Однако A.L.I.C.E. трижды (в 2000, 2001 и 2004 годах) становилась победителем премии Лебнера (с 1990 года ежегодно вручается победителю конкурса, в котором компьютерные программы соревнуются в прохождении теста Тьюринга).
Илья Гельфенбейн говорит: "Элиза" и "Элис" разрабатывались академическими группами с научными целями и ставили перед собой задачу создания ботов, имитирующих речь и поведение человека. В "А-я-яй" мы пошли с другой стороны -- дали возможность любому пользователю создать и обучить собственного персонажа. "Умность" инфов зависит от того, сколько усилий вложил создатель в их обучение".
Российские разработки пока не участвовали в соревнованиях на прохождение теста Тьюринга, поскольку они проводятся только на английском языке. Хотя, по словам г-на Гельфенбейна, инфов планируется обучать и английскому.
Ольга ФЕДИНА, iToday.ru, -- специально для «Времени новостей»