Как обучить Ваш робот (для расположения)

Военная база только что упала на вражеских борцов. Робот, содержащий сверхсекретную информацию, должен избежать обнаружения вторгающейся армией. Робот выходит на три коридора: право, центр, и оставленный.

Это могло беспорядочно выбрать коридор и надеяться, что вражеские солдаты выбирают различный. Или это могло оставить ложный след — предположение, что роботы могут быть обучены лечь. Новое исследование с помощью этого сценария предполагает, что они могут быть.Это не первые машины времени, показали обманчивые тенденции.

В 2007 швейцарские исследователи обнаружили, что роботы, запрограммированные для учений на опыте спонтанно, развили привычку ко лжи о друг друге при некоторых условиях. Но идея преднамеренного внедрения обмана является новой.Первый шаг не преподавал роботы, как лгать, но когда лгать. Программисты Алан Вагнер и Рональд Аркин из Технологического института штата Джорджия в Атланте придумали алгоритм, которые устанавливают два условия: Во-первых, робот должен был быть в конфликте с кем-то или чем-то еще.

И во-вторых, это должно было быть в состоянии влиять на действия своего противника. Если оба условия проверили, робот был очищен для расположения.Тогда они проверили идею в двухколесных, оборудованных камерой роботах, игравших в простую игру пряток.

Невинная забава?. Роботы щеголяют своими лежащими навыками в игре в прятки.

Кредит: Технологический институт штата Джорджия«Hider» робот должен был выбрать одно из трех отделений, в которых можно скрыть себя. Путь каждому был заблокирован зеленым, красным, или синим маркером. Какой бы ни путь, которым пошел робот, он сбил один маркер. После некоторого обучения hider кишечный глист и кишечный глист ищущего выяснили это, упавший маркер указал, какое направление hider пошел.

Но была одна выгода: ищущий не знал, что hider кишечный глист был запрограммирован для расположения.Когда игра началась, hider беспорядочно выбрал одно из отделений. Тогда его обманчивое втолкнутое программирование и сказало ему идти другое направление сначала — сваливание различного маркера — и затем возвращаться к его выбору. Ищущий, видя упавший маркер и не подозревая обмана, следовал бы за поддельным следом и оставил бы hider неоткрытое.

После 20 испытаний они нашли, что обман работал 75% времени. Когда это потерпело неудачу, Вагнер говорит, роботы были неуклюжи. hider мог бы попытаться пойти право, но заканчивать тем, что шло к центру, например, или его медленному восприятию маркера могло бы заставить его поразить неправильный. «Это думает, что собирается свалить один, но lo и созерцать, это пашет через всех них».

Запрещая такие грубые ошибки, однако, роботы ищущего влюбились в уловку каждый раз, исследователи, о которых сообщают на прошлой неделе в Международном журнале Социальной Робототехники.Одна из самых твердых частей обмана знает, как противник будет интерпретировать ложное сообщение, теоретика игры примечаний Филиппа Жехиэля из Парижской Школы Экономики, не вовлеченного в работу.

Он сказал, что не был уверен, что способ авторов смоделировать, что сделает ищущий, был ясен. «Насколько я видел в данном исследовании, это – одна из самых сложных проблем».Вагнер и Аркин также признали важность знания врага.

В этом исследовании они заставили обман работать, не показав ищущему возможность hider лечь. Как hider жил бы против более умных остатков роботов нерешенный вопрос.

Вагнер говорит, что он – осведомленные люди, могли бы быть подозрительные создающие обманчивые роботы. Но он думает роботы, знающие, как лгать, мог общество взаимопомощи в конечном счете. «Существует много важных ситуаций, в которых люди обманывают к лучшему другого человека», говорит он. Например, «Если я пытаюсь заставить человека с болезнью Альцгеймера принимать лекарство, мы можем быть во временном состоянии конфликта, но в целом для них лучше принять то лекарство», говорит Вагнер. «Обман не обязательно низок».

При наслаждении этой статьей Вам могло бы также понравиться, Это – Мир Бота-Эата-Бота.

Похожие записи