Re[1]: Техническое задание
From: Eugene Kornienko ( korn@glasnet.ru ) Date: 1999-11-18 20:49
Конечно, слишком общее "техническое" задание из
моего предыдущего
сообщения совсем не простое. Можно считать его задачей-максимум.
В этом сообщении я хочу привести задачу-минимум. Это действительно
выполнимая задача, и её решение может служить тестом на
возможность
продвижения к более сложной задаче: созданию абстрактного
мозга с
большим числом информационных каналов.
Проблему создания адаптирующейся системы (существа)
можно сформулировать так.
Задана целевая функция "желание" или "потребность"
W(S).
S(t) - данные, поставляемые органами чувств.
Система вырабатывает действия E(t) по отношению к миру.
Ощущения S(t) в какой-то степени (но далеко не однозначно)
зависят от
этих действий. Требуется найти такие действия E(t), чтобы
минимизировать
текущее среднее значение целевой функции W(S(t)).
При решении такой задачи можно использовать знания о мире,
а можно
пытаться создать универсальные средства адаптации. По-моему,
создание
искусственного сознания лежит на пути универсальной адаптации.
Попробуем построить простейшую, но всё же универсальную в
своём классе
систему, демонстрирующую способность к самообучению.
В этом примере не нужно вводить случайных, не обусловленных
поведением
E(t), влияний мира на S(t). Пусть всё будет строго закономерно.
Пусть W==S(t) - это поток чисел. 0 означает, что потребность
удовлетворена, 1 - не удовлетворена. Значение числа W имеет
предопределённый смысл для системы. Можно интерпретировать
его как
безусловный рефлекс - жизненно необходимую потребность.
Действие системы E(t) тоже представляет собой поток чисел.
Будем
интерпретировать это действие, как перемещение "точки"
по окружности.
E=0 - перемещение на dx по часовой стрелке, E=1 - перемещение
на dx
против часовой стрелки. Перемещающаяся точка - это и есть
наше
искусственное существо, а окружность - это геометрия мира,
в котором оно
живёт.
В одной из точек окружности, например, там где у часов находится
цифра
12, размещён "стимул". Наше существо имеет только
одно
"детерминированное" чувство W=S(t).
S=0 при совпадении координаты существа с координатой стимула,
и S=1 если эти координаты не совпадают.
Требуется построить алгоритм поиска оптимального поведения
E(t),
обеспечивающее минимальное среднее значение W(S(t)).
Важно учесть следующее ограничение:
Алгоритм поиска поведения, а также датчики S и E должны быть
изолированы от сведений о том, что E(t) имеет смысл перемещения
по
окружности. Координаты точки и стимула, значение dx, направление
перемещения не должны быть доступны этому алгоритму. E(t)
должно
зависеть только от S(t).
В терминах объектной независимости это означает, что система содержит
(1) Мозг, получающий поток W(t) и вырабатывающий поток e(t).
Только мозг занимается поиском оптимального поведения e(t).
(2) Орган чувств S, вырабатывающий сигнал 0 и 1 в зависимости
от наличия
или отсутствия контакта со стимулом.
(3) Датчик желания,
вырабатывающий сигнал W(t) в зависимости от значения S(t).
(4) Орган действия E, получающий от мозга сигнал e(t) и вырабатывающий
"направление движения" E(t) по отношению к миру.
(5) Внешний мир, перемещающий точку вдоль окружности в зависимости
от
сигнала E(t). Кроме того, внешний мир сообщает органу S
о наличии
контакта точки со стимулом.
Если вам не до конца ясна задача изолированности указанных
объектов, то
представьте себе, что блок "внешний мир" и блок
"органы и датчики"
разрабатывает жюри. Вы не знаете об устройстве этих объектов
и об их
"интерпретации" сигналов мозга, который разрабатываете
вы.
Правильное поведение нашего существа, которое оно должно изобрести
самостоятельно, заключается в суетливых движениях влево-вправо
около
стимула.
Желаю удачной охоты!