Re[1]: Техническое задание

From: Eugene Kornienko ( korn@glasnet.ru ) Date: 1999-11-18 20:49

Конечно, слишком общее "техническое" задание из моего предыдущего
сообщения совсем не простое. Можно считать его задачей-максимум.

В этом сообщении я хочу привести задачу-минимум. Это действительно
выполнимая задача, и её решение может служить тестом на возможность
продвижения к более сложной задаче: созданию абстрактного мозга с
большим числом информационных каналов.

Проблему создания адаптирующейся системы (существа)
можно сформулировать так.

Задана целевая функция "желание" или "потребность" W(S).
S(t) - данные, поставляемые органами чувств.
Система вырабатывает действия E(t) по отношению к миру.
Ощущения S(t) в какой-то степени (но далеко не однозначно) зависят от
этих действий. Требуется найти такие действия E(t), чтобы минимизировать
текущее среднее значение целевой функции W(S(t)).

При решении такой задачи можно использовать знания о мире, а можно
пытаться создать универсальные средства адаптации. По-моему, создание
искусственного сознания лежит на пути универсальной адаптации.

Попробуем построить простейшую, но всё же универсальную в своём классе
систему, демонстрирующую способность к самообучению.

В этом примере не нужно вводить случайных, не обусловленных поведением
E(t), влияний мира на S(t). Пусть всё будет строго закономерно.

Пусть W==S(t) - это поток чисел. 0 означает, что потребность
удовлетворена, 1 - не удовлетворена. Значение числа W имеет
предопределённый смысл для системы. Можно интерпретировать его как
безусловный рефлекс - жизненно необходимую потребность.

Действие системы E(t) тоже представляет собой поток чисел. Будем
интерпретировать это действие, как перемещение "точки" по окружности.
E=0 - перемещение на dx по часовой стрелке, E=1 - перемещение на dx
против часовой стрелки. Перемещающаяся точка - это и есть наше
искусственное существо, а окружность - это геометрия мира, в котором оно
живёт.

В одной из точек окружности, например, там где у часов находится цифра
12, размещён "стимул". Наше существо имеет только одно
"детерминированное" чувство W=S(t).
S=0 при совпадении координаты существа с координатой стимула,
и S=1 если эти координаты не совпадают.

Требуется построить алгоритм поиска оптимального поведения E(t),
обеспечивающее минимальное среднее значение W(S(t)).

Важно учесть следующее ограничение:

Алгоритм поиска поведения, а также датчики S и E должны быть
изолированы от сведений о том, что E(t) имеет смысл перемещения по
окружности. Координаты точки и стимула, значение dx, направление
перемещения не должны быть доступны этому алгоритму. E(t) должно
зависеть только от S(t).

В терминах объектной независимости это означает, что система содержит

(1) Мозг, получающий поток W(t) и вырабатывающий поток e(t).
Только мозг занимается поиском оптимального поведения e(t).

(2) Орган чувств S, вырабатывающий сигнал 0 и 1 в зависимости от наличия
или отсутствия контакта со стимулом.

(3) Датчик желания,
вырабатывающий сигнал W(t) в зависимости от значения S(t).

(4) Орган действия E, получающий от мозга сигнал e(t) и вырабатывающий
"направление движения" E(t) по отношению к миру.

(5) Внешний мир, перемещающий точку вдоль окружности в зависимости от
сигнала E(t). Кроме того, внешний мир сообщает органу S о наличии
контакта точки со стимулом.

Если вам не до конца ясна задача изолированности указанных объектов, то
представьте себе, что блок "внешний мир" и блок "органы и датчики"
разрабатывает жюри. Вы не знаете об устройстве этих объектов и об их
"интерпретации" сигналов мозга, который разрабатываете вы.

Правильное поведение нашего существа, которое оно должно изобрести
самостоятельно, заключается в суетливых движениях влево-вправо около
стимула.

Желаю удачной охоты!