Re[1]: Зрение и ии (to оп)

From: 3DValeri Anisimov ( va@mail.rcom.ru ) Date: 2001-01-17 12:47

Posted-From: 193.251.59.79

Привет всем членам клуба любителей естественного и искусственного И., и, конкретно, Оп-у.

> Согласен, что без возможности обеспечить real time строить робота бессмысленно. В любом случае говорить о цифрах не имея конкретных данных конкретного проекта так же бессмысленно.

Я как раз сейчас и занимаюсь проработкой подобного проекта. Мини-робот Лего у меня уже есть.
Осталось купить веб-камеру, прикрепить ее ему на голову и заняться разработкой соотв. софта.
Для начала работать, видимо, придется на разрешении где-нибудь 320x240 с частотой обработки
кадров что-нибудь вроде 1 кадра в сек. Так что вначале особой шустростью он, видимо, отличаться
не будет. Скорее всего, по своей двигательной активности он будет напоминать черепаху на суше...
Но по мере повышения тактовой частоты компьютеров, "доступных по цене", надеюсь постепенно
повысить скорость восприятия им окружающей среды (и соотв. его реакций) до 10 кадров/сек, и,
возможно, повысить разрешение изображения хотя бы до 640x480.

> О какой рукописи речь? Если о слитной, то было бы интересно узнать мнение специалиста о состоянии дел в этой области в мире. Как быть со словами “шишка”, ”гашиш” и т.д. ведь по буквам их распознать в принципе невозможно, необходим спец. словарь. Наверняка возможны случаи, когда слово можно распознать только по его смысловому окружению, тут уже и словарь не поможет.

Речь о слитной рукописи. Если же говорить конкретно, то тут тремя строчками не отделаешься, нужно писать небольшой обзор текущего состояния проблемы в мире. В принципе, если народу это интересно, и модераторы не возрожают, я мог бы подготовить такой обзорчик, и поместить его в конференции...

> Само собой. Но согласитесь, что механизм распознавания текста у человека и OCR алгоритма различаются принципиально (даже если абстрагироваться от параллельности мозга) так что возможно, что современные алгоритмы далеко не самый эффективный (в смысле экономичный) способ распознавания.

То, что современные алгоритмы, пока еще не предел совершенства, никто и не спорит. А вот насчет принципиального различия, я бы так категорично не заявлял... Скорее, наоборот. Можно найти очень даже много принципиальных стратегичексих совпадений. А различия, скорее, в тактике и механизмах реализации, а не в общих принципах функционирования.

>>а мне почему-то так не кажется :) Общее
>> количество нейронов, занимающихся в мозгу
>> обработкой зрительной информации, составляет
>> значительную часть от всех нейронов мозга.
>> Это, видимо, то же о чем-то да говорит...

> Есть какие-то конкретные цифры? Мои цифры говорят совсем о другом. Площадь первичной зрительной коры (поле 17 на карте Бродмана) составляет менее 5% от общей площади. Даже если учесть что первичная зрительная кора относится к гранулярному типу и плотность нейронов в ней больше, чем в среднем по коре мозга, то кардинально это ничего не меняет, хотя бы потому, что гранулярная кора свойственна и другим участкам сенсорной коры- первичной слуховой, соматосенсорной и даже некоторым участкам фронтальной ассоциативной коры. Возьмем вторичную зрительную кору (скажем, поле 18), которая по площади больше первичной раза в два. В ней уже достаточно широко представлена афферентация из других отделов сенсорной и ассоциативной коры и из лимбической системы. Даже поступают копии сигналов из моторной коры. Поэтому говорить, что она занимается исключительно обработкой зрительных сигналов уже нельзя. Про ассоциативную кору я вообще молчу. Там варится такой мультисенсорный коктейль, что до сих пор не знают, с какой стороны к нему подступиться.

Я, вообще-то, не большой знаток в нейробиологии и о картах Бродмана имею весьма слабое представление. Но, все же, попробую ответить.

1. К нейронам первичной зрительной коры я бы добавил и ганглиозные клетки, расположенные непосредственно в глазу (фактически, это вынеснная на перифирию часть мозга).

2. Как любят писать а популярных книжках "человек не использует и 10% возможностей своего мозга". Ну, 10% это, наверное, преувеличение, но вот 50% вполне может действительно никогда не использоваться. Ведь если бы все нейроны использовались на 100%, то это бы означало, что обучение новому возможно толлько за счет забывания чего-то старого, чего экспериментально не наблюдается. А то что первичная зрительная кора используется практически на все сто довольно очевидно.

3. Хочу отметить, что все отмеченные вами части мозга с гранулярной корой свойственны именно участкам, ответственным за обработку информации, поступающей извне, а отнюдь не за работу с информацией символьно-семантического типа.

4. Должны быть еще определенные участки мозга, ответственные за хранение информации (воспоминаний и т.д.) в образно-ассоциативном виде, которые тоже самым непосредственным оьразом связаны со зрительныит функциями.

> У нейронов есть одно замечательное свойство- они атрофируются, если по ним долгое время не проходят сигналы- это один из важнейших механизмов пластичности памяти. Сначала они просто начинают плохо проводить сигналы(повышается порог). Затем рзаветвленная сеть их синапсов и дендритов постепенно как бы рассасывается. Так вот, все что я сказал подтверждается простым опытом : помещением новорожденного котенка в абсолютно темное помещение. После нескольких месяцев заточения значительная атрофия наблюдается только в первичной зрительной коре. Можно конечно сказать, что часть нейронов вторичной зоны меняет модальность на другие виды сенсорики, но возможности подобного компенсаторного механизма весьма ограничены и погоды он не делает.

Я бы не взялся утверждать столь категорично. По моей информации проводились опыты, в которых у новорожденного котенка разрушали участок мозга, ответственный за обработку зрительных сигналов. В результате, котенок все-равно научился видеть, причем функции участков, связанных с обработкой зрительной информации, взяли на себя другие участки мозга, в частности, участок слуховой коры.

> Во-первых мне в принципе по барабану какой конкретно смысл она там вкладывает. Телепатия не мой профиль. Мне достаточно получать адекватные ответы на мои вопросы.

Что бы получать полностью адекватные ответы на свои вопросы, лучше всего разговаривать с калькулятором. Ты его спрашиваешь - сколько будет дважды два? А он тебе на 100% правильно и адекватно отвечает - 4 :) И никакой неясности и двусмысленности. Только вот этого ли действительно мы хотим?

> Во-вторых если она будет обучаться нормальными людьми на базе их собственного опыта, то почему должно возникать непонимание?

У меня лично все это вызывает ассоциации с некой экспертной системой, которую эксперты - "нормальные люди" пытаются научить поддерживать разговор на общие темы. И, честно говоря, такие ассоциации энтузиазма не вызывают...

> Вы просто не думали об этом. Попробуйте уделить минут 5 своего времени семантическому конструированию (или моделированию- как угодно) и подобные заявления отпадут сами собой.

Я ничего не имею против семантического конструирования (моделирования) при помощи, скажем, семантических сетей. Как составляющая ИИ оно, несомненно, может быть очень полезно. Но я против преувеличения его роли как единственного, необходимого и достаточного для реализации ИИ компонента. Другими словами, сначала нужно подвести базис (органы чувств и системы обработки соотв. сигналов), и только потом, на основе этого - логическая компонента, реализованная, возможно, на основе идей семантических сетей.

> Сделайте 128х128 как у COG’а (будет выигрыш в 18 раз)

А еще лучше - 4x4 :) Если, конечно, как говаривал Жванецкий, вас не интересует конечный результат...