На главную / Философия и психология / Конрад Лоренц. Оборотная сторона зеркала. Главы 1-7

Конрад Лоренц. Оборотная сторона зеркала. Главы 1-7

| Печать |


 

Глава 6

 

Обратное сообщение об успехе и обучение посредством положительного подкрепления (conditioning by reinforcement)

 

1. Новая обратная связь

Все животные, у которых центральная нервная система достигла определенного уровня дифференциации – головоногие, ракообразные, паукообразные, насекомые и позвоночные, включая человека, – обладают способностью к приобретению знаний, превосходящей по эффективности все до сих пор рассмотренные когнитивные механизмы: способностью к обучению в более узком смысле слова. Психологи, далекие от биологии и ничего не знавшие о конвергентном приспособлении,* сделали из наличия такой способности у столь многих различных организмов ошибочный вывод, что в этом случае мы имеем дело с первичным феноменом - основной формой приобретения знаний и даже единственным элементом всякого поведения. В действительности же у этих пяти групп животных нервный аппарат, лежащий в основе функции, о которой идет речь, развился в ходе конвергентного приспособления столь же независимо, как глаза и конечности, также независимо возникшие в каждой из этих групп.

Обучение на успехах и неудачах (durch Erfolg und Mißerfolg) возникло как типичная фульгурация в смысле, объясненном ранее, благодаря установлению новой связи между уже существовавшими механизмами, способными действовать независимо друг от друга. С функциями всех этих механизмов мы уже познакомились.

Поведенческий комплекс, который Гейнрот назвал свойственным виду импульсивным поведением (arteigene Triebhandlung), состоит, как мы уже знаем, из аппетентного поведения, срабатывания врожденного механизма запуска и генетически запрограммированной последовательности форм поведения, в результате которой достигается заключительная ситуация, удовлетворяющая побуждение. Эта цепочка из трех отдельных процессов является фундаментом, на котором были выстроены все виды обучения на успехах и неудачах (conditioning). Линейная последовательность процессов приобретает новые неожиданные системные свойства благодаря "изобретению", в самом подлинном смысле слова эпохальному: обратному модифицирующему воздействию успешного завершения процесса на формы поведения, с которых он начинается.

Если процесс как целое приводит к успеху, способствующему сохранению вида, то это обратное воздействие усиливает (verstärkt) формы движения, служащие для поиска и вошедшие в аппетентное поведение более или менее случайно; в противном случае оно их ослабляет. Иными словами, успех действует как то, что обычно называют "вознаграждением" (Belohnung), а неудача – как то, что называют "наказанием" (Strafe). В литературе на английском языке все, что ведет таким образом к усилению или "положительному подкреплению" предыдущего поведения, называется reinforcement [Усиление (англ.)]. К сожалению, это слово употребляют и психологи, пишущие по-немецки; напрашивающиеся немецкие термины отвергаются ими как "субъективистские". Поскольку это понятие восходит к Ивану Петровичу Павлову, я попросил одну из моих сотрудниц, хорошо знающую русский язык, выяснить, где он впервые употребил соответствующий термин и как он звучал по-русски. Оказалось, что великий физиолог написал свои ранние работы, где он ввел это понятие, по-немецки и использовал слова "Verstarkung" [Усиление (нем.)] и "verstärken" [Усиливать (нем.)]. Такой выбор немецких слов кажется мне не вполне удачным. То, что достигается рассматриваемым процессом обучения, можно лучше всего выразить, сказав, что успех подкрепляет (bestärkt) ведущее к нему поведение животного.

Вместе с новой обратной связью возникает когнитивный процесс, однократное использование которого дает индивиду больше сохраняющегося знания, чем мог бы дать метод генома в самом благоприятном случае за время жизни целого поколения, – по меньшей мере вдвое больше, поскольку с помощью этого процесса индивид может получать информацию не только из успеха, как геном, но и из неудачи. Кроме того, в этом процессе не перебираются вслепую, как при работе генома, всевозможные существенные и несущественные факторы: он опирается на надежно испытанные врожденные рабочие гипотезы, которые прочно встроены в систему поведения всех высших животных в форме механизмов получения мгновенной информации, описанных в главе 4. Тем самым модификация поведения методом успеха и неудачи с самого начала направляется в сторону большей вероятности успеха. Не случайно "с самого начала" по-латыни звучит "a priori"*. Мы займемся этим подробнее в разделах, посвященных пониманию и обучению.

Ввиду большой эффективности возникающего таким образом нового когнитивного аппарата понятно, что среди высших животных, способных к быстрому передвижению, могут выдерживать конкуренцию лишь те, которые им обладают.

 

2. Минимальная сложность системы

С другой стороны, из сказанного ясно, почему обучение на успехах не могло возникнуть у одноклеточных и низших многоклеточных животных, не обладающих центральной нервной системой. Система, которая в состоянии оценить как источник знания успех или неудачу некоторой ранее использованной формы поведения и воспользоваться результатом оценки для обратного модифицирующего воздействия на механизм этой формы поведения, – такая система, разумеется, имеет предпосылкой существование нескольких не слишком простых подсистем, действие которых должно быть очень хорошо организовано. Об этих подсистемах и их действии мы говорили в разделе о свойственном виду импульсивном поведении.

Легче всего представить себе механизм, подкрепляющий те формы поведения животного, которые ведут просто к удовлетворению потребностей тканей. В этом случае было бы достаточно единственного "датчика" (“Fühler”), регистрирующего наличие или отсутствие некоторого необходимого для жизни вещества и сообщающего об этом аппарату предыдущего поведения. В отдельных случаях такая простейшая возможность настоящей условной реакции в самом деле осуществляется – например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, адаптивная модификация систем поведения настоящим обучением должна удовлетворять – и в большинстве случаев удовлетворяет – следующим трем условиям.

Во-первых, форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую разнообразные возможности адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно большой запас генетической информации.

Во-вторых, должна каким-то образом "заноситься в протокол" или "запоминаться" форма, которую имели вводные звенья цепи действий при ее последнем выполнении, и эта «запись» должна быть связана с обратным сообщением об успехе.

В-третьих, это обратное сообщение должно быть достаточно надежным. Заключительное действие, которым удовлетворяется побуждение – т. е. "consummatory act" [Заключительное действие" (англ.), от consummate — доводить до конца, завершать] в смысле Уоллеса Крейга или, в случае аппетенции к состояниям покоя в смысле Мейер-Гольцапфель, целевая стимулирующая ситуация - должно настолько четко распознаваться с помощью внутренних и внешних рецепторных процессов, чтобы ошибочное сообщение об успехе или неудаче было с достаточной вероятностью исключено. Иными словами: рецепторный аппарат, передающий обратные сообщения, должен выполнять функции, аналогичные функциям врожденного механизма запуска. Более простую мысленную модель физиологического аппарата, осуществляющего обучение на успехах (conditioning by reinforcement), невозможно себе представить.

Поэтому система поведения, способная к такой функции, ни в каких случаях не может быть простым "рефлексом", как подсказывает терминология И. П. Павлова. Конечно, простые "рефлекторные" реакции избегания, рассмотренные в разделе 7 главы 5, которые возникают благодаря простой ассоциации между реакцией бегства и приобретенным запускающим действием некоторой стимулирующей ситуации, внешне сходны с процессами обучения, о которых мы сейчас говорим. Но не известно ни одного случая, когда удалось бы адаптивно модифицировать некоторую систему поведения посредством подкрепляющих, т. е. положительно действующих, "вознаграждающих" стимулов без участия аппетентного поведения. На это обстоятельство уже давно указал Э. Ч. Толмен.

Даже в классическом случае условного слюнного "рефлекса", исследованном И. П. Павловым, это отнюдь не единственный рефлекторный процесс, усиливаемый подкреплением; напротив, слюноотделение составляет лишь малую часть гораздо более сложной последовательности форм поведения, большинство из которых, однако, в классическом лабораторном опыте выключается простым способом: на собаку надевают искусно сконструированную кожаную сбрую, почти не позволяющую ей двигаться. Мой покойный друг Говард Лиделл, работая в качестве приглашенного сотрудника в одной из лабораторий Павлова, вызвал неприятное удивление, поставив неортодоксальный опыт. Сначала он сформировал у собаки условный рефлекс на ускорение тиканья метронома, а когда этот стимул стал безотказно приводить к слюноотделению, освободил ее от уз. Тогда собака сразу подбежала к метроному, продолжавшему равномерно тикать, и начала к нему ластиться, подпрыгивая, виляя хвостом и скуля – то есть повела себя в точности как при выпрашивании еды у хозяина или старшего товарища по стае. При этом у нее интенсивно выделялась слюна, хотя метроном не ускорил хода, так что условный стимул вовсе не предлагался. У общественных псовых (Canidae) выпрашивание корма и взаимное кормление широко распространены. Согласно Крайслеру, волки уже в годовалом возрасте кормят более молодых чужих волчат; у гиеновых собак (Lycaon pictus L.) удачливый охотник кормит всех членов стаи. У обоих этих видов врожденные координации выпрашивания – такие же, как у домашней собаки. Именно они, а вовсе не одно только отделение слюны, воплощают реакцию, которая в классическом опыте предстает как условная!

Меньше всего я склонен преуменьшать значение опытов Павлова. Искусственно изолировать отдельную реакцию вполне законно, особенно если это предоставляет такие хорошие возможности количественного исследования, как слюноотделение у собаки. Но необходимо помнить, что при этом мы вырезаем кусок из системы. Совершенно недопустимо впадать в заблуждение, к которому склонны некоторые люди с несомненными аналитическими способностями, полагающие, что система состоит теперь только из одной изолированной части и ее достаточно, чтобы понять все свойства системы как целого.

Если мы теперь посмотрим на важнейшие известные в настоящее время факты, относящиеся к возникновению условных реакций при подкреплении (reinforcement), с точки зрения биологического системного анализа, мы увидим, что они полностью подтверждают изложенное здесь мнение: положительное подкрепление посредством вознаграждения есть важный критерий «настоящей» условной реакции. В перечень "обусловливаемых" («bedingbarer») реакций, приведенный в книге К. Фоппа, вкралось несколько случаев, в которых реакция избегания, основанная на простой ассоциации, ошибочно принимается за настоящее "conditioning" ["Кондиционирование" (англ.) в смысле формирования условных реакций].

 

3. Поиск энграммы*

Прежде чем обратиться к вопросу, на какие части модифицируемой обучением целостной системы воздействует адаптивная модификация и откуда исходит обусловливающая это воздействие новая информация, я хотел бы высказать некоторые общие соображения о физиологической природе обучения и памяти.

Поиск энграммы – знака в памяти*, оставляемого обучением, – до сих пор остается удручающе бесплодным. К. С. Лешли снабдил свой остроумный доклад "In Search of the Engram" ["В поисках энграммы" (англ.)] подзаголовком "Thirty years of frustration" ["Тридцать лет фрустрации" (англ.)]. На самом же деле тщательные исследования Лешли позволяют – наряду с другими очень важными выводами – заключить, что энграмма не локализована в каком-либо определенном месте мозга, а представляет собой организацию, связывающую всевозможные его части. Однако мы и сегодня не можем сказать, какие физиологические процессы лежат в ее основе. Поэтому многие серьезные исследователи сразу после открытия генетического кодирования информации в цепных молекулах выдвинули гипотезу, что знание, приобретенное в индивидуальном опыте и хранимое в памяти, закрепляется таким же способом. Однако эта гипотеза вызывает большие сомнения. Если бы она была верна, должны были бы существовать два независимо действующих механизма, один из которых сразу "записывает на пленку" все поступающие нервные импульсы, т. е. преобразует их временну?ю последовательность в пространственную конфигурацию цепной молекулы, кодирующую воспринятые факты, а второй способен считывать сообщения, записанные с помощью этого химического кода, и преобразовывать их в нервные импульсы, координированные во времени и пространстве. Не говоря уже о том, что это вообще маловероятно, с помощью такой гипотезы невозможно объяснить, почему у всех известных живых существ способность к обучению находится в прямом отношении к числу ганглионарных клеток и вообще к размерам и дифференцированности центральной нервной системы. В последнее время биохимики показали, что химическое кодирование индивидуально приобретенной информации в цепных молекулах невозможно по временны?м причинам. Поскольку, кроме того, значительную часть результатов, якобы подтверждавших возможность химической передачи индивидуально приобретенной информации, при критической проверке воспроизвести не удается, я придерживаюсь допущения, что все функции обучения, во всяком случае в той мере, в какой они обусловливают более сложные адаптивные модификации поведения, осуществляются в синапсах, т. е. в местах связи отдельных нервных элементов, и что эти изменения, как уже говорилось, ближе всего родственны эмбриогенетическим процессам индукции. Это не означает, однако, что изменения в кодах цепных молекул не могут играть никакой роли в таких локальных явлениях.

 

4. Врожденные наставники

Открытая программа механизмов поведения, которую каждому индивиду в начале жизненного пути дают в дорогу благодаря своему эволюционному развитию его предки, всегда сконструирована надежно испытанным способом – так, что конкретный характер и осуществление во времени и пространстве условий окружающей среды, на которые должны реагировать ее изменяемые части, оставленные открытыми, непредсказуемы, но в жизни индивида эти условия достаточно постоянны, чтобы оправдать хранение соответствующей информации. Только что вылупившийся серый гусенок не может знать, как выглядят его родители, за которыми ему придется следовать несколько месяцев; молодая пчела не может иметь врожденной информации о топографии окрестностей ее улья. Хорошие примеры установок на обучение, позволяющих приобретать существенную информацию, которую невозможно получить ни от генома, ни от механизмов получения мгновенной информации, дают способность узнавать отдельных собратьев по виду и способность вырабатывать путевые привычки.

С другой стороны, как мы знаем, именно открытая программа имеет своей предпосылкой большое количество филогенетически приобретенной информации, связанной с геномом. Эта информация преобразуется в целесообразное поведение животного не путем морфогенетического* развития, а совсем иначе. Разумеется, сначала морфогенез создает на основе этой информации вполне определенные нейтральные организации – такие, как, например, врожденная установка на обучение, позволяющая мгновенно ассоциировать очень сильный стимул к бегству с сопровождающей его целостной стимулирующей ситуацией. Описанная в разделе 2 настоящей главы структура аппарата подкрепления успехом также, разумеется, основана на информации, содержащейся в геноме. Оставаясь в пределах естественнонаучного объяснения, невозможно представить, чтобы информация, содержащаяся в геноме, могла преобразовываться в способствующее сохранению вида поведение каким-либо иным способом, чем посредством построения реальных структур нервной системы и органов чувств.

Именно эти структуры направляют обучение на целесообразные пути. Благодаря им возникают врожденные "наставники", заботящиеся о том, чтобы открытые места различных программ всегда заполнялись способом, способствующим сохранению вида. Как уже не раз говорилось, сами эти структуры должны быть как можно меньше подвержены изменениям вследствие модификации, чтобы ничего не потерять из содержащейся в них врожденной информации. Если в некоторой системе форм поведения имеется подсистема, способная к сильной модификации посредством обучения, это неизбежно предполагает, что резистентность других подсистем по отношению к модификациям достаточна, чтобы обеспечить выполнение «учебной программы» той части, которая поддается модификации.

Если не допускать сверхъестественных факторов, например предустановленной гармонии между организмом и окружающим миром, то для объяснения очевидного видосохраняющего действия большинства процессов обучения необходимо постулировать существование врожденных «обучающих механизмов». Эти наставники принадлежат к числу условий возможного опыта, соответствующих кантовскому определению априорного: врожденные наставники представляют собой то, что предшествует всякому обучению и должно ему предшествовать, чтобы обучение было возможно.

Отыскивать в сложной системе форм поведения, способной функционировать лишь при условии адаптивной модификации посредством обучения, те места, где содержится генетически закрепленная открытая программа процессов обучения – в высшей степени захватывающее предприятие для естествоиспытателя. Лежащая в основе всего этого информация, связанная с геномом, может находиться в самых различных механизмах органов чувств и нервной системы. Она может быть, например, сосредоточена в чисто рецепторных механизмах. При поведении того типа, который Уоллес Крейг назвал аверсией,* а я вслед за Моникой Мейер-Гольцапфель предпочитаю называть аппетенцией к состояниям покоя, это филогенетически запрограммированные рецепторные процессы, сообщающие организму, что во внешнем мире что-то "не в порядке". Может быть слишком сухо, слишком влажно, слишком тепло, слишком холодно, слишком светло, слишком темно, вода может быть слишком соленой или недостаточно соленой, биотоп может содержать слишком мало укрытий или слишком много препятствий для обзора, и т. д. и т. п. Моторное возбуждение, владеющее животным, пока продолжается "вызывающая аверсию" стимулирующая ситуация, может принимать самые разнообразные формы и происходить на самых разных уровнях организации, от простейшего кинезиса до сложных целенаправленных способов поведения, включающих обучение и понимание. Адаптивной модификации, если только животное ею располагает, подвержены все формы поведения, связанные с поиском пути. Как настоящие условные реакции, возникают путевые привычки, как можно быстрее удаляющие организм от помехи.

Еще один тип возникновения условных реакций, столь же широко распространенный и также имеющий простую врожденную программу, выполняет важную функцию – -поддерживает посредством внешнего поведения постоянные условия внутри организма, т. е. обеспечивает с помощью целесообразных реакций гомеостазы. По собственному опыту мы знаем, что получаем достоверные сообщения, когда в каком-либо из многочисленных регулирующих контуров нашего тела что-либо не в порядке. Сообщение "датчика" может иметь специфическую форму – например, при недостатке в тканях определенных веществ. Самые обычные примеры – голод и жажда. Первые бихевиористы, например, Торндайк, полагали, что удовлетворение потребностей тканей (tissue needs) является самым важным подтверждением, благодаря которому происходит приучение. При этом даже не ставился вопрос, откуда организм в целом и в особенности центральная нервная система может "знать", чего недостает и какими формами поведения можно восполнить недостаток.

Другой пример механизма, сообщающего о неблагополучии в несколько ином смысле, – чувство боли. Его специальная функция – локализация помехи: мы сразу узнаем, где непорядок, и нам не дозволяется о нем забыть. Но особенно интересны наименее поддающиеся локализации сообщения, которыми наше тело дает знать о нарушении его гомеостазов. В таких случаях мы можем лишь сказать, что нам плохо. Например, при слабой инфекции мы совершенно не в состоянии указать, в каком месте помеха, даже если чувствуем себя "очень скверно". Если же человека "тошнит", это уже более точная информация о месте. Если, например, тошнота была вызвана недоброкачественной пищей, то «свободные ассоциации» – как говорят психоаналитики – обычно приводят нас к чему-нибудь не совсем свежему, что мы съели накануне, и причинная связь становится для нас субъективно очевидной. Условные реакции избегания, возникающие вследствие таких переживаний, могут сохраняться долго – нередко всю жизнь.

Программа врожденного обучающего механизма, порождающего такие условные реакции и использующего неприятные ощущения для отрицательного подкрепления и приятные для положительного, может быть общей для всех случаев. Такому механизму достаточно иметь в каждом из многочисленных регулирующих контуров организма один датчик и наказывать за любое изменение, отклоняющееся от желательного номинального значения, а за любое приближающееся к нему вознаграждать. На этом принципе действительно основан механизм, определяющий выбор пищи у многих "всеядных", т. е. животных, потребляющих очень разнообразные питательные вещества. В поставленных уже довольно давно опытах Курта Рихтера крысы, которым предлагали различные необходимые для питания вещества по отдельности, в большом числе мисочек – белки были даже разложены на аминокислоты, – брали из каждой мисочки ровно столько, сколько требует хорошо рассчитанный рацион. Поскольку крыса не может иметь филогенетически приобретенной информации о том, из каких аминокислот синтезируются обычные для нее белковые вещества и в каких соотношениях они туда входят, она должна получать это знание из другого источника. Очень важные результаты, касающиеся программы врожденного обучающего механизма, с помощью которого крыса получает такую информацию, были получены в исследованиях X. Гарсиа и Ф. Р. Эрвина. Ее можно приучить к определенной пище или отучить от нее только ощущениями, локализованными в кишечнике. В качестве наказывающих стимулов экспериментаторы использовали инъекции апоморфина, вызывающие тошноту и рвоту, или дозу рентгеновского излучения, производящую такое же действие – так называемое "рентгеновское похмелье". Никакие попытки отучить крыс от некоторых питательных веществ посредством болевых стимулов и других сильнейших наказаний не приводили к цели. С другой стороны, с помощью указанных способов раздражения кишечника столь же невозможно было отучить крыс ни от каких форм поведения, кроме употребления определенной пищи.

Как в адаптивных модификациях аппетентного поведения при стремлении к состояниям покоя, так и при только что описанном самоприучении к определенной пище на передний план выступают условные реакции избегания. Поэтому говорить об аверсиях в более общем смысле, как делал Крейг, до известной степени правомерно. Но когда, например, животное переползает из более холодной среды в более теплую, невозможно решить объективно, избегает ли оно холода или ищет тепла; именно поэтому я предпочитаю термин Мейер-Гольцапфель. Однако несомненно, что в обоих случаях организм находится в состоянии возбуждения и именно снятие возбуждения действует как подкрепляющий стимул. Это тот самый тип подкрепления посредством снятия напряжения – relief of tension, – особую важность которого выяснил Ч. Л. Халл.

Существуют также поддающиеся модификации системы поведения, содержащие врожденную информацию не только в рецепторном механизме запуска, анализирующем стимулирующую ситуацию, но и в запускаемой наследственной координации. Хороший пример – постройка гнезда у галок (Coloeus monedula L.) и у других врановых (Corvidae). Стоя в центре будущего гнезда с материалом в клюве, птица прижимает его к основанию гнезда или уже построенным частям и втыкает его в них толкательным движением, направленным по широкому кругу в сторону и немного вниз и сопровождаемым своеобразным дрожанием. Если материал наталкивается на сопротивление, дрожание усиливается и непрерывное толкание превращается в ряд сильных ударов в одном направлении, механическое действие которых несколько напоминает действия человека, который никак не может прочистить трубку. Если птица держит веточку или что-либо подобное, она проталкивает ее до тех пор, пока наконец после долгих усилий не закрепит так, что ее невозможно будет сдвинуть ни вперед, ни назад. Как только это произошло, "дрожащее толкание" достигает оргиастического максимума и внезапно прекращается. Птица теряет теперь всякий интерес к объекту, а на мгновение и вообще к постройке гнезда. Дрожащее толкание с внезапным завершением, удовлетворяющим побуждение – типичный пример заключительного действия, "consummatory act" в смысле Уоллеса Крейга.

У галок и других врановых, в отличие от многих других певчих птиц, механизм запуска явно не содержит информации о том, чтo годится для постройки гнезда. Когда у них впервые просыпается побуждение строить гнездо, они приносят самые невероятные предметы и пытаются прикрепить их дрожащим толканием к подходящему месту. (Знание мест, подходящих для постройки гнезда, является у них врожденным.) Я видел галок и воронов, заталкивающих таким движением осколки стекла, старые патроны для электрических ламп и даже кусочки льда. Само собой, эти предметы не прикрепляются, так что не запускается заключительное действие, удовлетворяющее побуждение. И за очень короткое время птица научается использовать лишь такие предметы, которые при дрожащем толкании позволяют получать обратные сообщения, или "реафференции", запрограммированные в качестве подкреплений во врожденном обучающем механизме. Этих сообщений достаточно, чтобы научить птицу выбирать такие материалы, которые можно сплести инстинктивными движениями в очень прочное гнездо. Иногда этот врожденный наставник может допустить ошибку, что легко объяснить экономностью врожденной информации: проволока или полоски жести дают, конечно, очень сильные подкрепляющие реафференции, и может случиться, что птица приучится к такому материалу, биологически непригодному из-за своей теплопроводности. Вблизи промышленных предприятий не так уж редко встречаются металлические гнезда. Этот процесс представляет собой пример действия так называемого сверхнормального объекта; реакция на такой объект, как мы увидим дальше, напоминает по своему характеру порок.

Более сложны процессы обучения, интегрирующие в единую функцию различные инстинктивные движения при постройке гнезда у крыс. Как показал И. Эйбль-Эйбесфельдт, каждая отдельная форма наследственной координации, участвующая в этом процессе, является полностью врожденной. Но их последовательность является врожденной лишь в одном-единственном случае: крыса "знает" от рождения, что постройку гнезда надо начинать со сбора материала далеко от места будущего гнезда и доставки его на это место. Крысы, выращенные Эйбль-Эйбесфельдтом в клетках, где не было никаких предметов, которые можно было бы переносить с места на место, использовали в качестве замещающего объекта собственный хвост: брали его в зубы далеко от привычного места сна, несли «домой» и заботливо укладывали в нужном месте. Поскольку желательно было провести эксперимент над особями, не имеющими никакого опыта, пришлось повторить его над крысами, у которых в ранней молодости, задолго до проявления побуждений к постройке гнезда, был ампутирован хвост. Когда им после того, как они выросли, впервые предложили мягкие полоски бумаги, они сразу же принялись строить. Те из них, которые уже выбрали себе в помещении, где не было никаких перегородок, определенное место для сна, сразу стали складывать там принесенные бумажные полоски. Те же, которые до эксперимента спали то в одном, то в другом месте, решились выбрать место для гнезда лишь спустя несколько минут. Когда в помещении маленьким куском жести отгородили один угол, все подопытные животные стали строить гнезда в этом укрытии.

Строительная деятельность крыс, не имевших опыта, сильно отличалась от поведения нормальных контрольных животных, и это различие позволило сделать важные выводы. Вначале эта деятельность была намного интенсивнее. Подопытные животные с жадностью набросились на строительный материал, что объяснялось накоплением ни разу не отреагированных инстинктивных движений и чего, разумеется, следовало ожидать. Но существенное различие состояло в том, что они не следовали определенному порядку форм наследственных координаций, соблюдаемому при постройке гнезд опытными крысами. Опытная крыса, начав строить гнездо, носит материал до тех пор, пока он не наберется в значительном количестве. Затем она подтягивает его к себе концентрически, вращаясь вокруг вертикальной оси, так что образуется кольцеобразный вал с центром в середине гнезда. Лишь когда этот вал достигнет достаточной высоты, опытное животное переходит к так называемому "движению обойщика" – уплотняет и разглаживает внутреннюю стенку передними лапами. Каждую из этих форм движения подопытные животные Эйбля выполняли безукоризненно, и даже при замедленном показе кинопленки, на которую были засняты их движения, не обнаруживалось никаких отличий от опытных собратьев по виду. Но описанный только что порядок полностью отсутствовал: крысы поспешно прибегали с полоской бумаги, клали ее на пол и затем вперемешку, без всякого порядка выполняли в пустом пространстве движения укладки и разглаживания.

У крыс подверженная модификации система в целом сложнее, чем у галок, но каждый из множества врожденных механизмов обучения действует по тому же принципу. Приучение к определенной последовательности движений и ее поддержка в обоих случаях осуществляются посредством двух процессов: во-первых, посредством того, что данная форма наследственной координации позволяет получить вознаграждающее обратное сообщение лишь в совершенно определенной ситуации в окружающей среде, которая предусмотрена программой; во-вторых, посредством обратного сообщения об успехе или неудаче от экстероцепторных* и, вероятно, также проприоцепторных* механизмов.

Если инстинктивное движение, так сказать, тратится впустую, не вызывая никаких реафференций, то это действует, вероятно, так же, как прямое отрицательное подкрепление. Во всяком случае, при непосредственном наблюдении процессов обучения, о которых мы сейчас говорили, складывается впечатление, что движение укладки доставляет крысам гораздо большее удовлетворение и выполняется с бoльшим изяществом, если материал для укладывания уже собран, а "движение обойщика" вполне удовлетворяет их лишь при условии, что вал уже сооружен.

Для читателя, интересующегося теорией обучения, замечу, что процессы обучения, при которых бoльшая часть врожденной информации сосредоточена не в рецепторном секторе, а в самой наследственно координированной форме движения, могут быть охвачены понятием «оперантного» обучения (operant conditioning). Но в этом случае "оперант" представляет собой не простое часто используемое движение, такое, например, как царапание или копание передней лапой, которое может иногда по чистой случайности привести к подкрепляющему успеху – подобно нажатию рычажка в ящике Скиннера или в одном из старых "ящиков с секретом", – а высоко дифференцированное инстинктивное движение, которое можно использовать лишь для единственной специфической функции – именно той, ради которой оно выработано эволюцией данного вида.

В случае простых часто используемых форм движения справедливы закономерности, сформулированные Б. Ф. Скиннером для процесса обучения, который он назвал кондиционированием типа R. Первый из этих законов гласит, что сила операнта возрастает, если за ним следует подкрепляющая стимулирующая ситуация. Согласно второму закону, сила уже подкрепленного кондиционированием операнта убывает, если за ним не следует подкрепляющий стимул. Эти законы справедливы, если оперант представляет собой так называемую инструментальную реакцию – такую, как пространственное перемещение или другие простые формы движения, которые могут служить разным побуждениям. Если же оперант есть инстинктивное движение, аппетенция к которому мотивирует поведение животного, то эти законы справедливы лишь отчасти. В таком случае предшествующее движение в отдаленной перспективе, возможно, и будет подкреплено успехом, но в данный момент может даже совсем угаснуть. Пока что побуждение удовлетворено, и действие подкрепления станет заметным, лишь тогда, когда его сила снова возрастет. Но отсутствие подкрепления вовсе не заставляет животное отказаться от операнта. Поскольку он является наследственной координацией с автономным побуждением, отсутствие удовлетворения приводит лишь к тому, что животное стремится удовлетворить свою потребность в этой форме движения в других ситуациях и на других объектах, но со все возрастающей аппетенцией.

На это различие необходимо обратить внимание, потому что процесс проб и ошибок, описанный только что на примере галок и крыс и встречающийся, по существу в такой же форме, у очень многих животных, можно перепутать с так называемым исследовательским поведением, или поведением любопытства, о котором будет речь дальше.

В описанных только что процессах инстинктивное движение подвергается собственному автохтонному* мотивационному давлению, и эта форма движения – одна и та же, без изменений – испытывается на самых разнообразных объектах. В отличие от этого при настоящем поведении любопытства организм находится под действием мотивации совсем иного рода, не зависящей от давления, побуждающего к отдельному инстинктивному движению; это убедительно доказала Моника Мейер-Гольцапфель. При таком поведении животное испытывает не одно инстинктивное движение на различных объектах, а много инстинктивных движений, часто весь свой рабочий репертуар, выполняя их одно за другим, на одном объекте. Оба эти процесса обучения отличаются от классического "operant conditioning" тем, что при последнем "оперант" представляет собой инструментальную реакцию «общего назначения», которая может быть запущена под давлением самых разных мотиваций.

Особенно интересную и неожиданную локализацию врожденной информации открыл М. Кониси, исследуя развитие пения у молодых певчих птиц. Известно, что у многих видов этой группы неопытному птенцу необходимо услышать пение взрослого собрата по виду, чтобы у него развилось свойственное виду пение, нормальное во всех деталях. Кроме того, благодаря исследованиям И. Николаи был обнаружен поразительный факт: некоторые птицы, например снегири, учатся только у вполне определенных особей, с которыми они состоят в столь же определенных очень тесных социальных отношениях. Известно было также, что птенцы многих видов, которым приходится учиться путем подражания, берут за образец пение своего вида даже тогда, когда слышат много других птичьих голосов, среди которых голоса их собратьев по виду вовсе не самые заметные и громкие. Кроме того, Оскар Гейнрот заметил, что воспитанные в изоляции птенцы тех видов, которым необходим образец пения своих собратьев, после долгих попыток создают в конце концов песню, приблизительно похожую на свойственную их виду. Гейнрот предположил, что в этом случае происходит "самоподражание".

Все эти явления получают объяснение благодаря открытиям Кониси. Песни взрослых птиц, у которых он в самом раннем возрасте разрушил орган слуха, состояли не столько из музыкальных звуков, сколько из шумов, и не имели никакой структуры. Так было и у тех видов, у которых особи, выросшие в звукоизолирующих камерах, развивали у себя хорошо узнаваемое пение своего вида. Отсюда вытекает удивительный, но неизбежный вывод: птицы, не имеющие опыта, обладают рецепторным прообразом пения своего вида. Кониси называет его "auditory template" ["Слуховой шаблон" (англ.)]. Птица играет своим голосом, тихо напевает, пробует, как лепечущий ребенок, самые разнообразные комбинации звуков, и сохраняет лучше всего соответствующие акустическому шаблону ее вида, который она «слышит в воображении». Тихие напевы, которые наши любители птиц так мило называют "сочинением"*, носят, таким образом, характер исследовательской игры.

Приведенных примеров филогенетически запрограммированных обучающих механизмов достаточно, чтобы сделать три важных в контексте этой книги вывода.

Во-первых, в сложной системе поведения, способной к модификации, в принципе всегда можно найти с помощью экспериментального анализа ту подсистему, в которой содержится врожденная информация, позволяющая животному приучиться к формам поведения, целесообразным для сохранения вида.

Во-вторых, ни один процесс обучения невозможно понять, не зная всей системы, адаптивную модификацию которой он осуществляет.

В-третьих, невозможно сформулировать общие, справедливые для всякого обучения утверждения о том, чтo именно действует в качестве подкрепления ("reinforcement"). Как теория Торндайка, по которой сущностью подкрепления является удовлетворение потребностей тканей, так и теория Халла, видевшего существенный подкрепляющий фактор в снятии нервного напряжения ("relief of tension"), верны лишь для частных случаев. Физиологическую природу процесса подкрепления необходимо исследовать для каждого процесса обучения отдельно.

 

5. Подсистемы, подверженные модификации, и их адаптивная изменчивость

В предыдущем изложении - и более подробно в книге "Эволюция и модификация поведения" (Evolution and Modification of Behaviour, Harvard University Press, 1965) – я пытался показать, что невозможно допустить адаптивную модифицируемость всех вообще существующих частных процессов поведения, не прибегая к виталистическому постулату предустановленной гармонии между организмом и внешним миром. Само собой разумеется, что модифицируемость, служащая сохранению вида, всегда имеет предпосылкой возникшую в ходе эволюции открытую программу и сверх того обучающий механизм описанного в предыдущем разделе типа, также запрограммированный филогенетически. Всеобщая и неограниченная пластичность всех форм поведения была бы возможна лишь при наличии бесконечного множества такой информации и таких аппаратов обучения, допущение которого представляет собой очевидную нелепость.

 

6. Условная реакция, причинность и преобразование силы

Как уже было сказано в начале книги, очень часто в ходе приспособления к одной и той же внесубъективной обстановке возникают когнитивные аппараты различных уровней интеграции, и этот факт совершенно очевиден. Многие из таких аппаратов встречаются у животных разного уровня развития; нередко они функционируют одновременно, но независимо друг от друга у одного и того же вида. Так же обстоит дело и в случаях, о которых пойдет речь дальше.

Значение способности к образованию условных реакций состоит – как подчеркивает Э. Ч. Толмен в книге “Purposive Behaviour of Animals and Man” ["Целенаправленное поведение животных и человека" (англ.)] – в том, что она позволяет организму оценить некоторую комбинации стимулов, которая сама по себе биологического значения не имеет, как предзнаменование скорого наступления другой, жизненно важной ситуации, и сделать к ней приготовления.

Наблюдая полудиких коз армянского нагорья, я заметил, что уже при первых отдаленных раскатах грома они начинали искать в скалах подходящие пещеры, готовясь к возможному ливню. Так же они поступали, когда поблизости раздавался грохот взрывов. Я очень хорошо помню, что именно тогда мне внезапно стало ясно: в естественных условиях образование условных реакций способствует сохранению вида лишь том случае, когда условный стимул находится в причинной связи с безусловным.

"Post hoc" [После этого (лат.)], служащее предпосылкой того, что некоторая условная реакция выполняет функцию, способствующую сохранению вида, никогда не встречается в естественных условиях с надежной регулярностью, если нет причинных связей, которые в таком случае легко проследить. В принципе они присутствуют и тогда, когда экспериментатор перед кормлением павловской собаки регулярно заставляет звучать "сигнал еды". Правда, причинная детерминированность поведения самого исследователя пока что ускользает от нашего анализа.

Я полагаю, что доказательство телеономности условной реакции проливает свет на одну существенную ошибку в эмпиризме Юма, на которую указывает также Карл Р. Поппер в книге "Объективное знание". Как показал Юм, с точки зрения чистой логики никакое большое число повторений одной и той же последовательности событий не позволяет сделать вывод, что она должна повторяться и дальше; более того, нет оснований утверждать, что при увеличении числа повторений такое умозаключение становится более вероятным. В связи с этим логическим тезисом Юм ставит психологический вопрос: почему же каждый разумный человек уверен, что завтра снова взойдет солнце, лишенный опоры камень упадет на землю и вообще все в мире будет так же, как прежде? На этот вопрос великий эмпирист отвечает: это следствие привычки ("custom or habit"); иными словами, это происходит потому, что многократное повторение приводит в действие некоторый механизм ассоциации идей, без которого мы, как говорит Юм, были бы совершенно неспособны жить.

Как указывает Поппер, противоречие между логикой и человеческим здравым смыслом ("common sense") не только привело к тому, что многие мыслители отчаялись в возможности объективного знания, но и самого Юма заставило принять нерациональную теорию познания. Поппер говорит о нем: "Его открытие, что повторение не имеет никакой доказательной силы, хотя оно и играет главную роль в нашем познании и нашем "понимании", привело его к выводу, что рассудочные основания и разум играют в нашем понимании лишь подчиненную роль. Наше "знание" разоблачается: оказывается, что ему подобает лишь природа веры - и притом веры, которую разум не в состоянии защитить, то есть нерационального убеждения. (His result that repetition has no power whatever as an argument, although it dominates our cognitive life or our "understanding" led him to the conclusion that argument or reason plays only a minor role in our understanding. Our “knowledge” is unmasked as being not only of the nature of belief, but of rationally indefensible belief — of an irrational faith)*.

Из ясного рассуждения, с помощью которого Карл Поппер находит выход из этой апории, я приведу лишь два предложения; даже будучи вырванными из контекста, они свидетельствуют о фундаментальном совпадении между результатами логики и исследования поведения. Поппер пишет: "Различение логической и психологической проблем, вытекающее из их трактовки Юмом, я считаю чрезвычайно важным. Но его взгляд на то, что я назвал бы логикой, представляется мне неудовлетворительным. Он достаточно ясно описывает процессы правильного вывода, но рассматривает их как "рациональные" сознательные процессы". (I regard the distinction, implicit in Hume's treatment, between a logical and a psychological problem as of the utmost importance. But I do not think that Hume's view of what I am inclined to call "logic" is satisfactory. He describes, clearly enough, processes of valid inference, but he looks upon these as "rational" mental process).

Один из методических принципов Поппера состоит в том, чтобы переводить любую субъективную терминологию в объективирующую во всех случаях, когда в игру входят логические проблемы. Он говорит очень просто: "Что верно в логике, то верно и в психологии" (what is true in logic, is true in psychology). Этот принцип переводимости ("principle of transference"), связывающий субъективное с объективным, в точности соответствует нашему убеждению – высказанному уже в Пролегоменах – в фундаментальной тождественности всех процессов переживания с физиологическими процессами.

Логическое мышление – точно так же, как образование условных реакций и бесчисленные другие "психологические" процессы, – является функцией человеческого аппарата отображения мира, находящегося, как целое, в том отношении соответствия с фактами внесубъективной действительности, о котором мы уже неоднократно говорили. Печальный вывод из эмпиризма Юма, что все наше знание в действительности есть всего лишь ни на чем не основанная вера, был бы справедлив лишь в случае, если бы было верно утверждение: "Nihil est in intellectu quod non antefuerat in sensu" (в нашем разуме нет ничего, чего не было раньше в нашем чувственном восприятии).

Но мы знаем уже, насколько это утверждение ложно; мы знаем, что любой процесс приспособления есть когнитивный процесс и что данный нам a priori аппарат, с помощью которого только и возможно индивидуальное приобретение опыта, имеет своей предпосылкой огромную массу информации, полученной в ходе эволюции и хранящейся в геноме. Юм этого еще не знал – а бихевиористы не хотят знать.

Каждому из нас свойственно непреодолимое стремление при повторении некоторого события думать, что между отдельными одинаковыми явлениями есть какая-то связь, которую поначалу трудно определить точнее. Я хорошо помню, как, будучи школьником, долго не мог поверить учителю математики, что если колесо рулетки очень много раз остановилось на красном, от этого не возрастает вероятность того, что в следующий раз оно остановится на черном. В конце концов учитель убедил меня, сказав: "Подумай, ведь колесико не помнит, что было раньше. Каждый следующий запуск – точно такой же, как первый, с одинаковой вероятностью красного и черного". Очень многие люди говорили мне, что заметили у себя этот логически необъяснимый принудительный ход мысли. Возникает нелегкий, но интересный вопрос, какой же реальный механизм приписывается при этом колесу рулетки. От него как будто ожидают, как от живого существа, что после столь многих повторений оно устанет вести себя одинаково и захочет перейти к чему-то другому.

Гораздо легче ответить на вопрос, почему мы склонны, много раз пережив некоторую последовательность событий, считать уже происшедшие события верным предзнаменованием дальнейших таких же. Если бы внесубъективная действительность была подобна колесу рулетки и события в ней столь же случайно следовали одно за другим, такое принудительное мышление и определяемое им поведение были бы бессмысленны. Но чисто случайные события, порядок следования которых напоминал бы то, что происходит с колесом рулетки, в естественных условиях крайне редки. Напротив, последовательности явлений, в которых эффект преобразования силы причинно обусловливает регулярный порядок, не только часты, но поистине вездесущи. Когда за молнией следует гром или за отдаленным громом ливень, и эти явления хотя бы несколько раз следуют друг за другом в таком же порядке, можно с подавляющей вероятностью допустить, что все три явления связаны между собой причинной зависимостью. Но если одно явление есть причина другого, предпосылкой этого всегда является какая-то форма преобразования силы. И вероятность допущения, что некоторая последовательность явлений связана причинной зависимостью, действительно возрастает вместе с числом наблюдаемых случаев. Внесубъективная действительность, которую физик считает удовлетворяющей закону сохранения энергии, – несомненно та же самая, которая отражается в форме приспособления по меньшей мере двух различных когнитивных аппаратов: рассматриваемой в этой главе способности к образованию условных реакций и вообще к образованию ассоциаций и человеческого мышления, выработавшего представление о причинности.

Реакция избегания у туфельки и комплексное центральное представление пространства у самых высших организмов являются способами приспособления к одному и тому же реальному факту: непроницаемости тел и их расположению в пространстве. Аналогичным образом формирование условных реакций и причинное мышление суть способы приспособления к одному и тому же факту: сохранению энергии и ее способности к превращениям.

Эмпиристы ошибаются, полагая, что причинное мышление человека возникает лишь вследствие привычки и что наше "propter hoc" [Вследствие этого (лат.)], наше "потому что" тождественно часто встречавшемуся, надежному "post hoc", "регулярно за этим". Аксиоматическая природа нашего причинного мышления нигде не видна яснее, чем в предложениях, которыми Джеймс Прескотт Джоуль начинает свою классическую работу об эквиваленте тепла. Он говорит там, столь же наивно, сколь безапелляционно, что абсурдно допускать, будто какая-нибудь форма энергии может исчезнуть, не превратившись в некоторую другую, постулируя тем самым то, что в конечном счете доказывает, а потому вовсе не имел бы надобности постулировать. Точно так же априорный характер причинного мышления проявляется у каждого смышленого ребенка в вечном вопросе "почему?".

Как мы не раз отмечали, сообщения более простых когнитивных аппаратов допускают контроль с точки зрения более сложных, и при этом они никогда не оказываются ложными, а всегда лишь более бедными информацией, чем сообщения высших аппаратов. Совершенно ясно, что условная реакция находится в таком же отношении к причинному мышлению. При обучении посредством успеха, как и вообще при образовании ассоциаций, схватывается лишь один факт, относящийся к преобразованию силы: причина предшествует следствию во времени. Но этого достаточно, чтобы организм мог сделать жизненно важные приготовления.

 

7. Моторное обучение

Адаптивная модификация поведения обнаруживается в рецепторном секторе поведения животного на гораздо более низком уровне развития, чем в моторном. Насколько я знаю, первым, кто оценил значение этого факта и ясно о нем сказал, был венский зоолог Отто Шторх. За исключением описанного в третьем разделе предыдущей главы очень простого процесса моторного прокладывания путей, все, что говорилось до сих пор о телеономном изменении поведения посредством обучения, относится к рецепторным процессам – к тому, что Шторх называет "рецепторикой приобретения". Сенситивизация, привыкание, приучение, травматическая ассоциация поведения бегства с определенными стимулирующими ситуациями, а также усиление избирательности врожденных механизмов запуска – все эти процессы основаны исключительно на изменении рецепторных аппаратов.

В чем же состоят простейшие телеономные модификации моторных функций? Та же самая функция условной реакции, которая позволяет организму ответить на «предвосхищающий» условный стимул способствующими сохранению вида приготовлениями к ожидаемому безусловному стимулу, дает ему также возможность выучить ту последовательность, в какой он должен выполнять определенные инстинктивные движения, каждое из которых находится в его распоряжении в форме, полученной им от рождения. Мы уже познакомились с таким процессом обучения на примере постройки гнезда у крыс. Я склонен допустить, что моторное обучение всегда основывается на том же принципе, если только речь идет не о простом прокладывании путей, о котором говорилось в третьем разделе главы 5, а о настоящих условных реакциях. В самых примитивных случаях соединенные друг с другом формы движения представляют собой целостные инстинктивные движения, легко распознаваемые как таковые – например, в случае постройки гнезда у крыс. Если же элементы движения при таком соединении упрощаются и занимают меньше времени, то возникает гораздо более ясная картина обучения некоторой новой форме движения. Относительно простым примером того, как таким образом возникает целостная последовательность движений, может служить заучивание путевых маршрутов у мышей. Когда видишь, как мышь учится пробегать сложный лабиринт – например, при просмотре фильмов, снятых в 1952 году О. Кёлером и В. Динглером, – становится ясным различие между свободной последовательностью движений, направляемых мгновенной информацией, и «застывшей», заученной последовательностью. В незнакомой местности мышь продвигается вперед буквально шаг за шагом, ощупывая усиками путь то вправо, то влево, и время от времени пробегая кусок пути в обратном направлении. Уже в третий или четвертый раз мышь нередко пробегает небольшой отрезок пути быстрее, но затем сразу останавливается и возвращается к прежней форме пространственной ориентировки. При следующих повторениях она делает быстрые пробежки также и в других местах пути, потом быстро пробегаемых отрезков становится больше и сами они становятся длиннее, пока не сольются в местах стыка. Когда, наконец, исчезают все сдерживающие быстрый бег "швы" в этих местах, процесс заучивания пути окончен. Теперь мышь быстро пробегает весь путь, выполняя одну плавную последовательность движений.

Объединение отдельных имеющихся в распоряжении организма элементов переместительного движения происходит благодаря тому, что каждая условная реакция связывается со следующей. Каждое движение вызывает ожидаемую стимулирующую ситуацию, которая, с одной стороны, сообщает организму, что он по-прежнему на правильном пути, с другой – запускает следующий моторный импульс.

Именно такой тип обучения и такую форму сенсорного контроля выученного моторного процесса описал Альфред Кюн под именем мнемотаксиса и мнемической гомофонии в книге "Ориентирование животных в пространстве", которая стала классической – но лишь как теоретическую возможность. Раздались возражения с разных сторон: если бы эти допущения были верны, животное было бы вынуждено всегда бежать по одной и той же однажды выученной тропе и было бы дезориентировано, если бы хоть на шаг от нее отклонилось. Поскольку Кюн не знал ни одного животного, удовлетворяющего этим условиям, он опустил при переиздании книги главу о мнемотаксисе и мнемической гомофонии – и напрасно, потому что животные, о которых мы сейчас говорим, например водяная землеройка, ведут себя в точном соответствии с его теорией. Особенно сильное впечатление возникает, когда такое существо в самом деле сбивается с пути или в эксперименте специально нарушается гомофонное* соответствие между твердо заученной последовательностью движений и характером пути. Когда я удалял с пути моих землероек предмет, на который они привыкли вспрыгивать и бежать по нему дальше, они в этом месте подпрыгивали в пустое пространство, а затем, сбившись с пути, сидели сначала там, где раньше был исчезнувший предмет – небольшой деревянный ящичек, – потом ощупывали землю усиками, поворачивали обратно и, как можно было заметить, узнавали только что пройденный участок пути. Затем, снова набравшись мужества, поворачивали, мчались в прежнем направлении – и снова подпрыгивали в пустоту в критической точке! Они напоиинали детей, которые, застряв при чтении стихотворения наизусть, начинают снова с какого-нибудь предыдущего места, чтобы проскочить трудное место "с налета".

Можно с уверенностью допустить, что обучение более сложным целесообразным формам движения также происходит согласно только что описанным принципам. Хотя в случае приучения к путевым маршрутам мы имеем дело почти исключительно с линейным сочленением отдельных элементов движения, происходящих от наследственных координаций, не видно, почему посредством подобных процессов не могла бы осуществляться также и интеграция элементов движения, выполняемых одновременно.

Некоторые авторы называли "знание наизусть" выученных последовательностей поведения "кинестетическим" знанием. Разумеется, обратные сообщения проприоцепторов* играют важную роль в усвоении "заученного" движения (англ. "motor skill"), как показывает уже само это слово, составленное из греческих слов, означающих «движение» и «чувствую». Это выражение удачно и с феноменологической точки зрения, так как хорошо "заученная" форма движения в самом деле "чувствуется". Но, с другой стороны, этот термин склоняет к представлению, что именно проприоцепторные образы наших воспоминаний дают нам возможность точно повторять такую последовательность движений, а это, по всей вероятности, неверно. Как давно уже показал Эрих фон Гольст, произвольно составленные координации движений также подчиняются законам магнитного эффекта и центральной координации, и в последнее время это было многократно подтверждено. Благодаря исследованиям Дж. Экклса мы знаем, что органом, ответственным за координацию заученных движений, является мозжечок.

Обучение движениям даже на самом высоком уровне не отличается принципиально от путевого обучения низших млекопитающих; об этом мы будем говорить подробнее в разделе, посвященном произвольному движению. В распоряжении животного всегда имеются врожденные формы движений с готовыми программами и центральной координацией, которые при обучении лишь интегрируются в новую целостность. Чем выше уровень филетического развития* способности животного обучаться движению, тем меньше эти моторные элементы. Но даже при настоящих произвольных движениях они все еще намного выше уровня интеграции фибриллярных сокращений*; более того, они, несомненно, охватывают в большинстве случаев также и сокращения нескольких синергистов;* однако они все же достаточно малы, чтобы быть в состоянии соединяться едва ли не в любые "мелодии движения" как при одновременном действии, так и следуя друг за другом.

Мы знаем более или менее достоверно, что в основе элементарных движений, из которых состоит перемещение, лежат эндогенная стимуляция и центральная координация. Я полагаю, что физиологические явления этого рода вообще не подвержены адаптивному изменению вследствие обучения или иных влияний; изменяться может лишь многообразие процессов, «посредничающих» между этими явлениями и требованиями внешней среды; выше мы назвали эти процессы мантией рефлексов. В пользу этого допущения говорит также то уже известное нам обстоятельство, что в случаях, когда посредническая функция мантии рефлексов оказывается недостаточной, лежащая в основе наследственная координация не просто "размягчается" и подчиняется таксисам, а распадается на небольшие части, по отдельности столь же "твердо закрепленные", как прыжок доброго коня, скачущего галопом, но как раз благодаря своей краткости более пригодные для легкого и многостороннего использования в соответствии с требованиями пространства.

Особое значение отшлифованного, "заученного наизусть" движения для сохранения вида состоит, без всякого сомнения, прежде всего в том, что его можно «отбарабанить» без задержек, вызываемых тем, что реакции не происходят мгновенно. Насколько заученная наизусть последовательность движений отличается целеустремленностью и быстротой от последовательности, каждый шаг которой направляется механизмами ориентации, легко заметить, попытавшись в естественных условиях поймать территориальное животное, например ящерицу или коралловую рыбу. Пока животное движется по заученному пути, оно перемещается так быстро и целеустремленно, что вряд ли можно рассчитывать захватить его внезапным рывком или наброшенной сетью. Но если удастся внезапной атакой вызвать у намеченной жертвы столь сильную панику, чтобы она покинула область своих заученных путей, то чаще всего ее удается и поймать. Я полагаю, что преимущества, приобретаемые таким образом благодаря заучиванию путей, составили главную часть селекционного давления, выработавшего у видов такого экологического типа территориальное поведение.

Никто еще не пытался применять к заученным, отшлифованным последовательностям движений животных методы исследования, которые Эрих фон Гольст использовал в свое время, чтобы показать, что центрально координированные движения независимы от афферентных* процессов. Понятно что, предпринятая Эрихом фон Гольстом операция "дезафференции" – выключение всех подводящих нервов – означает тяжелое общее повреждение организма, так что если бы дезафференцированное животное не владело больше некоторым выученным до операции движением, это мало что доказало бы. У людей, страдающих спинной сухоткой (tabes dorsalis), у которых вследствие болезни не функционируют нервные окончания, сообщающие о положении конечностей – так называемые проприоцепторы положения, – как известно, существенно нарушается координация движений. Но необходимо принять во внимание, что человек – «чемпион мира» по овладению произвольными движениями, управляемыми сознанием, и потому у него вполне могут быть афферентно управляемыми формы движения, эквиваленты которых у животных так не управляются.

Оставляя в стороне вопрос, все ли выученные движения имеют у животных и людей одинаковую физиологическую природу, я остановлюсь сейчас на том типе отработанных, отшлифованных тысячекратным повторением движений, для которого наш обиходный язык создал при своем естественном развитии такие выражения, как "сделает, хоть разбуди его среди ночи", "вошло в плоть и кровь", "стало второй натурой" или "совершенно автоматически". В отношении таких последовательностей движений я все же склонен допустить, что их физиологические механизмы сходны с теми, на которых основываются описанные выше процессы заучивания пути у мелких млекопитающих. Вопрос об этих механизмах представляет интерес по той причине, что соответствующие последовательности движений во многих отношениях поразительно напоминают наследственные координации, то есть инстинктивные движения.

Во-первых, координация отработанных движений, как показал еще Эрих фон Гольст, подчиняется некоторым законам, совпадающим с законами центральной координации врожденных форм движения. Например, в обоих случаях ритмы различных элементарных движений, «вплетенных» в общую координацию, влияют друг на друга одинаковым образом. Благодаря явлениям "относительной координации" и "магнитного эффекта", по поводу которых я отсылаю читателя к работам фон Гольста, возникает в буквальном смысле гармоническое созвучие отдельных ритмов, стремящихся к установлению фазового отношения, выражаемого небольшими целыми числами. Чем лучше удается установить такое отношение, тем устойчивее координация ритмов. Формы движения, сопротивляющиеся этим тенденциям, неустойчивы – их трудно поддерживать; это знает каждый пианист, которому приходится играть одной рукой триоли, а другой – восьмые. Именно эти функции относительной координации и магнитного эффекта придают каждому хорошо усвоенному заученному движению, так же как и инстинктивному движению, независимому от процессов обучения, экономную и изящную форму, отвечающую нашему чувству прекрасного.

Второе свойство заученного движения, общее с врожденными наследственными координациями – сильная резистентность по отношению к попыткам его изменить. Как любил говорить Карл Бюлер, одно из определяющих свойств выученного состоит в том, что его можно забыть. Это, конечно, афоризм, но это утверждение имеет глубокий смысл, потому что, как я полагаю, оно справедливо лишь для "настоящего" обучения, но не для того процесса, благодаря которому возникают заученные координации движений. По моим впечатлениям, такая координация вообще никогда полностью не забывается, а когда «внешний вид» выполняемого благодаря ей движения изменяется и приспосабливается к новым условиям, это происходит за счет наложения на нее вновь усвоенных дополнительных форм движения, а не за счет исчезновения давно вошедшего в привычку. В пользу этого вывода говорят, например, наблюдения над водителями автомобилей, меняющих тип машины. Если какие-нибудь движения заслуживают таких оценок, как "отшлифованные", "выученные назубок", то это движения настоящего хорошего водителя. Если такой водитель долго ездит на одной машине, а затем ему приходится ее сменить, жесткая закрепленность этих движений проявляется весьма отчетливо. Когда моя жена пересела из машины с рычажным переключением скоростей в другую, с переключателем на руле, ее рука долго хваталась сначала за пустое место внизу, где в старой машине был рычаг, и только потом поднималась к рукоятке на руле. Постепенно это обходное движение превратилось в дугообразное колебание, казавшееся всякому не посвященному в его историю аффектированным жестом. Оно еще не успело исчезнуть, когда машина с рулевым переключателем скоростей пришла в негодность и уступила место новой – опять с рычагом. Пять с лишним лет жена ругала переключение на руле и сожалела о рычаге, но попросту устранить координацию рулевого переключения она не смогла. Предоставляю читателю сообразить, по какому пути ее рука путешествует теперь к переключателю; нетрудно догадаться, что это весьма элегантное движение. Упорство, с которым заученные движения сопротивляются всякой попытке их устранить, хорошо известно преподавателям спорта. Им совсем не нравится, когда ученик, желающий выучиться, например, игре в теннис или спортивному плаванию, уже приобрел самоучкой некоторый навык: по изложенной только что причине это не только не помогает, но и очень сильно мешает усваивать оптимальные координации, необходимые для участия в соревнованиях.

Третья, самая замечательная общая черта отработанного движения и наследственной координации – то, что в обоих случаях после долгого неупотребления можно ясно заметить аппетентное поведение, направленное на выполнение движения. Один из сильнейших мотивов, побуждающих человека танцевать, бегать на коньках или заниматься другими видами спорта, – аппетенция, направленная на вполне определенное хорошо отработанное движение, интенсивность которой возрастает вместе со степенью усвоения движения и с его трудностью.

Такую же аппетенцию к выполнению трудных заученных движений продемонстрировал Г. Харлоу на макаках, снова и снова повторявших выученные манипуляции "для собственного удовольствия", без дальнейшего вознаграждения. "Функциональное удовольствие", как удачно назвал это явление Карл Бюлер, играет, несомненно, важную роль в возникновении хорошо отработанных заученных последовательностей форм поведения. Мы знаем по себе, что каждое усовершенствование, сглаживание каждой еще остающейся "шероховатости" доставляет хорошо заметное удовольствие. Усовершенствование движения само себя вознаграждает; в книге “Evolution and Modification of Behaviour” ["Эволюция и модификация поведения" (англ.)] я говорил о явлении, которое назвал "perfection-reinforcing mechanism" ["Механизм подкрепления совершенствованием" (англ.)].

В феноменологическом аспекте усвоение хорошо отработанных движений имеет еще несколько замечательных свойств; из них по крайней мере одно весьма существенно для роли произвольного движения в исследовательском поведении, о котором будет речь в следующей главе. Эти свойства своеобразно противоречивы. С одной стороны, «знание» выученного движения до такой степени сосредоточено в подсознательных и даже бессознательных слоях нашей личности, что мы только мешаем его выполнению, если пытаемся сознательно следить за ним и контролировать его. Часто мы даже не можем на сознательном уровне отдать себе отчет, чтo мы делаем и как мы это делаем. Если человек очень долго не выполнял заученное движение, например, когда после более чем десятилетнего перерыва он впервые становится на лыжи, то вначале, стоя над крутым склоном, думает, что вообще не сможет спуститься, но как только начинает спуск, движется, к собственному удивлению, так же легко, как раньше.

С другой стороны, нередко удается вызвать столь живое представление о кинестезии* выполнения хорошо «обкатанного» движения, что можно путем самонаблюдения выявить детали процесса, которых мы на сознательном уровне уже не знаем. Когда недавно мой внук спросил меня, которая из двух больших педалей моей машины включает сцепление и которая тормоз, я, к своему удивлению, обнаружил, что просто не знал этого, и прежде, чем ответить, должен был прибегнуть к способу, о котором только что говорилось.

Я полагаю, что возникновение подобных мысленных образов собственных движений играет важную и даже решающую роль в специфически человеческой дифференциации центрального представления пространственных данных, а тем самым и в нашем понятийном мышлении. В высшей степени вероятно, что направляемое сознанием движение хватания, существеннейшей частью которого является ощупывание кончиками пальцев, в особенности указательного пальца правой руки, было одной из предпосылок понимания*. В пользу этого говорят также огромные размеры области коры головного мозга, ответственной за чувствительность и движения кисти руки и пальцев, и отношение моторных полей к пирамидальным путям – важнейшим нервным проводникам произвольных движений.

Усвоение координации движений уже в самой примитивной форме – например, при "заучивании наизусть" последовательности движений перемещения у землеройки – есть когнитивный акт, и притом чрезвычайно эффективный. Само собой, наследственная координация может быть приспособлена лишь к таким условиям окружающей среды, с какими, как можно предвидеть, придется сталкиваться каждому индивиду данного вида животных.

"Заученная" форма движения обладает также многими характерными функциональными свойствами наследственных координаций: ее выполнение не замедляется задержками реакций; она имеет собственное аппетентное поведение и тем самым становится мотивацией. Подобно инстинктивному движению, она "скроена по мерке" потребностей – не только общих потребностей вида, но также и особых условий индивидуальной жизни. Легко понять, как важно сочетание этих свойств для сохранения вида. Полезнее всего оно тем животным, которым приходится иметь дело со сложно структурированной и изменчивой средой. Существа, которые живут на деревьях и перемещаются, хватаясь руками за ветки, причем им необходимо уверенно передвигаться по привычному пути сквозь ветви отработанными, заученными движениями, – такие существа должны заранее представлять себе буквально каждый шаг и каждый захват. Такому животному особенно необходима высокая точность захвата, так как его клещеобразная кисть, чтобы обеспечить телу опору, должна сомкнуться вокруг ветки в нужный момент и в нужном месте. Среди животных, перемещающихся хватанием за ветки, лишь медлительные ночные полуобезьяны, такие, как лори и потто, могут доверить пространственную ориентацию механизмам получения мгновенной информации. В отличие от них все быстро движущиеся и особенно прыгающие полуобезьяны и обезьяны в совершенстве владеют заученными движениями. Это одна из причин, по которым от таких животных произошел человек.

Поскольку я не вижу принципиального различия между процессами, участвующими в простом приучении к определенным путям и в обучении самым сложным отработанным движениям, я не думаю, что для объяснения рецепторного и моторного обучения необходимо постулировать принципиально различные процессы в центральной нервной системе. То новое, что возникает в процессе обучения как в рецепторной, так и в моторной сфере – это образование новых связей. Иными словами: адаптивная модификация, вероятно, всегда происходит в синапсах и всегда ближайшим образом родственна индукции в смысле Шпемана.

 

8. Приспособление обучающих механизмов под селекционным давлением их функций

Великая фульгурация образования нового регулирующего контура, благодаря которой стало возможно обучение посредством успеха, придала новую функцию крайним членам последовательности явлений, которая до того была линейной. До великого изобретения условной реакции задача заключительного действия была очень проста – выполнить по жесткой "замкнутой" программе определенную последовательность движений и передать обратное сообщение об исполнении, выключив тем самым аппетентное поведение. Что такое обратное сообщение в самом деле передается, можно заключить уже из внезапного резкого спада возбуждения после заключительного действия; это доказано опытами Ф. Бича, оперативным путем выключавшего у самца шимпанзе обратное сообщение об опорожнении семенных пузырьков при спаривании.

Как мы уже знаем, всем наследственным координациям свойственна тенденция к непрерывному выполнению. Первая функция, ради которой в центральной нервной системе возникли высшие централизованные инстанции, состоит в торможении центрально координированных движений. Наряду с этой функцией торможения такие "центры" должны обладать способностью снимать торможение каждой формы движения в биологически «правильный» момент; иными словами, они должны быть в состоянии получать мгновенную информацию о том, что этот благоприятный момент наступил. Наследственная координация, стоящий над нею центр торможения и механизм запуска с самого начала образуют функциональную целостность. Гейнрот увидел это гениальным взглядом, создав понятие свойственного виду импульсивного поведения.

В первоначальном виде содержание сообщения, передаваемого наследственной координацией в "центр", ограничивается тем, что программа выполнена; получив его, высшая инстанция включает ранее снятое торможение. Лишь в исключительных случаях заключительное действие, удовлетворяющее инстинктивное побуждение, прекращается от "усталости", т. е. в результате исчерпания специфического возбуждения; примером может служить постепенное затихание пения многих птиц.

Весьма вероятно, что механизм простой системы, о которой мы сейчас говорили, предоставил селекционному давлению отправные точки, позволившие ему сделать из механизма сообщения о выполнении механизм сообщения об успехе. В этой новой функции от заключительного действия требуется значительно больше; это все равно, как если бы добросовестный солдат, до сих пор умевший лишь докладывать: "Приказ выполнен", теперь должен был бы вдруг развить в себе способность доложить высшему командованию, к какому успеху привели его действия, и даже указать, чтo в приказах командования было ошибочным. Для этой новой функции требуется много разнообразной экстероцепторной и проприоцепторной информации, и сверх того нужны механизмы, обладающие достаточным филогенетическим "знанием", чтобы уверенно различать успех и неудачу.

Таким образом, после изобретения условной реакции к механизму заключительного действия предъявляются новые требования: должен возникнуть аппарат, способный передавать богатое информацией сообщение об успехе своего действия, и кроме того предъявляются высокие требования к количеству нервной энергии, необходимой для того, чтобы важное сообщение могло дойти до многих различных инстанций центральной нервной системы, функции которых должны быть адаптивно изменены. Под селекционным давлением этих новых функций в механизмах заключительного действия развились особые структуры, и эти механизмы приобрели физиологические свойства, которые старыми этологами долго понимались неверно. При выполнении последовательности форм поведения, не поддающейся кондиционированию, – такой, как свойственное виду импульсивное поведение, – на заключительном действии не делается обычно никакого доступного наблюдению акцента. Это особенно характерно для последовательностей форм поведения, выполняемых всего один раз в жизни индивида, – например, спаривания у многих членистоногих. В таких случаях у животного при выполнении заключительного действия не наблюдается никакого особого повышения общего возбуждения. После возбужденного танца ухаживания, которым, например, самец паука-скакуна привлекает самку, заключительное действие – спаривание – выглядит довольно вялым.

Даже у весьма способных к обучению цихлид – высокоразвитых рыб, ухаживающих за потомством – метание икры и оплодотворение происходят без какого бы то ни было заметного повышения уровня возбуждения; напротив, при вступительных церемониях образования пар, сопровождаемых танцевальными движениями и предъявлением роскошных, ярких красок, уровень общего возбуждения гораздо выше, чем при заключительном действии. При этом многое выучивается; рыбы научаются узнавать друг друга – длительный брак, в котором они с тех пор живут, предполагает индивидуальное знакомство. Весьма вероятно, что подкрепляющее воздействие движений, сопровождающих образование пар, намного сильнее, чем воздействие метания икры и оплодотворения, которое самец выполняет, как бы "исполняя долг", точно так же, как другие действия ухода за потомством. У одной моей сотрудницы, когда она наблюдала за оплодотворением икры у обыкновенного этроплюса (Etroplus maculatus), вырвалось бессмертное восклицание: "Свою работу он выполняет так лениво, что это граничит с добродетелью!"

В противоположность поведению при оплодотворении у этого вида, наблюдая поведение жеребца и вообще ставшие самоцелью заключительные действия высших животных – например, умерщвление жертвы хищником, – трудно отделаться от впечатления, что пламя возбуждения охватывает весь организм. Понятно, что высокий уровень общего возбуждения очень важен: благодаря ему возникают нервные импульсы в таком числе и такой силы, какие необходимы для воздействия на весьма многочисленные места центральной нервной системы, где обратное сообщение о заключительном действии должно индуцировать модификации. Таким образом, этот фейерверк общего возбуждения и, в субъективном аспекте, жгучее чувственное наслаждение – вовсе не лишенные каких-либо функций эпифеномены*, не побочные продукты, а неотъемлемая часть физиологического механизма, способного извлекать информацию из успеха и неудачи.

Во всех системах поведения этого типа за сообщением о выполнении непосредственно следует резкий спад возбуждения. Но, помня о фейерверке общего возбуждения, я думаю, что было бы весьма искусственным считать один только спад возбуждения причиной подкрепления, обеспечивающего выполнение заключительного действия. Мнение Халла, что главным подкрепляющим фактором является "relief of tension" – снятие возбуждения, – во многих других случаях справедливо, но в отношении заключительного действия, ставшего самоцелью, оно, безусловно, неверно, как видно из простейшего самонаблюдения.

Механизм запуска также подвергается сильно изменившемуся селекционному давлению, когда он приобретает в рамках системы поведения, поддающейся кондиционированию, новые частичные функции, отличающиеся от тех, которые он выполнял в неспособной к обучению линейной системе. Это новое селекционное давление предъявляет к нему требования, во многих отношениях противоположные прежним. Прежде нужна была возможно бoльшая избирательность: в не поддающейся модификации линейной последовательности форм поведения единственной инстанцией, "знающей", когда и где следует выполнить все действие, является врожденный механизм запуска, а в этом случае избирательность необходима. Однако она становится не только ненужной, но даже вредной, когда второй процесс получения информации приступает к выполнению функции обучения. Когда источником информации о том, какой момент, какое место и какой объект наиболее благоприятны для выполнения всей последовательности форм поведения, становится обратное сообщение удовлетворяющего побуждение заключительного действия, преимуществом оказывается меньшая избирательность механизма запуска. Поэтому мы часто находим у близко родственных животных весьма различную степень избирательности аналогичных и даже, возможно, гомологичных врожденных механизмов запуска. Мы уже говорили о неизбирательности врожденных механизмов запуска, определяющих выбор материала для гнезда у хорошо способных обучению врановых. У гораздо менее способных к этому ткачиковых (Estrildini и Ploceini), у которых движения постройки гнезда высоко дифференцированы, знание единственно подходящего для этих движений строительного материала является полностью врожденным, так что многие из них вообще приходят в настроение размножения лишь при наличии материала, от которого исходят ключевые стимулы.

Способ извлечения информации об объекте из вида врожденной формы движения с помощью условной реакции имеет важное преимущество: он позволяет избирательно абстрагировать те свойства объекта, которые существенны для успешного выполнения формы поведения, поддающейся кондиционированию. Этот способ – приучение путем проб и ошибок к наиболее благоприятному доступному объекту – используется очень многими высшими животными. Понятно, что чем больше его роль, тем меньшим может быть знание объекта, заложенное во врожденном механизме запуска; более того, для сохранения вида может оказаться выгодным, чтобы врожденный механизм запуска как можно более упростился, предоставив процессу обучения самый широкий простор. На его долю остается лишь «намекнуть» молодому животному, в каком направлении его поиски имеют наибольшие шансы на успех. Такое поведение, основанное на пробах и ошибках, принципиально отличается от исследовательского, или любознательного поведения, о чем уже говорилось; ниже мы остановимся на этом подробнее.

 

 


Страница 7 из 8 Все страницы

< Предыдущая Следующая >
 

Вы можете прокомментировать эту статью.


Защитный код
Обновить

наверх^