Полетаева Инга Игоревна
Шрифт:
Данный режим оказался весьма эффективным для выработки дифференцировочного УР на обобщенный признак «мерность», когда животное училось выбирать любую объемную (трехмерную) фигуру и не реагировать на плоские (двумерные) фигуры (см. 4.6.3). В таких опытах с собаками, обезьянами и воронами у одной группы животных каждого вида вырабатывали УР выбора любой объемной (трехмерной) фигуры, а у второй группы — любой плоской (двумерной). Каждый раз животному предъявляли новую пару стимулов из набора, изображенного на рис. 4.15 ' (всего 30 пар), причем плоская фигура всегда представляла собой фронтальную проекцию объемной.
Может возникнуть предположение, что задача по выработке таких дифференцировок для животных очень сложна, однако с ней справляются не только приматы, но и хищные млекопитающие (Дашевский, Детлаф, 1974), а также птицы — врановые (Крушинский и др., 1981) и даже голуби. При этом животным всех указанных видов требовалось примерно столько же сочетаний, как и при выработке дифференцировки с одной парой стимулов. После такой серии обучения они способны выбирать любую новую объемную (или плоскую) фигуру без дополнительной тренировки.
При систематическом варьировании второстепенных признаков стимулов можно исследовать не только способность животных к обучению, но и более сложную форму их высшей нервной деятельности — способность к обобщению, которая составляет одно из важнейших свойств довербального мышления животных (гл. 5).
Как уже упоминалось, животные с разным уровнем структурно-функциональной организации мозга практически не различаются по способности к простым формам условно-рефлекторного обучения. Образование отдельных дифференцировочных УР в этом плане не составляет исключения. Однако благодаря использованию дифференцировочных УР в качестве элементарных единиц обучения и созданию их разнообразных комбинаций было разработано несколько экспериментальных процедур, которые называют«сложными формами обучения», или серийным обучением (seriallearning). Появление этих методов было связано со стремлением специалистов все же выявить какие-то различия в способностях у животных разных таксоноцеских групп с разным уровнем организации мозга (см. 8.1). Наиболее важные из этих методов:
* последовательные переделки сигнального значения дифференцировочных стимулов;
* формирование установки на обучение;
* формирование «систем» дифференцировочных УР.
Переделка сигнального значения условных раздражителей (ее часто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.
После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80 % правильных решений) условия получения подкрепления меняются на противоположные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.
Американский исследователь М. Биттерман (1973) предложил проводить такие переделки многократно. Эта процедура получила название метода последовательных (или обратимых) переделок (discriminationreversallearning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.
Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «правильно» без дополнительного обучения. в Снижение числа проб, необходимого для очередной переделки реакции, происходит тем быстрее, чем выше уровень эволюционного развития данного животного.
Метод формирования «установки на обучение» (objectlearning-setformation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, животное (в опытах Харлоу макака-резуса) обучают простой дифференцировке — выбору одного из двух стимулов: игрушек или мелких предметов обихода. По достижении определенного критерия выработки дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т. д. После выработки 100–150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голубей, занимая многие месяцы) животное уже при втором предъявлении новой пары стимулов действует не наугад, не методом проб и ошибок, а в соответствии с усвоенным им ранее правилом, которое принято называть установкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».
Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, Jose-shift"}-».
Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки происходят сходные процессы, так что первый можно считать частным случаем формирования установки.
Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каждую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).