Блэйксли Сандра
Шрифт:
Позвольте привести вам аналогию, чтоб показать, как далеки были нейронные сети от реального мозга. Вообразите, что вместо того, чтоб пытаться понять, как работает мозг, мы попытаемся понять, как работает цифровая вычислительная машина. Через годы изучения мы откроем, что все в компьютере состоит из транзисторов. В компьютере есть сотни миллионов транзисторов и они соединены между собой определенным сложным образом. Но мы не понимаем, как работает компьютер или почему транзисторы соединены именно так. Итак, однажды мы решаем соединить всего лишь несколько транзисторов, чтоб увидеть, что происходит. Вот смотрите, мы обнаружили, что несколько транзисторов, когда соединяются вместе определенным образом, становятся усилителем! Слабый сигнал, поданный на один конец, усиливается на другом конце (подобным образом делают усилители в радиоприемниках и телевизорах). Это важное открытие, и немедленно вырастает индустрия, выпускающая транзисторные радиоприемники, телевизоры и другие электронные приборы на транзисторных усилителях. Все это хорошо, но это ничего не говорит нам о том, как работает компьютер. Хотя и усилитель и компьютер сделаны из транзисторов, они не имеют почти ничего общего. Точно так же и реальный мозг и трехслойная нейронная сеть построены из нейронов, но не имеют почти ничего общего.
Летом 1987 я получил опыт, который еще больше охладил мой и так невысокий энтузиазм относительно нейронных сетей. Я пришел на конференцию по нейронным сетям, где я увидел презентацию, устроенную компанией, называемой Nestor. Nestor пыталась продать приложение на нейронной сети для распознавания рукописных символов на подложке. Она предлагала лицензию на программу за один миллион долларов. Это привлекло мое внимание. Хотя Nestor провела улучшение алгоритма ее нейронной сети и рекламировала ее как еще один большой прорыв, я чувствовал, что проблема распознавания рукописных символов могла бы быть решена более простым, более традиционным путем. Я пришел домой той ночью, размышляя о проблеме, и за два дня разработал распознаватель рукописных символов который был быстрым, маленьким и гибким. Мое решение не использовало нейронную сеть и оно работало совершенно не так, как мозг. Хотя эта конференция разожгла мой интерес в разработке компьютеров со стилусом (в конечном счете приведший к проекту PalmPilot десять лет спустя), это также убедило меня, что нейронные сети были не таким уж большим улучшением по сравнению с традиционными методами. Распознаватель рукописных символов, который я создал, пригодился в конечном счете для системы текстового ввода, названной Graffiti, использованной в первых сериях продукции Palm. Я думаю, компания Nestor ушла из бизнеса.
Слишком много для простых нейронных сетей. Большинство их возможностей легко воспроизводились другими методами и в итоге шумиха в СМИ спала. Наконец, исследователи нейронных сетей перестали объявлять свои модели интеллектуальными. Ведь это были очень простые нейронные сети и делали гораздо меньше, чем ИИ-программы. Я не хочу оставить у вас впечатление, что все нейронные сети являются простыми трехслойными. Некоторые исследователи продолжали изучать нейронные сети различных конфигураций. Сегодня термин нейронные сети используется для описания различных множеств моделей, некоторые из них являются биологически более точными, некоторые — нет. Но почти ни одна из них не является попыткой охватить полностью функции или архитектуру неокортекса.
По моему мнению, большинство фундаментальных проблем с большинством нейронных сетей — это особенности, которые они разделяют с ИИ-программами. И те и другие обременены тем, что фокусируются на поведении. Называют ли они это поведение «ответами», «паттернами» или «выходными данными», и ИИ и нейронные сети полагают, что интеллект заключается в поведении, которое программа или нейронная сеть демонстрирует после обработки заданных входных данных. Наиболее важным атрибутом компьютерной программы или нейронной сети является то, выдает ли она правильные или желаемые результаты. Как навязано Аланом Тьюрингом, интеллект эквивалентен поведению.
Но суть интеллекта не только в действии или интеллектуальном поведении. Поведение — это проявление интеллекта, но не центральная характеристика или первичное определение интеллекта. Рефлексия доказывает это: вы можете быть интеллектуальным просто лежа в темноте, размышляя и понимая. Игнорирование того, что происходит в вашей голове и фокусирование вместо этого на поведении было большой преградой на пути понимания интеллекта и построения интеллектуальных машин.
Прежде, чем мы исследуем новое определение интеллекта, я хочу рассказать вам о других коннекционистских подходах, которые подошли гораздо ближе к описанию того, как работает мозг. Проблема в том, что слишком мало людей, кажется, осознали важность этих исследований.
Тогда как нейронные сети привлекли основное внимание, небольшая отколовшаяся группа теоретиков по нейронным сетям строила сети, которые не фокусировались на поведении. Названные самоассоциативной памятью, они были также построены из простых «нейронов», которые были соединены друг с другом и возбуждались, когда достигали определенного порога. Но они были соединены по-другому, с использованием большого количества обратных связей. Вместо того, чтоб передавать информацию только вперед, самоассоциативная память возвращала свои выходные данные на вход — что-то вроде того, как если б вы звонили самому себе по телефону. Эти циклы на обратных связях привели к некоторым интересным свойствам. Когда паттерн активности был приложен к искусственным нейронам, они формировали память на этот паттерн. Самоассоциативные сети ассоциировали паттерны с самими собой, отсюда термин самоассоциативная память.
Результаты такой записи на первый взгляд кажутся нелепыми. Чтоб выбрать паттерн, хранящийся в такой памяти, вы должны задать паттерн, который хотите выбрать. Это все равно, что вы пойдете к торговцу и попросите связку бананов. Когда торговец спросит вас, как вы собираетесь расплачиваться, вы скажете, что будете платить бананами. Вы можете спросить: «Какой в этом смысл?». Но автоассоциативная память обладает несколькими важными свойствами, которые обнаружены в реальном мозге.
Наиболее важным свойством является то, что вам не обязательно иметь целиком тот паттерн, который вы хотите выбрать. У вас может быть только часть паттерна, или у вас может быть немного искаженный паттерн. Самоассоциативная память может выбрать корректный паттерн, такой, каким он был сохранен изначально, даже если вы начали с искаженной версии. Это все равно, что вы придете к торговцу с наполовину съеденными коричневыми бананами и получите целые зеленые бананы назад. Или придете в банк с порванной и нечитаемой банкнотой, а кассир вам скажет: «я думаю, это испорченная 100-долларовая купюра, дайте ее мне, а я вам дам новую хрустящую 100-долларовую купюру».
Второе свойство, отличное от других нейронных сетей, это то, что самоассоциативная память может быть спроектирована для хранения последовательностей паттернов, или временных паттернов. Это свойство достигается добавлением временных задержек к обратным связям. С такими задержками вы можете подать на автоассоциативную память последовательность паттернов, похожих на мелодию, и она может вспомнить всю последовательность. Я мог бы подать несколько первых нот «В лесу родилась елочка» и память вернула бы песню целиком. Когда подставляется часть последовательности, память может вспомнить оставшуюся часть. Как мы увидим далее, люди обучаются практически любым вещам, как последовательностям паттернов. Я предполагаю, что мозг использует контуры, аналогично тому, как это делает автоассоциативная память.