Чтение книги Введение в теоретическую лингвистику страница 41

Введение в теоретическую лингвистику

вернуться

Лайонз Джон

Шрифт:

Более существенным, нежели общая вероятность появления w после i и перед а, является тот факт, что w составляет часть «блока» want. С одной точки зрения блок можно рассматривать как допустимую для английского языка последовательность букв; с другой точки зрения его следует рассматривать как целостную единицу, которую могут заменять другие блоки букв, так, что при этом будут получаться приемлемые высказывания: idrinkapintofmilk 'Я пью пинту молока', itakeapintofmilk 'Я беру пинту молока' и т. п. При этом i 'я' также является «блоком»; то, что он состоит только из одной буквы, не существенно. На его место в данное окружение не может быть поставлена никакая другая отдельная буква так, чтобы получилось приемлемое высказывание, а только другие «блоки», например: 'we' мы, they 'они', thejoneses 'Джонсы' и т. п. То, что мы назвали «блоками», можно, по крайней мере в предварительном порядке, идентифицировать со словами языка. (Для упрощения мы не учитываем тот факт, что некоторые «блоки», которые могли бы заменить I в данном примере, являются не отдельными словами, а сочетаниями слов, например: The Joneses, They all 'они все' и т. п. Здесь читатель может вновь обратиться к разделу, в котором рассматривается «двойное членение» в плане выражения; см. §2.1.3).

4.2.6. ДИСТРИБУЦИОННЫЙ ПОДХОД К ГРАММАТИЧЕСКОМУ ОПИСАНИЮ

Заметим, что мы пришли к традиционной точке зрения, согласно которой английские предложения «структурируются» на двух уровнях: на уровне букв (или фонологических единиц) и на уровне слов, не прибегая явным образом к понятию значения. Мы только отделили фонологический (или орфографический) компонент приемлемости от приемлемости иного рода с тем, чтобы выделить внутри этого «остатка» различные компоненты приемлемости «более высокого уровня». Конечно, верно, что высказывания I want a pint of milk; I drink a pint of milk и т. д. (теперь мы можем ввести промежутки между словами) осмысленны в соответствующем контексте. Кроме того, они различаются по своему значению; это различие значений высказываний уместно описывать как функцию от значений составляющих их слов want, drink и т. д. Но пока мы не учитывали эти факты; и мы не будем этого делать в пределах представленной здесь теории грамматики. Эти факты подлежат рассмотрению в теории семантики. В принципе мы только построили множество приемлемых предложений, помещая разные слова в одну и ту же «раму», или контекст. Все множество контекстов, в которых может встречаться лингвистическая единица, составляет ее дистрибуцию (см. §2.3.1). Таким образом, здесь излагался дистрибуционный подход к грамматическому анализу.

Теперь мы можем констатировать, что фонология описывает приемлемость и неприемлемость высказываний в той мере, в какой это возможно, посредством правил или формул, устанавливающих допустимые сочетания фонологических единиц исследуемого языка, а описание приемлемости в терминах допустимых сочетаний слов на «более высоком» уровне как бы «переходит» к грамматике.

4.2.7. ВЗАИМОЗАВИСИМОСТЬ ФОНОЛОГИИ И ГРАММАТИКИ

На этой стадии изложения следует подчеркнуть, что мы все еще исходим из предположения, что предложения состоят из слов, а слова состоят из фонологических единиц (или букв, если мы имеем дело с письменным языком). Оба этих предположения ниже будут видоизменены. (Обоснование стало бы несколько более сложным, но не потеряло бы силы, если бы мы уточнили их и теперь.) Следует также упомянуть, что, хотя из нашего изложения могло сложиться впечатление, будто грамматическое описание, будучи независимым от фонологического анализа, все же непременно следует за ним, это не обязательно должно быть так (ср. § 3.3.16). Мы устанавливаем грамматику и фонологию как теоретически различные уровни лингвистической структуры. Но фонологическая и грамматическая структура конкретных языков обычно взаимосвязаны (различным образом и в различной степени). В задачу лингвиста, описывающего тот или иной язык, входит объяснение этой взаимосвязи — там, где она имеется (наряду с объяснением возможной взаимозависимости между грамматической и семантической структурой языка).

4.2.8. ПРОСТОЙ ПРИМЕР ДИСТРИБУЦИОННОГО АНАЛИЗА

Мы еще далеки от того, чтобы прийти к удовлетворительному представлению о лингвистическом описании. Мы еще не сказали, в частности, как определяются приемлемые сочетания слов. Перечисление списком всех приемлемых последовательностей слов совершенно невозможно, поскольку, как мы видели, ни один естественный язык нельзя рассматривать как ограниченное множество предложений. В случае замкнутого корпуса материала можно было бы, конечно, составить список всех фонологически (или орфографически) различных предложений и затем решать вопрос о приемлемости, справляясь в этом списке. Но это было бы малоинтересно в том смысле, что ничего не давало бы для нашего понимания способности носителя языка производить «новые» предложения; это не было бы к тому же и самым экономным способом описать данный текст. Если продолжить рассмотрение этого вопроса, мы поймем, по какой причине.

В достаточно большой и представительной выборке из предложений какого-либо языка дистрибуции разных слов будут в значительной мере совпадать. Например, вместо milk 'молоко' можно поставить beer 'пиво', water 'вода', gin 'джин' и т. п. не только в I drink a pint of milk; этот же ряд слов мог бы появиться и во многих других окружениях, в которых может встретиться milk. Аналогично, слова they 'они', we 'мы' и you 'вы' могут заменить I 'я', a buy 'покупать', take 'брать', order 'заказывать' и т. д. могут заменить drink 'пить' во многих других окружениях, кроме нашего предложения. Слова, которые, как правило, способны заменять друг друга в целом ряде различных предложений, можно сгруппировать на этом основании в дистрибуционные классы.

Допустим, что нам необходимо проанализировать корпус материала, состоящий из следующих 17 «предложений»: ab, ar, pr, qab, dpb, aca, pca, pcp, qar, daca, qaca, dacp, dacqa, dacdp, qpcda, acqp, acdp. Разными буквами обозначены разные слова: условная запись используется из соображений общности, а также чтобы пояснить, что на данном этапе мы обходимся без непосредственного привлечения семантики. (Впрочем, это может вызвать известные сомнения, поскольку мы исходим из того, что приемлемость сохраняется при операции замены, а понятие «приемлемости» включает «осмысленность». Мы, однако, стремимся разграничить «грамматическую правильность» и «осмысленность», хотя еще не достигли этого.) Мы видим, что а и р имеют некоторые общие окружения (ср.
– r, pc– , dac– ), так же как b и r (ср. a– , qa– ) и d и q (ср. dac– a, -аса, ас– р), но что с имеет уникальную дистрибуцию (а– а, р– а, р– р, qa– a, da– a, da– p и т. д.) в том смысле, что ни в одном окружении, в котором встречается с, не встречается никакое другое слово. Теперь поместим а и р в класс X и поставим классный показатель X всюду, где встретятся а или р (предложения, которые отличаются только тем, что в одном из них представлено а, там, где в другом представлено р, будут сведены нашими формулами в один класс предложений): Xb, Xr (ar, pr), qXb, dXb, ХсХ (аса, рса, рср), qXr, qXcX, dXcX (daca, dacp), dxcqX, dXcdX, qXcdX, XcqX, XcdX. Теперь сгруппируем b и r в дистрибуционный класс Y, a d и q — в класс Z. Подставив Y вместо b и r, a Z вместо d и q, получим: (1) XY (Хb, Xr); (2) ZXY (qXb, qXr, dXb); (3) ХсХ; (4) ZXcX (qXcX, dXcX); (5) ZXcZX (dXcqX, dXcdX, qXcdX); (6) XcZX (XcqX, XcdX). Таким образом, мы можем описать предложения нашего корпуса в терминах шести структурных формул, определяющих приемлемые последовательности классов слов (с является одноэлементным классом). Эти формулы являются линейными (в смысле, который мы поясним ниже; см. §6.1.1).

Пока мы можем удовлетвориться описанием предложений нашего корпуса в терминах их линейной структуры, то есть на языке следующих формул или правил:

(1) XY

(2) ZXY

(3) XcX

(4) ZXcX

(5) ZXcZX

(6) XcZX.

Можно считать, что каждое из этих правил описывает отдельный тип предложения. (Тот факт, что можно свести эти типы предложений к подтипам, привлекая принципы структуры составляющих, не релевантен на данном этапе изложения; см. § 6.1.2 и сл.) Заметим, что эта система правил удовлетворительно объясняет приемлемость семнадцати предложений корпуса (она определяет их как грамматичные). Но это достигается только путем включения имеющихся предложений в общее множество из 48 предложений в качестве его элементов. (Число 48 получается после применения формулы, приведенной в § 2.3.8, к каждому из шести типов предложения и суммирования результатов.) Имеется 2 x 2 = 4 предложения типа (1), 2 x 2 x 2 = 8 предложений типа (2), 2 x 1 x 2 = 4 предложения типа (3), 16 предложений типа (4), 8 — типа (5) и 8 — типа (6). 4 + 8 + 4 + 16 + 8 + 8 = 48. Поэтому язык, описываемый такой грамматикой, содержит ровно 48 предложений. Тридцать одно не встречающееся предложение можно допустить в качестве приемлемых или исключить, если мы почему-либо решим, что они должны быть исключены посредством дополнительных правил, запрещающих определенные сочетания отдельных слов. Дополнительные правила, очевидно, весьма усложнят «грамматику». Следовательно, наиболее экономным способом описания данного текста будет такой, который представит его как случайную выборку из 17 предложений, являющихся подмножеством общего множества из 48 предложений, которые и составляют язык. «Грамматика», построенная нами для описания этого текста, является генеративной в описанном выше смысле (см. § 4.2.2). Мы будем говорить, что она порождает, или характеризует, язык текста, приписывая каждому из имеющихся в «выборке» предложений (так же как и тем, которых нет в «выборке») особое структурное описание: pr — это предложение структуры XY, pcda — структуры XcZX и т. д.

Этот ограниченный искусственный язык, использованный нами в качестве примера, содержит всего семь слов, а корпус включает лишь семнадцать простых предложений (из сорока восьми, порождаемых грамматикой). В случае естественных языков ситуация, без сомнения, оказывается значительно более сложной. Число слов выражается в десятках тысяч; их дистрибуционная классификация будет не столь простой и, несомненно, не сможет быть осуществлена только что проиллюстрированным способом. Кроме того, нам придется описывать целый ряд различных типов предложений, в том числе предложения значительной степени сложности. Однако эти факты не затрагивают самого принципа. Слова естественного языка могут быть сгруппированы в дистрибуционные классы (что всегда и делалось составителями грамматик на практике, как мы увидим ниже); дистрибуционные классы, установленные для конкретных позиций в предложениях одного типа, оказываются обычно действительными и для конкретных позиций в других, более сложных типах предложений. Грамматика, как она здесь понимается, есть не что иное, как описание предложений языка в терминах сочетаемостных свойств слов (а также словосочетаний и т. д.), определяемых их принадлежностью к тому или иному дистрибуционному классу. Это род алгебры, в которой в качестве «переменных» выступают словесные классы, а в качестве «постоянных», или «значений», принимаемых этими переменными в конкретных предложениях, — индивидуальные слова.

Введение в теоретическую лингвистику

Лайонз Джон

Шрифт:

Полезные ссылки

Контакты

Подпишитесь на рассылку: