Шрифт:
Частным случаем приложения изложенного принципа является отграничение в языке нормативных явлении от «исключений» (отклонений). В лингвостатистике утверждается, что статистический метод позволяет устранить существующую в данном вопросе нечеткость и установить ясные критерии для разграничения указанных явлений. Если под нормой понимается статистическая совокупность (в вышеуказанном смысле), а исключением (или ошибкой) — отклонение от частот, показываемых статистической совокупностью, то квантитативное решение вопроса напрашивается само собой. Здесь все сводится к статистическим отношениям между «популяцией» и «отклонением». Если частоты, наблюдаемые в отдельной выборке, отклоняются от вероятностей, обусловленных статистической совокупностью, более, чем это определяется серией выборочных подсчетов, то мы имеем основание заключать, что демаркационная линия между «тем же самым» (нормой) и «не тем же самым» (исключением) оказывается нарушенной.
Квантитативные различия между «языком» и «речью» используются и для разграничения языковых элементов двух типов: грамматических и лексических. Исходным моментом для решения этой задачи, представляющей с лингвистической точки зрения часто большие трудности, является предположение, что степень величины частотности грамматических элементов иная, чем у лексических единиц. Это якобы связывается с «обобщенностью» грамматических элементов, чем они отличаются от понятий, фиксированных лексическими единицами. Кроме того, грамматические элементы якобы, как правило, значительно меньше по своему объему: в качестве самостоятельных слов (к ним причисляются местоимения, предлоги, союзы и служебные слова) они обычно состоят из малого количества фонем, а в виде «связанных форм» — из одной или двух фонем [167] . Чем меньше лингвистический элемент, тем менее способна его «длина» (количественный момент) служить в качестве определяющей характеристики и тем большее значение приобретает для этой цели «качество» фонем. Какие же методы предлагаются для решения рассматриваемой проблемы? Она решается посредством обращения к чисто квантитативному понятию грамматической нагрузки, «Предположим, — пишет в этой связи Хердан, — что нас интересует сравнение в указанном отношении двух языков. Каким образом мы определяем с известной степенью объективности «грамматическую нагрузку», которую несет язык? Ясно, что эта нагрузка будет зависеть от положения демаркационной линии, отграничивающей грамматику от лексики. Первое соображение, которое может прийти при этом нам в голову, заключается в том, чтобы определить, насколько «сложна» грамматика данного языка. Ведь «сложность» — качественная характеристика, а понятие «грамматической нагрузки» является количественной характеристикой. Правда, нагрузка до известной степени зависит от сложности, но не целиком. Язык может быть награжден чрезвычайно сложной грамматикой, но в деятельности языка получает применение только сравнительно небольшая ее часть. Мы определяем «грамматическую нагрузку» как совокупность грамматики, которую несет язык, когда он находится в действии, что тотчас переводит нашу проблему в область структуральной лингвистики в том смысле, в каком эта дисциплина была определена Соссюром. В последующем изложении применяются квантитативные методы определения различия языков в зависимости от того, где проходит граница, разделяющая грамматику от лексики» [168] . Иными словами, различия языков в данном случае должны быть сведены к различиям числовых отношений между грамматическими и лексическими элементами.
167
G. Herdan. Ор. cit., p. 101.
168
G. Нerdan. Ор. cit., р. 102.
Имеющиеся в нашем распоряжении материалы рисуют следующую картину. В английском языке (учитывались лишь «грамматические слова»: местоимения, или, как они также именуются, «заместители», предлоги, союзы и вспомогательные глаголы) в отрезке, включающем 78633 случая употребления всех слов (1027 различных слов), было обнаружено 53 102 случая употребления грамматических элементов, или, точнее говоря, «грамматических слов» (149 различных слов), что составляет 67,53 % при 15,8 % различных слов. Таковы данные Диуэй [169] . Другие данные показывают иное процентное соотношение: 57,1 % при 5,4 % различных слов [170] . Такое значительное расхождение объясняется различием письменного и устного языка. Письменные формы языка (первые данные) используют якобы больше грамматических элементов, чем устные (второй случай). В «Божественной комедии» Данте (по итальянскому оригиналу) Мариотти установил 54,4 % случаев употребления «грамматических слов».
169
С. Deweу. Relative frequencies of English speech sounds. Harward, 1923.
170
N.R.French. C.W. Сагter and W.Koenig. Words and Sounds of Telephone Conversations. «Bell System Technical Journal», 1930, vol. 9.
Другой и, видимо, более совершенный способ определения грамматической нагрузки языка заключается в подсчете фонем, входящих в грамматические элементы. В данном случае учитываются не только самостоятельные грамматические слова, но и связанные формы. Здесь возможны различные варианты. Например, определение относительной частоты употребления отдельных согласных фонем в грамматических элементах и сопоставление их с частотой суммарного употребления этих же фонем (итоговые данные такого соотношения в английском языке дают пропорцию 99,9 % к 100000 — суммарного употребления); или подобное же сопоставление согласных по отдельным классификационным группам (лабиальные, палатальные, велярные и прочие фонемы). Итоговое соотношение здесь принимает форму пропорции 56,47 % (в грамматических элементах) к 60,25 % (в суммарном употреблении); или такое же сопоставление начальных согласных фонем (в этом случае получилось соотношение 100,2 % в грамматических словах к 99,95 — в суммарном употреблении). Возможны и иные более сложные статистические операции, которые, однако, в результате дают подобные же квантитативные выражения исследуемой проблемы.
Приведенные квантитативные данные служат основанием для общего вывода. Он сводится к тому, что распределение фонем в грамматических элементах обусловливает характер распределения (в числовом, конечно, выражении) фонем в языке в целом. А это в свою очередь позволяет заключить, что употребление грамматических элементов в наименьшей степени зависит от индивидуального выбора и составляет ту часть лингвистического выражения, которая контролируется вероятностью. Этот умозрительный вывод подтверждается подсчетом грамматических форм в русском языке, сделанным Есселсоном [171] . Исследованию было подвергнуто 46896 слов, взятых из II источников (произведения Грибоедова, Достоевского, Гончарова, Салтыкова-Щедрина, Гаршина, Белинского, Амфитеатрова, Гусева-Оренбургского, Эренбурга, Симонова и Н. Островского). Они были разделены на разговорные слова (17 756 слов, или 37,9 %) и неразговорные (29140 слов, или 62,1 %). Затем вся совокупность слов была подразделена на 4 группы в зависимости от их грамматического характера: в 1-ю группу вошли существительные, прилагательные, прилагательные в функции существительных, местоимения и склоняемые числительные; во 2-ю группу — глаголы; в 3-ю группу — отглагольные причастия, причастия в функции прилагательных и существительных и деепричастия; в 4-ю группу — неизменяемые формы наречия, предлоги, союзы и частицы. Суммарные результаты (приводятся также таблицы с данными по отдельным авторам) дают следующее соотношение:
171
Н. Н. Yosselson. Russian Word Count. Detroit, 1953.
разговорн. | неразговорн. | |
1-я группа | 51,9 % | 57,1% |
2-я группа | 29,7 % | 24,8% |
3-я группа | 1,5 % | 6,0% |
4-я группа | 16,9 % | 12,1 % |
Сумма | 100,0 % | 100,0% |
Хердан следующими словами характеризует рассмотрение полученных таким образом квантитативных данных: «Они оправдывают вывод, что грамматические элементы следует рассматривать в качестве фактора, обусловливающего вероятность лингвистического выражения. Такой вывод позволяет избежать обременительной квалификации каждого употребляемого слова. Совершенно очевидно, что, поскольку грамматика и лексика не хранятся в водонепроницаемых оболочках, ни та и ни другая не являются чистым «выбором» (choice) или чистой «вероятностью» (chance). И грамматика и лексика содержат оба элемента, хотя и в значительно варьирующихся пропорциях» [172] .
172
G. Herdan. Op. cit., p. 121.
Большой раздел книги Хердана посвящен исследованию в языке двухплановости или двойственности (duality), причем само понятие двойственности основывается им на математических характеристиках.
Так, теоремы в проективной геометрии можно располагать в два ряда, так что каждая теорема одного ряда может быть получена из некоторый теоремы другого ряда посредством замены друг на друга слов точка и прямая. Например, если дано положение: «любые различные точки принадлежат одной и только одной прямой», то мы можем из него вывести соотнесенное ему положение: «любые две различные прямые принадлежат одной и только одной точке». Другим методом определения двойственности является нанесение по оси абсцисс и оси ординат разных планов исследуемого явления. Так, как это, например, делает Юл [173] , по оси абсцисс отсчитываются различные частоты употребления, а по оси ординат — количество лексических единиц, у которых определяется частотность и т. д. Так трактуется понятие двойственности, якобы в равной мере применимое и к. лингвистическим исследованиям.
173
G. U. Yule. A Statistical Study of Vocabulary. Cambridge, 1944.
Под определенное таким образом понятие двойственности, которое во всех случаях фактически имеет характер бинарного кода и которое также считается самой существенной чертой языковой структуры, подводятся чрезвычайно разнокачественные явления, допускающие противоположение по двум планам: распределение употребления слов соответственно характеру лексических единиц и распределение лексических единиц соответственно частоте употребления слов; письменную и разговорную формы речи; лексические и грамматические элементы; синонимы и антонимы; фонема и ее графическое изображение; определяемое и определяющее (соссюровские signifiant и signifiй) и т. д.