Закон Менцерата , также известный как закон Менцерата–Альтмана (названный в честь Пола Менцерата и Габриэля Альтмана ), — это лингвистический закон, согласно которому увеличение размера языковой конструкции приводит к уменьшению размера ее составляющих, и наоборот. [1] [2]
Например, чем длиннее предложение (измеряемое по количеству предложений), тем короче предложения (измеряемое по количеству слов) или: чем длиннее слово (по слогам или морфам), тем короче слоги или морфы по звукам.
В XIX веке Эдуард Сиверс заметил, что гласные в коротких словах произносятся дольше, чем те же гласные в длинных словах. [3] [4] : 122 Менцерат и де Олеза (1928) [5] расширили это наблюдение, заявив, что по мере увеличения количества слогов в словах сами слоги в среднем становятся короче.
Из этого вытекает следующая гипотеза:
Чем больше целое, тем меньше его части.
В частности, для лингвистики:
Чем крупнее языковая конструкция, тем меньше ее составляющие.
В начале 1980-х годов Альтман, Хойпс [6] и Кёлер [7] продемонстрировали с помощью количественных методов, что этот постулат может быть применен и к более крупным конструкциям естественного языка: чем больше предложение, тем меньше отдельные предложения и т. д. Предпосылкой для таких отношений является то, что изучается отношение между единицами (здесь: предложение) и их непосредственными составляющими (здесь: предложение). [8] [9] [1] : Übersichten
По мнению Альтмана (1980) [8] , математически это можно выразить так:
где:
Закон можно объяснить, предположив, что лингвистические сегменты содержат информацию о своей структуре (помимо информации, которую необходимо передать). [7] Предположение о том, что длина структурной информации не зависит от длины другого содержимого сегмента, дает альтернативную формулу, которая также была успешно проверена эмпирически. [10]
Герлах (1982) [11] проверил немецкий словарь [12], содержащий около 15 000 записей:
1 | 2391 | 4.53 | 4.33 |
2 | 6343 | 3.25 | 3.37 |
3 | 4989 | 2.93 | 2.91 |
4 | 1159 | 2.78 | 2.62 |
5 | 112 | 2.65 | 2.42 |
6 | 13 | 2.58 | 2.26 |
Где — количество морфов на слово, — количество слов в словаре длиной ; — наблюдаемая средняя длина морфов (количество фонем на морф); — прогноз в соответствии с тем, где подгоняются под данные. F-тест имеет .
В качестве другого примера, простейшая форма закона Менцерата, справедлива для длительности гласных в венгерских словах: [13]
Длина слова (слогов в слове) | Длительность звука (сек/100) на примере гласной ā: наблюдается | Длительность звука (сек/100) на примере гласной ā: прогнозируемо |
---|---|---|
1 | 27.2 | 27.64 |
2 | 24.2 | 23.18 |
3 | 20.9 | 20.91 |
4 | 19.0 | 19.43 |
5 | 18.2 | 18.36 |
Больше примеров можно найти на страницах немецкой Википедии, посвященных длительности фонемы, длительности слога, длине слова, длине предложения и его части.
Этот закон, по-видимому, справедлив как минимум для подкласса японских символов кандзи . [14]
Помимо количественной лингвистики , закон Менцерата может обсуждаться в любых многоуровневых сложных системах. При наличии трех уровней, — это число единиц среднего уровня, содержащихся в единице высокого уровня, — это усредненное число единиц низкого уровня, содержащихся в единицах среднего уровня, закон Менцерата утверждает отрицательную корреляцию между и .
Закон Менцерата, как было показано, справедлив как для уровней основание - экзон - ген в геноме человека , [15] , так и для уровней основание - хромосома - геном в геномах из коллекции видов. [16] Кроме того, было показано, что закон Менцерата точно предсказывает распределение длин белков с точки зрения числа аминокислот в протеоме десяти организмов. [17]
Более того, исследования показали, что социальное поведение групп бабуинов также соответствует закону Менцерата: чем больше вся группа, тем меньше подчиненные социальные группы. [1] : 99 ff
В 2016 году исследовательская группа из Мичиганского университета обнаружила, что крики гелад подчиняются закону Менцерата, отметив, что крики сокращаются при использовании в более длинных последовательностях. [18] [19]