Лексическая плотность — это концепция в компьютерной лингвистике , которая измеряет структуру и сложность человеческого общения на языке. [1] Лексическая плотность оценивает лингвистическую сложность письменного или устного произведения из функциональных слов (грамматических единиц) и содержательных слов (лексических единиц, лексем ). Один из методов расчета лексической плотности — вычисление отношения лексических единиц к общему количеству слов. Другой метод — вычисление отношения лексических единиц к количеству более высоких структурных элементов в произведении, таких как общее количество предложений в предложениях. [2] [3]
Лексическая плотность для человека меняется с возрастом, образованием, стилем общения, обстоятельствами, необычными травмами или медицинским состоянием, [4] и его или ее креативностью. Внутренняя структура человеческого языка и его первого языка может влиять на лексическую плотность стиля письма и говорения человека. Кроме того, человеческое общение в письменной форме, как правило, более лексически плотное, чем в устной форме после стадии раннего детства. [5] [6] Лексическая плотность влияет на читаемость сочинения и легкость, с которой слушатель или читатель может понять сообщение. [7] [8] Лексическая плотность может также влиять на запоминаемость и сохранение предложения и сообщения. [9]
Лексическая плотность — это доля содержательных слов (лексических единиц) в данном дискурсе. Она может быть измерена либо как отношение лексических единиц к общему количеству слов, либо как отношение лексических единиц к количеству более высоких структурных единиц в предложениях (например, предложений). [2] [3] Лексическая единица обычно является реальным содержанием и включает в себя существительные, глаголы, прилагательные и наречия. Грамматическая единица обычно является функциональным клеем и нитью, которая сплетает содержание и включает в себя местоимения, союзы, предлоги, детерминанты и определенные классы конечных глаголов и наречий. [5]
Лексическая плотность — один из методов, используемых в дискурсивном анализе в качестве описательного параметра, который меняется в зависимости от регистра и жанра. Существует множество предложенных методов вычисления лексической плотности любой композиции или корпуса. Лексическая плотность может быть определена как:
В 1971 году Юр предложил следующую формулу для вычисления лексической плотности предложения:
Бибер называет это соотношение «соотношением типа и маркера». [10]
В 1985 году Холлидей пересмотрел знаменатель формулы Юра и предложил следующий способ вычисления лексической плотности предложения: [1]
В некоторых формулировках предложенная Холлидеем лексическая плотность вычисляется как простое отношение, без множителя «100». [2] [1]
Измерения лексической плотности могут различаться для одного и того же сочинения в зависимости от того, как определяется «лексический элемент» и какие элементы классифицируются как лексические или как грамматические элементы. Любая принятая методология, последовательно применяемая к различным сочинениям, обеспечивает лексическую плотность этих сочинений. Как правило, лексическая плотность письменного сочинения выше, чем устного. [2] [3] По словам Юра, письменные формы человеческого общения на английском языке обычно имеют лексическую плотность выше 40%, в то время как устные формы, как правило, имеют лексическую плотность ниже 40%. [2] В обзоре исторических текстов Майкла Стаббса типичная лексическая плотность художественной литературы варьировалась от 40% до 54%, в то время как документальной литературы варьировалась от 40% до 65%. [3] [11] [12]
Отношения и близость между участниками конкретного общения влияют на лексическую плотность, утверждает Юр, как и обстоятельства, предшествующие началу общения для одного и того же говорящего или писателя. Более высокая лексическая плотность письменных форм общения, предположила она, в первую очередь обусловлена тем, что письменные формы человеческого общения предполагают большую подготовку, размышления и пересмотры. [2] Человеческие обсуждения и разговоры, включающие или ожидающие обратную связь, как правило, более редки и имеют более низкую лексическую плотность. Напротив, утверждают Стаббс и Бибер, инструкции, приказы правоохранительных органов, новости, зачитываемые с экрана в течение отведенного времени, и литература, которая, как ожидают авторы, будет доступна читателю для повторного прочтения, как правило, максимизируют лексическую плотность. [2] [13] В исследованиях лексической плотности устных и письменных материалов в разных европейских странах и возрастных группах Йоханссон и Стрёмквист сообщают, что лексическая плотность групп населения была схожей и зависела от морфологической структуры родного языка и внутри страны от выбранных возрастных групп. Лексическая плотность была самой высокой у взрослых, в то время как вариации, оцениваемые как лексическое разнообразие, утверждает Йоханссон, были выше у подростков той же возрастной группы (13-летние, 17-летние). [14] [15]