Часть серии статей о |
Лингвистика |
---|
Портал |
Орфография — это набор правил письма на языке , включая нормы орфографии , пунктуации , границ слов , заглавных букв , переносов и ударения .
Большинство национальных и международных языков имеют устоявшуюся систему письма , которая подверглась существенной стандартизации, поэтому демонстрирует меньше диалектных вариаций, чем разговорный язык. [1] [2] Эти процессы могут привести к окаменению моделей произношения, которые больше не наблюдаются в речи (например, would и should ); они также могут отражать преднамеренные попытки ввести вариативность ради национальной идентичности, как это видно на примере попыток Ноа Вебстера ввести легко заметные различия между американским и британским правописанием (например, honor и honor ).
Орфографические нормы развиваются посредством социального и политического влияния на различных уровнях, таких как встречи с печатью в образовании, на рабочем месте и в государстве. Некоторые страны создали языковые академии в попытке регулировать аспекты национального языка, включая его орфографию, например, Académie Française во Франции и Королевская испанская академия в Испании. Для большинства языков, включая английский, такого органа не существует. Некоторые негосударственные организации, такие как газеты и академические журналы , выбирают большую орфографическую однородность, применяя определенное руководство по стилю или стандарт правописания, такой как Оксфордское правописание .
Английское слово орфография впервые упоминается в XV веке, в конечном итоге оно произошло от древнегреческого : ὀρθός ( orthós «правильный») и γράφειν ( gráphein «писать»). [3]
Орфография в фонетических системах письма часто связана с вопросами правописания , то есть соответствия между написанными графемами и фонемами, встречающимися в речи. [4] [5] Другие элементы, которые можно считать частью орфографии, включают переносы , заглавные буквы , границы слов , ударение и пунктуацию . [6] Таким образом, орфография описывает или определяет символы, используемые в письме, и соглашения, которые регулируют их использование.
Большинство естественных языков, развившихся как устные языки и письменные системы, обычно создавались или адаптировались как способы представления разговорного языка. Правила для этого, как правило, стандартизируются для данного языка, что приводит к развитию орфографии, которая обычно считается «правильной». В лингвистике орфография часто относится к любому методу написания языка без суждения о правильном и неправильном, с научным пониманием того, что орфографическая стандартизация существует в спектре силы соглашения. Однако первоначальное значение слова подразумевает дихотомию правильного и неправильного, и слово по-прежнему чаще всего используется для обозначения конкретно стандартизированной предписывающей манеры письма. Проводится различие между эмической и этической точками зрения, при этом эмический подход учитывает восприятие правильности среди пользователей языка, а этический подход является чисто описательным, учитывая только эмпирические качества любой используемой системы.
Орфографические единицы, такие как буквы алфавита , концептуализируются как графемы . Это тип абстракции , аналогичный фонемам разговорных языков; различные физические формы письменных символов считаются представляющими одну и ту же графему, если различия между ними несущественны для смысла. Таким образом, графему можно рассматривать как абстракцию набора глифов , которые все функционально эквивалентны. Например, в письменном английском (или других языках, использующих латинский алфавит ) существуют два различных физических представления (глифа) строчной латинской буквы a : ⟨a⟩ и ⟨ɑ⟩ . Поскольку замена любого из них на другой не может изменить значение слова, они считаются аллографами одной и той же графемы, которая может быть записана как | a | . Формы курсива и полужирного начертания также являются аллографическими.
Графемы или их последовательности иногда помещаются между угловыми скобками, как в | b | или | back | . Это отличает их от фонематической транскрипции, которая помещается между косыми чертами ( /b/ , /bæk/ ), и от фонетической транскрипции , которая помещается между квадратными скобками ( [b] , [bæk] ).
Системы письма , на которых базируются орфографии, можно разделить на несколько типов в зависимости от того, какой тип единицы каждый символ служит для представления. Основными типами являются логографические (с символами, представляющими слова или морфемы), слоговые (с символами, представляющими слоги) и алфавитные (с символами, приблизительно представляющими фонемы). Многие системы письма сочетают в себе черты более чем одного из этих типов, и было предложено несколько подробных классификаций. Японский язык является примером системы письма, которая может быть записана с использованием комбинации логографических символов кандзи и слоговых символов хирагана и катакана ; как и во многих неалфавитных языках, алфавитные символы ромадзи также могут использоваться по мере необходимости. [7]
Орфографии, использующие алфавиты и слоговые азбуки , основаны на принципе, что письменные графемы соответствуют единицам звука разговорного языка: фонемам в первом случае и слогам во втором. Практически во всех случаях это соответствие не является точным. Орфографии разных языков предлагают разную степень соответствия между написанием и произношением. Например, английская , французская , датская и тайская орфографии крайне нерегулярны, тогда как орфографии таких языков, как русский , немецкий , испанский , финский , турецкий и сербскохорватский, представляют произношение гораздо более точно. [ необходима цитата ]
Орфография, в которой соответствия между написанием и произношением являются очень сложными или непоследовательными, называется глубокой орфографией (или, менее формально, говорят, что язык имеет нерегулярное написание ). Орфография с относительно простыми и последовательными соответствиями называется поверхностной (и язык имеет регулярное написание ).
Одной из главных причин расхождения правописания и произношения является то, что звуковые изменения , происходящие в разговорной речи, не всегда отражаются в орфографии, и, следовательно, правописание соответствует историческому, а не современному произношению. Одним из последствий этого является то, что многие правописания начинают отражать морфофонемную структуру слова, а не его чисто фонематическую структуру (например, английская правильная морфема прошедшего времени постоянно пишется как -ed, несмотря на ее разное произношение в разных словах). Это обсуждается далее в Фонематическая орфография § Морфофонемные особенности .
Слоговые буквы в японской системе письма ( хирагана и катакана ) являются примерами почти совершенно поверхностной орфографии: кана почти идеально соответствует произносимым слогам, хотя и с некоторыми исключениями, когда символы отражают исторические или морфонематические особенности: в частности, использование ぢji и づzu (а не じji и ずzu , их произношение на стандартном токийском диалекте), когда персонаж является озвучивание основного ち или つ (см. рендаку ) и использование は, を и へ для обозначения звуков わ, お и え как остатков исторического использования каны .
Корейская письменность хангыль и тибетское письмо изначально также имели крайне поверхностную орфографию, но как отражение современного языка они часто также отражают морфофонемные особенности.
Орфография, основанная на соответствии фонемам, иногда может не иметь символов для представления всех фонемных различий в языке. Это называется дефектной орфографией . Примером в английском языке является отсутствие какого-либо указания на ударение . [ требуется ссылка ] Другим примером является диграф | th | , который представляет две разные фонемы (как в then и thin ) и заменяет старые буквы | ð | и | þ | . Более систематическим примером являются абджады, такие как арабский и еврейский алфавиты, в которых краткие гласные обычно остаются ненаписанными и должны быть выведены читателем.
Когда алфавит заимствуется из исходного языка для использования с новым языком — как это было сделано с латинским алфавитом для многих языков или японской катаканой для неяпонских слов — он часто оказывается дефектным в представлении фонем нового языка. Иногда эта проблема решается с помощью таких приемов, как диграфы (например, | sh | и | ch | в английском языке, где пары букв представляют отдельные звуки), диакритические знаки (например, карон на буквах | š | и | č | , которые представляют те же звуки в чешском языке ), или добавление совершенно новых символов (как некоторые языки ввели букву | w | в латинский алфавит) или символов из другого алфавита, например, руна | þ | в исландском.
После классического периода греческий язык разработал систему строчных букв с диакритическими знаками, чтобы иностранцы могли изучать произношение и грамматические особенности. Поскольку произношение букв со временем менялось, диакритические знаки были сокращены до представления ударного слога. В современном греческом наборе эта система была упрощена до единственного ударения, указывающего, какой слог ударный. [8]