Словенский национальный корпус

Словенский национальный корпус FidaPLUS — это корпус словенского языка , содержащий 621 миллион слов (токенов) , собранных из избранных текстов на словенском языке разных жанров и стилей, в основном из книг и газет. [1]

База данных FidaPLUS представляет собой обновление старого корпуса (FIDA), который был разработан в период с 1997 по 2000 год, с добавлением текстов, опубликованных до 2006 года, и является результатом прикладного исследовательского проекта факультета искусств, факультета социальных наук, Люблянского университета и кафедры технологий знаний Института Йожефа Стефана . [2]

Корпус доступен через менеджер корпусов Sketch Engine . [3] Эта версия корпуса FidaPLUS содержит наброски слов — автоматический обзор грамматического и словосочетательного поведения слов, полученный из корпуса.

Год изданияКоличество словПроцент
1979 - 1990262.7080,04%
19911.487.8950,24%
19922.256.6920,36%
19933.208.6870,52%
19947.534.6891,21%
19957.433.8971,2%
199616.913.9162.27%
199731.589.2505.09%
199843.512.0417.01%
199954.711.6308.81%
200057.677.5349,29%
200174.720.53212.03%
200272.802.48411,72%
200382.897.09713,35%
200467.041.16710,79%
200539.086.6956.29%
200644.526.8257.17%
Н/Д13.486.2612,17%

Ссылки

  1. ^ "FidaPLUS". Архивировано из оригинала 2010-11-14 . Получено 2012-03-15 .Количество слов FidaPLUS по дате публикации
  2. ^ "FidaPLUS". Архивировано из оригинала 2012-03-21 . Получено 2011-03-22 .Список команды FidaPLUS и институциональная принадлежность
  3. ^ Корпус FidaPLUS в Sketch Engine
  • Сайт Словенского национального корпуса FidaPLUS
Взято с "https://en.wikipedia.org/w/index.php?title=Slovenian_National_Corpus&oldid=1260340468"