Широкие и узкие данные

Широкий и узкий (иногда несложенный и сложенный, или широкий и высокий) — термины, используемые для описания двух различных представлений табличных данных . [1] [2]

Широкий

Широкие или неструктурированные данные представлены с каждой отдельной переменной данных в отдельном столбце.

ЧеловекВозрастМассаВысота
Боб32168180
Элис24150175
Стив64144165

Узкий

Узкие, сгруппированные или длинные данные представлены в одном столбце, содержащем все значения, и в другом столбце, содержащем контекст значения.

ЧеловекПеременнаяЦенить
БобВозраст32
БобМасса168
БобВысота180
ЭлисВозраст24
ЭлисМасса150
ЭлисВысота175
СтивВозраст64
СтивМасса144
СтивВысота165

Зачастую это проще реализовать: добавление нового поля не требует никаких изменений в структуре таблицы, однако это может быть сложнее для понимания людьми.

Реализации

Многие статистические и системы обработки данных имеют функции для преобразования между этими двумя представлениями, например, язык программирования R имеет несколько пакетов, таких как пакет tidyr. Пакет pandas в Python реализует эту операцию как функцию «melt», которая преобразует широкую таблицу в узкую. Процесс преобразования узкой таблицы в широкую таблицу обычно называется «поворотом» в контексте преобразований данных. Пакет python «pandas» предоставляет метод «поворота», который обеспечивает преобразование узкой таблицы в широкую.

Смотрите также

Ссылки

  1. ^ Томпсон, М. Э. (1997), Теория выборочных обследований , Chapman & Hall, Лондон. ISBN  0-412-31780-X
  2. ^ Чантала, К. (2006) «Использование STATA для анализа данных выборочного обследования». 1-10-2001. UNC Chapel Hill, Carolina Population Center. 1-10-2006.
  • https://tidyr.tidyverse.org/articles/pivot.html
  • https://cran.r-project.org/web/packages/reshape
Получено с "https://en.wikipedia.org/w/index.php?title=Широкие_и_узкие_данные&oldid=1152014158"