Tidyverse

Коллекция пакетов R
Tidyverse
Репозиторийgithub.com/tidyverse/tidyverse
Написано вР
ТипСбор пакетов
ЛицензияМассачусетский технологический институт
Веб-сайтwww.tidyverse.org

Tidyverse — это коллекция пакетов с открытым исходным кодом для языка программирования R, представленная Хэдли Уикхэмом [1] и его командой, которые «разделяют базовую философию дизайна, грамматику и структуры данных» tidy data . [2] Характерные особенности пакетов tidyverse включают широкое использование нестандартной оценки и поощрение конвейеризации . [3] [4] [5]

По состоянию на ноябрь 2018 года пакет tidyverse и некоторые из его отдельных пакетов входят в 5 из 10 самых скачиваемых пакетов R. [6] Tidyverse является предметом множества книг и статей. [7] [8] [9] [10] В 2019 году экосистема была опубликована в журнале Journal of Open Source Software . [11]

Его синтаксис называют «в высшей степени читабельным» [12], и некоторые [13] утверждают, что tidyverse — это эффективный способ познакомить новичков с программированием, поскольку с педагогической точки зрения он позволяет студентам быстро приступить к выполнению задач по обработке данных. [14] [13] Более того, некоторые специалисты отмечают, что задачи по обработке данных интуитивно проще объединять в tidyverse по сравнению с эквивалентным пакетом обработки данных Python, pandas . [15] Вокруг tidyverse также существует активное сообщество R. Например, существует проект социальных данных TidyTuesday, организованный сообществом Data Science Learning Community (DSLC), [16] где каждую неделю публикуются разнообразные наборы данных реального мира для сообщества, чтобы оно могло участвовать, делиться, практиковаться и упрощать обучение работе с данными. [17] Критики tidyverse утверждают, что он продвигает инструменты, которым сложнее обучать и учиться, чем их встроенным базовым эквивалентам R, и которые слишком непохожи на некоторые языки программирования. [18] [19]

Принципы tidyverse в целом поощряют и помогают гарантировать, что вселенная оптимизированных пакетов, в принципе, поможет облегчить проблемы зависимости и совместимости с текущими и будущими функциями. [20] Примером такого подхода, основанного на принципах tidyverse, является pharmaverse, представляющий собой набор пакетов R для использования в клинической отчетности в фармацевтике . [21]

Пакеты

Основные пакеты tidyverse, которые предоставляют функциональные возможности для моделирования, преобразования и визуализации данных, включают: [22]

  • ggplot2 – для визуализации данных
  • dplyr – для обработки и преобразования данных
  • tidyr – помогает преобразовать данные в аккуратные данные , где каждая переменная является столбцом, каждое наблюдение является строкой; каждая строка является наблюдением, а каждое значение является ячейкой.
  • readr – помощь в чтении текстовых файлов с общими разделителями и данными
  • purrr – набор инструментов для функционального программирования
  • tibble – современная реализация встроенной структуры данных data frame
  • stringr – помогает манипулировать строковыми типами данных
  • forcats – помогает манипулировать типами данных категорий

Дополнительные пакеты помогают в сборе основных данных. [23] Регулярно разрабатываются другие пакеты, основанные на принципах tidy data, такие как tidytext [24] для анализа текста, tidymodels [25] для машинного обучения или tidyquant [26] для финансовых операций.

Ссылки

  1. ^ "Добро пожаловать в Tidyverse". Революции . Получено 2018-11-26 .
  2. ^ "Tidyverse". www.tidyverse.org . Получено 2018-11-26 .
  3. ^ Wickham, Stefan Milton Bache и Hadley (2014-11-22), magrittr: Оператор прямого конвейера для R , получено 2020-04-20
  4. ^ Уикхем, Хэдли. 4 трубы | Руководство по стилю tidyverse.
  5. ^ Wickham, Hadley (30 мая 2019 г.). Advanced R (2-е изд.). Нью-Йорк: Chapman & Hall . ISBN 978-0815384571.{{cite book}}: CS1 maint: дата и год ( ссылка )
  6. ^ "RDocumentation". www.rdocumentation.org . Получено 2018-11-26 .
  7. ^ Дагган, Джим (2018-09-07). «Анализ входных и выходных данных для моделирования системной динамики с использованием библиотек tidyverse R». System Dynamics Review . 34 (3): 438– 461. doi : 10.1002/sdr.1600. hdl : 10379/15029 . ISSN  0883-7066. S2CID  70005357.
  8. ^ Чанг, Уинстон (2013). R Graphics Cookbook. "O'Reilly Media, Inc.". ISBN 9781449316952.
  9. ^ C., Boehmke, Bradley (2016-11-17). Data wrangling with R. Cham. ISBN 9783319455990. OCLC  964404346.{{cite book}}: CS1 maint: местоположение отсутствует издатель ( ссылка ) CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Хэдли, Уикхэм (2017). R для науки о данных: импорт, очистка, преобразование, визуализация и моделирование данных . Гролемунд, Гарретт (первое издание). Севастополь, Калифорния. ISBN 9781491910399. OCLC  968213225.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  11. ^ Уикхэм, Хэдли; Аверик, Мара; Брайан, Дженнифер; Чанг, Уинстон; Макгоуэн, Люси Д'Агостино; Франсуа, Ромен; Гролемунд, Гарретт; Хейс, Алекс; Генри, Лайонел; Хестер, Джим; Кун, Макс; Педерсен, Томас Лин; Миллер, Эван; Баше, Стефан Милтон; Мюллер, Кирилл; Оомс, Йерун; Робинсон, Дэвид; Зайдель, Дана Пейдж; Спину, Витали; Такахаши, Коске; Воган, Дэвис; Вилке, Клаус; Ву, Кара; Ютани, Хироаки (21 ноября 2019 г.). «Добро пожаловать в Tidyverse». Журнал программного обеспечения с открытым исходным кодом . 4 (43): 1686. Bibcode : 2019JOSS....4.1686W. doi : 10.21105/joss.01686 . S2CID  214002773.
  12. ^ Steinmetz, Art (10.04.2024). «Наука о внешних данных — правда о аккуратных обертках». outsiderdata.netlify.app . Получено 11.04.2024 .
  13. ^ ab Heppler, Jason (27.02.2018). «Обучение новичков R tidyverse». Medium . Получено 24.08.2023 .
  14. ^ on, Teach the tidyverse to beginners был опубликован (5 июля 2017 г.). "Teach the tidyverse to beginners". Variance Explained . Получено 2022-07-15 .
  15. ^ "Почему pandas кажется неуклюжим, когда исходит из R". Блог Расмуса Боата . Получено 2024-03-30 .
  16. ^ "dslc.io". dslc.io . Получено 2024-08-11 .
  17. ^ rfordatascience/tidytuesday, Сообщество по изучению науки о данных, 2024-08-11 , получено 2024-08-11
  18. ^ Мэтлофф, Норм (30 сентября 2019 г.). «Мнение о «диалекте» языка R в Tidyverse». GitHub . Получено 28 октября 2019 г.
  19. Мюнхен, Боб (23 марта 2017 г.). «Проклятие Tidyverse». r4stats.com .
  20. ^ «Сила перехода к подходу «-verse» в разработке пакетов R». www.appsilon.com . Получено 11 августа 2024 г.
  21. ^ "pharmaverse". pharmaverse.org . Получено 2024-08-11 .
  22. ^ "Пакеты Tidyverse - Tidyverse" . Получено 2018-11-26 .
  23. ^ "Пакеты Tidyverse". www.tidyverse.org . Получено 22.12.2020 .
  24. ^ Силге, Джулия (2023-02-01), tidytext: Анализ текста с использованием инструментов tidy , получено 2023-02-03
  25. ^ "Tidymodels". www.tidymodels.org . Получено 2023-02-03 .
  26. ^ "Tidy Quantitative Financial Analysis". business-science.github.io . Получено 2023-02-03 .
Взято с "https://en.wikipedia.org/w/index.php?title=Tidyverse&oldid=1250941512"