По состоянию на ноябрь 2018 года пакет tidyverse и некоторые из его отдельных пакетов входят в 5 из 10 самых скачиваемых пакетов R. [6] Tidyverse является предметом множества книг и статей. [7] [8] [9] [10] В 2019 году экосистема была опубликована в журнале Journal of Open Source Software . [11]
Его синтаксис называют «в высшей степени читабельным» [12], и некоторые [13] утверждают, что tidyverse — это эффективный способ познакомить новичков с программированием, поскольку с педагогической точки зрения он позволяет студентам быстро приступить к выполнению задач по обработке данных. [14] [13] Более того, некоторые специалисты отмечают, что задачи по обработке данных интуитивно проще объединять в tidyverse по сравнению с эквивалентным пакетом обработки данных Python, pandas . [15] Вокруг tidyverse также существует активное сообщество R. Например, существует проект социальных данных TidyTuesday, организованный сообществом Data Science Learning Community (DSLC), [16] где каждую неделю публикуются разнообразные наборы данных реального мира для сообщества, чтобы оно могло участвовать, делиться, практиковаться и упрощать обучение работе с данными. [17] Критики tidyverse утверждают, что он продвигает инструменты, которым сложнее обучать и учиться, чем их встроенным базовым эквивалентам R, и которые слишком непохожи на некоторые языки программирования. [18] [19]
Принципы tidyverse в целом поощряют и помогают гарантировать, что вселенная оптимизированных пакетов, в принципе, поможет облегчить проблемы зависимости и совместимости с текущими и будущими функциями. [20] Примером такого подхода, основанного на принципах tidyverse, является pharmaverse, представляющий собой набор пакетов R для использования в клинической отчетности в фармацевтике . [21]
Пакеты
Основные пакеты tidyverse, которые предоставляют функциональные возможности для моделирования, преобразования и визуализации данных, включают: [22]
tidyr – помогает преобразовать данные в аккуратные данные , где каждая переменная является столбцом, каждое наблюдение является строкой; каждая строка является наблюдением, а каждое значение является ячейкой.
readr – помощь в чтении текстовых файлов с общими разделителями и данными
tibble – современная реализация встроенной структуры данных data frame
stringr – помогает манипулировать строковыми типами данных
forcats – помогает манипулировать типами данных категорий
Дополнительные пакеты помогают в сборе основных данных. [23] Регулярно разрабатываются другие пакеты, основанные на принципах tidy data, такие как tidytext [24] для анализа текста, tidymodels [25] для машинного обучения или tidyquant [26] для финансовых операций.
Ссылки
^ "Добро пожаловать в Tidyverse". Революции . Получено 2018-11-26 .
^ C., Boehmke, Bradley (2016-11-17). Data wrangling with R. Cham. ISBN9783319455990. OCLC 964404346.{{cite book}}: CS1 maint: местоположение отсутствует издатель ( ссылка ) CS1 maint: несколько имен: список авторов ( ссылка )
^ Хэдли, Уикхэм (2017). R для науки о данных: импорт, очистка, преобразование, визуализация и моделирование данных . Гролемунд, Гарретт (первое издание). Севастополь, Калифорния. ISBN9781491910399. OCLC 968213225.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
^ Уикхэм, Хэдли; Аверик, Мара; Брайан, Дженнифер; Чанг, Уинстон; Макгоуэн, Люси Д'Агостино; Франсуа, Ромен; Гролемунд, Гарретт; Хейс, Алекс; Генри, Лайонел; Хестер, Джим; Кун, Макс; Педерсен, Томас Лин; Миллер, Эван; Баше, Стефан Милтон; Мюллер, Кирилл; Оомс, Йерун; Робинсон, Дэвид; Зайдель, Дана Пейдж; Спину, Витали; Такахаши, Коске; Воган, Дэвис; Вилке, Клаус; Ву, Кара; Ютани, Хироаки (21 ноября 2019 г.). «Добро пожаловать в Tidyverse». Журнал программного обеспечения с открытым исходным кодом . 4 (43): 1686. Bibcode : 2019JOSS....4.1686W. doi : 10.21105/joss.01686 . S2CID 214002773.
^ Steinmetz, Art (10.04.2024). «Наука о внешних данных — правда о аккуратных обертках». outsiderdata.netlify.app . Получено 11.04.2024 .
^ ab Heppler, Jason (27.02.2018). «Обучение новичков R tidyverse». Medium . Получено 24.08.2023 .
^ on, Teach the tidyverse to beginners был опубликован (5 июля 2017 г.). "Teach the tidyverse to beginners". Variance Explained . Получено 2022-07-15 .
^ "Почему pandas кажется неуклюжим, когда исходит из R". Блог Расмуса Боата . Получено 2024-03-30 .
^ "dslc.io". dslc.io . Получено 2024-08-11 .
^ rfordatascience/tidytuesday, Сообщество по изучению науки о данных, 2024-08-11 , получено 2024-08-11
^ Мэтлофф, Норм (30 сентября 2019 г.). «Мнение о «диалекте» языка R в Tidyverse». GitHub . Получено 28 октября 2019 г.
↑ Мюнхен, Боб (23 марта 2017 г.). «Проклятие Tidyverse». r4stats.com .
^ «Сила перехода к подходу «-verse» в разработке пакетов R». www.appsilon.com . Получено 11 августа 2024 г.