Родерик Дж.А. Литтл

Доктор философии, Лондонский университет, 1974 г.
Родерик Дж. Литтл
РДЖА Литтл
Национальностьбританский
ОбразованиеКембриджский университет
Имперский колледж Лондона
Научная карьера
ПоляСтатистика
УчрежденияUSEPA
USCB
Университет Джорджа Вашингтона
Калифорнийский университет в Лос-Анджелесе
Мичиганский университет
ТезисПропущенные значения в многомерном статистическом анализе  (1974)
Руководители докторской диссертации
Докторанты

Родерик Джозеф Александр Литтл — академический статистик, чьи основные научные вклады лежат в статистическом анализе данных с пропущенными значениями и анализе данных комплексных выборочных обследований. Литтл — заслуженный профессор биостатистики имени Ричарда Д. Ремингтона на кафедре биостатистики Мичиганского университета , где он также занимает академические должности на кафедре статистики и в Институте социальных исследований.

Образование

Литтл родился недалеко от Лондона, Англия, и учился в средней школе в Академии Глазго в Шотландии. Он получил степень бакалавра по математике в колледже Гонвилла и Кая , Кембриджский университет, а также степень магистра по статистике и операционным исследованиям и степень доктора философии по статистике в Имперском колледже науки и технологий Лондонского университета. Его докторская диссертация была посвящена анализу данных с пропущенными значениями [1] и была написана под руководством профессоров Мартина Биля и сэра Дэвида Р. Кокса.

Карьера

После двухлетней постдокторантуры на кафедре статистики Чикагского университета в 1974-76 годах Литтл работал в World Fertility Survey [2] с 1976 по 1980 год под руководством сэра Мориса Кендалла . В 1980-82 годах он присоединился к группе, сформированной Дональдом Рубином в Агентстве по охране окружающей среды США в Вашингтоне, округ Колумбия, а в 1982-3 годах он был научным сотрудником ASA/Census/NSF в Бюро переписи населения США и адъюнкт-профессором в Университете Джорджа Вашингтона . В 1983-93 годах он был доцентом, а затем профессором на кафедре биоматематики в Калифорнийском университете в Лос-Анджелесе . Он был назначен профессором и заведующим кафедрой биостатистики Мичиганского университета в 1993 году и возглавлял кафедру в течение 11 лет с 1993 по 2009 год, в период интенсивного роста кафедры.

Статистический анализ с отсутствующими данными

Основной исследовательский интерес Литтла — анализ наборов данных с пропущенными значениями. Многие статистические методы предназначены для полных прямоугольных наборов данных, но на практике многие наборы данных содержат пропущенные значения, либо намеренно, либо случайно. В 1987 году Литтл стал соавтором книги [3] [4] с Дональдом Рубином, которая была одним из самых ранних систематических исследований этой темы; 2-е издание было опубликовано в 2002 году, а 3-е — в 2019 году. Как подробно описано в этой книге, первоначальные статистические подходы к пропущенным значениям были относительно специальными, такими как отбрасывание неполных случаев или замена средних значений. Основное внимание в книге уделяется методам вывода на основе правдоподобия, таким как максимальное правдоподобие и байесовский вывод, основанным на статистических моделях для данных и механизма пропущенных данных. 1-е издание в основном фокусировалось на максимальном правдоподобии с помощью алгоритма максимизации ожидания (EM), но более поздние издания подчеркивают байесовские методы и связанную с ними технику множественного вменения. Литтл и Рубин были награждены престижной премией Карла Пирсона в 2017 году Международным статистическим институтом (ISI), ведущим международным статистическим обществом, за исследовательский вклад, который оказал «глубокое влияние на статистическую теорию, методологию или приложения». Цитата для награды была следующей: «Работа Родерика Дж. Литтла и Дональда Б. Рубина, изложенная в их основополагающих статьях Biometrika 1978 года и книге 1987 года, обновленной в 2002 году, была не менее чем определяющей и преобразующей. Ранее работа с отсутствующими данными была в лучшем случае ad hoc. Литтл и Рубин определили область и предоставили методологическим и прикладным сообществам полезную и пригодную для использования таксономию и набор ключевых результатов. Сегодня их терминология и методология используются больше, чем когда-либо. Их работа трансформируется из-за глубокого влияния, которое она оказала и оказывает как на статистическую практику, так и на теорию. Это одна из редких тем, которая в течение последних тридцати лет продолжала изучаться и разрабатываться в академических кругах, правительстве и промышленности. Например, он играет ключевую роль в текущей работе по анализу чувствительности с неполными данными».

Исследование недостающих данных

Основной методологический вклад Литтла в методы пропущенных данных, в сотрудничестве с его студентами и коллегами, включает методы пропущенных данных для смесей непрерывных и категориальных данных с использованием общей модели местоположения, [5] модели смешивания паттернов [6] для данных, которые пропущены неслучайно, модели штрафного сплайна склонности для пропущенных данных [7] и причинно-следственного вывода, [8] методы игнорируемого правдоподобия подвыборки [9] в регрессии, модели прокси-смешивания паттернов [10] для неответов на опросы, модели для продольных данных, [11] [12] [13] модели частично пропущенных случайных данных, [14] и обзорные статьи по пропущенным данным в регрессии, [15] импутация по принципу «горячей колоды» [16] и маскирование данных для защиты конфиденциальности. [17]

Байесовский анализ данных опроса

Еще одной областью исследований является анализ данных, собранных с помощью сложных выборочных проектов, включающих стратификацию и кластеризацию единиц. Работая статистиком в World Fertility Survey, Литтл работал над разработкой методов на основе моделей для анализа опросов, которые устойчивы к неправильной спецификации, достаточно эффективны и могут быть реализованы в прикладных условиях. Вклады со студентами и коллегами в этой области включают статьи о неответах на опросы, [18] [19] [20] [21] [22] байесовских методах вывода опросов, [23] [24] постстратификации, [25] оценке смещения отбора, [26] и взвешивании опросов с байесовской точки зрения. [27] [28]

Калиброванный байесовский вывод

Литтл выступает за калиброванный байесовский подход к статистическому анализу, [29] [30] , предложенный Джорджем Боксом и Дональдом Рубином , среди прочих. Идея состоит в том, чтобы разработать байесовские модели для анализа, которые дают байесовские выводы с хорошими частотными свойствами, такими как апостериорные достоверные интервалы, которые имеют близкое к номинальному покрытие, если рассматривать их как доверительные интервалы при повторной выборке. В области выборки обследований это приводит к моделям, которые включают особенности дизайна выборки в байесовской модели. Литтл утверждает, что эта байесова структура дает более унифицированный подход к выводу выборки обследований, чем подход на основе дизайна, который опирается на распределение рандомизации, лежащее в основе отбора выборки, в качестве основы для вывода. Прикладные интересы Литтла в статистике широки, включая психическое здоровье, демографию, экологическую статистику, биологию, экономику, медицину, общественное здравоохранение и социальные науки, а также биостатистику.

Деятельность в федеральной статистике США

Литтл является убежденным сторонником важности независимых государственных статистических агентств для демократии. Он проработал два срока в Комитете по национальной статистике Национальной академии наук, а в 2010-12 годах был первым заместителем директора по исследованиям и методологии обследований и главным научным сотрудником Бюро переписи населения США , должность, которая повысила научные аспекты деятельности Бюро переписи населения. Он участвовал во многих комиссиях Национальной академии наук, в частности возглавлял исследования рассеянного склероза и других неврологических расстройств у ветеранов войн в Персидском заливе и после 11 сентября, а также по лечению недостающих данных в клинических испытаниях. Он активно консультировал Управление по контролю за продуктами и лекарствами США и фармацевтические компании по методам обработки недостающих данных в клинических исследованиях [31] [32] [33] [34] [35]

Деятельность Американской статистической ассоциации

Литтл два срока прослужил в Совете директоров Американской статистической ассоциации (ASA), сначала в качестве представителя редакции, а затем вице-президента. В редакционной работе он был редактором-координатором и редактором приложений журнала Американской статистической ассоциации в 1992-4 годах, а позднее, будучи председателем секции методов исследования опросов ASA, помог начать новый академический журнал по статистике опросов, Journal of Survey Statistics and Methodology. Он был главным соредактором по статистике этого журнала в 2016-18 годах. В 2016 году Литтл получил премию Founder's Award [36] от ASA за вклад в профессию статистиков.

Почести

Литтл является членом Американской статистической ассоциации и Американской академии искусств и наук , а также членом Международного статистического института и Национальной медицинской академии США . В 2005 году он получил мемориальную премию ASA Wilks за вклад в статистику. Пленарные доклады включают приглашенное выступление президента 2005 года и лекцию Фишера COPSS 2012 года на совместных статистических совещаниях, а также приглашенное выступление президента на Восточно-североамериканском региональном совещании Международного биометрического общества 2018 года . В 2020 году он получил премию Марвина Зелена за лидерство в статистической науке от Гарвардского университета.

Ссылки

  1. ^ Beale, EML; Little, RJA (1975). «Пропущенные значения в многомерном анализе». Журнал Королевского статистического общества. Серия B (методологическая) . 37 (1): 129–145. doi :10.1111/j.2517-6161.1975.tb01037.x. JSTOR  2984998.
  2. ^ Little, RJA (1988). «Некоторые вопросы статистического анализа в Мировом обзоре рождаемости». Американский статистик . 42 (1): 31–36. doi :10.2307/2685258. JSTOR  2685258. PMID  12315059.
  3. ^ Mislevy, RJ (1991). «Обзоры книг: статистический анализ с отсутствующими данными». Журнал образовательной статистики . 16 (2): 150–155.
  4. ^ Little, RJA & Rubin, DB (2019). Статистический анализ с пропущенными данными (3-е изд.). Нью-Йорк: John Wiley.{{cite book}}: CS1 maint: multiple names: authors list (link)
  5. ^ Little, RJA & Schluchter, MD (1985). «Оценка максимального правдоподобия для смешанных непрерывных и категориальных данных с пропущенными значениями». Biometrika . 72 (3): 497–512. doi :10.1093/biomet/72.3.497.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  6. ^ Little, RJA (1993). «Модели смешанных паттернов для многомерных неполных данных». Журнал Американской статистической ассоциации . 88 (421): 125–134. doi :10.2307/2290705. JSTOR  2290705.
  7. ^ Чжан, Г. и Литтл, Р. Дж. (2009). «Расширения метода предсказания склонности со штрафным сплайном для вменения». Биометрия . 65 (3): 911–8. doi : 10.1111/j.1541-0420.2008.01155.x. hdl : 2027.42/57686 . PMID  19053998. S2CID  2145590.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  8. ^ Чжоу, Т., Эллиотт, М. Р. и Литтл, Р. Дж. (19 апреля 2019 г.). «Методы штрафного сплайна склонности для сравнения лечения (с обсуждением и ответом)». Журнал Американской статистической ассоциации . 114 (525): 1–38. doi : 10.1080/01621459.2018.1518234. S2CID  146066305.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  9. ^ Little, RJ & Zhang, N (2011). «Игнорируемое правдоподобие подвыборки для регрессионного анализа с отсутствующими данными». Журнал Королевского статистического общества, серия C (прикладная статистика) . 60 (4): 591–605. doi : 10.1111/j.1467-9876.2011.00763.x. hdl : 2027.42/86948 . S2CID  53684702.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  10. ^ Андридж, Р. Х. и Литтл, Р. Дж. (2011). «Анализ смеси прокси-шаблонов для неответов на опрос». Журнал официальной статистики . 27 (2): 153–180.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  11. ^ Little, RJA & Yau, L. (1996). «Анализ намерения лечиться в продольных исследованиях с выбыванием». Биометрия . 52 (4): 1324–1333. doi :10.2307/2532847. JSTOR  2532847. PMID  8962456.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  12. ^ Little, RJA (1995). «Моделирование механизма выбывания в лонгитюдных исследованиях». Журнал Американской статистической ассоциации . 90 : 1112–1121. doi :10.2307/2291350. JSTOR  2291350.
  13. ^ Ланге, К., Литтл, Р. Дж. А. и Тейлор, Дж. М. Г. (1989). «Надежное статистическое моделирование с использованием распределения Т». Журнал Американской статистической ассоциации . 84 (881896): 881–896. doi :10.2307/2290063. JSTOR  2290063.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  14. ^ Little, RJ, Rubin, DB & Zanganeh, SZ (2016). «Условия игнорирования механизма пропущенных данных в выводах правдоподобия для подмножеств параметров». Журнал Американской статистической ассоциации . 112 (517): 314–320. doi :10.1080/01621459.2015.1136826. S2CID  126196078.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  15. ^ Little, RJA (1992). «Регрессия с пропущенными X: обзор». Журнал Американской статистической ассоциации . 87 (420): 1227–1237. doi :10.2307/2290664. JSTOR  2290664.
  16. ^ Andridge*, RH & Little, RJ (2010). «Обзор метода импутации методом горячей колоды для неответов на опрос». International Statistical Review . 78 (1): 40–64. doi :10.1111/j.1751-5823.2010.00103.x. PMC 3130338. PMID  21743766 . {{cite journal}}: CS1 maint: multiple names: authors list (link)
  17. ^ Little, RJA (1993). «Статистический анализ замаскированных данных». Журнал официальной статистики . 9 : 407–426.
  18. ^ Little, RJA & Vartivarian, S. (2005). «Увеличивает ли взвешивание неответов дисперсию средних значений опроса?». Survey Methodology . 31 : 161–168.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  19. ^ Little, RJ & Vartivarian, S. (2003). «О взвешивании показателей в весах неответов». Статистика в медицине . 22 (9): 1589–99. doi :10.1002/sim.1513. hdl : 2027.42/34860 . PMID  12704617. S2CID  25347022.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  20. ^ Little, RJA (1988). «Корректировка отсутствующих данных в крупных обследованиях». Журнал деловой и экономической статистики . 6 (3): 287–296. doi :10.2307/1391878. JSTOR  1391878.
  21. ^ Little, RJA (1982). «Модели неответов в выборочных обследованиях». Журнал Американской статистической ассоциации . 77 (378): 237–250. doi :10.2307/2287227. JSTOR  2287227.
  22. ^ Little, RJA (1988). «Корректировка отсутствующих данных в крупных обследованиях». Журнал деловой и экономической статистики . 6 (3): 287–296. doi :10.2307/1391878. JSTOR  1391878.
  23. ^ Литтл, Р. Дж. «Калиброванный Байес: альтернативная парадигма вывода для официальной статистики (с обсуждением и возражениями)». Журнал официальной статистики . 28 (3): 309–372.
  24. ^ Little, RJA (2004). «Моделировать или не моделировать? конкурирующие режимы вывода для выборки конечной популяции». Журнал Американской статистической ассоциации . 99 (466): 546–556. doi :10.1198/016214504000000467. S2CID  49574932.
  25. ^ Little, RJA (1993). "Постстратификация: точка зрения разработчика моделей". Журнал Американской статистической ассоциации . 88 : ification: точка зрения разработчика моделей. Журнал Американской статистической ассоциации 88. doi :10.2307/2290705. JSTOR  2290705.
  26. ^ Little, RJ, West, BT, Boonstra, PS & Hu, J. (2019). «Измерения степени отклонения от игнорируемого отбора выборки». Журнал статистики и методологии обследований . 8 (5): 932–964. doi :10.1093/jssam/smz023. PMC 7750890. PMID  33381610 . {{cite journal}}: CS1 maint: multiple names: authors list (link)
  27. ^ Чжэн, Х. и Литтл, Р. Дж. (2003). «Оценка конечной совокупности на основе модели сплайна со штрафом из выборок, пропорциональных размеру вероятности». Журнал официальной статистики . 19 (2): 99–117.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  28. ^ Эллиотт, MR и Литтл, RJA (2000). «Альтернативы на основе моделей для сокращения весов обследований». Журнал официальной статистики . 16 (3): 191–209.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  29. ^ Little, RJA (2006). «Калиброванный Байес: дорожная карта Байеса/частотника». The American Statistician . 60 (3): 213–223. doi :10.1198/000313006X117837. S2CID  53505632.
  30. ^ Литтл, Р. Дж. «Калиброванный Байес: альтернативная парадигма вывода для официальной статистики (с обсуждением и возражениями)». Журнал официальной статистики . 28 (3): 309–372.
  31. ^ Little, RJ & Rubin, DB (2000). «Причинные эффекты в клинических и эпидемиологических исследованиях через потенциальные результаты: концепции и аналитические подходы». Annual Review of Public Health . 21 : 121–145. doi : 10.1146/annurev.publhealth.21.1.121 . PMID  10884949.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  32. ^ Little, RJ, Wang, J., Sun, X., Tian, ​​H., Suh, EY., Lee, M., Sarich, T., Oppenheimer, L., Plotnikov, A., Wittes, J., Cook-Bruns, N., Burton, P., Gibson, M., & Mohanty, S. (2016). "Oppenheimer, L., Plotnikov, A., Wittes, J., Cook-Bruns, N., Burton, P., Gibson, M., & Mohanty, S. (2016). Обработка отсутствующих данных в большом исследовании сердечно-сосудистых клинических исходов". Клинические испытания . 13 (3): 344–351. doi :10.1177/1740774515626411. PMID  26908543. S2CID  41268081.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  33. ^ Little, RJ & Kang, S. (2015). «Анализ намерения лечить с прекращением лечения и отсутствующими данными в клинических испытаниях». Статистика в медицине . 34 (16): 2381–2390. doi : 10.1002/sim.6352. hdl : 2027.42/112012 . PMID  25363683. S2CID  8735358.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  34. ^ Little, RJ, Long, Q. & Lin, X. (2009). «Сравнение методов оценки причинного эффекта лечения в рандомизированных клинических испытаниях с учетом несоблюдения». Биометрия . 65 (2): 640–9. doi :10.1111/j.1541-0420.2008.01066.x. hdl : 2027.42/65200 . PMID  18510650. S2CID  4843005.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  35. ^ Little, RJ, D'Agostino, R., Cohen, ML, Dickersin, K., Emerson, SS, Farrar, JT, Frangakis, C., Hogan, JW, Molenberghs, G., Murphy, SA, Rotnitsky, A., Scharfstein, D., Neaton, JD, Shih, W., Siegel, JP, Stern, H. (2012). "Специальный отчет: профилактика и лечение отсутствующих данных в клинических испытаниях". New England Journal of Medicine . 367 (14): 1355–1360. doi :10.1056/NEJMsr1203730. PMC 3771340. PMID  23034025 . {{cite journal}}: CS1 maint: multiple names: authors list (link)
  36. ^ "Премия основателей". www.amstat.org . Американская статистическая ассоциация.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Roderick_J._A._Little&oldid=1217724455"