Сонг-Чун Чжу

Китайский математик (родился в 1968 году)
Сонг-Чун Чжу
朱松纯
РожденныйИюнь 1968 г. (56 лет)
Эчжоу , Хубэй , Китай
Альма-матерКитайский университет науки и технологий ( бакалавр наук ),
Гарвардский университет ( магистр наук , доктор философии )
Род занятийСпециалист по информатике, прикладной математик
ДетиЧжу И
НаградыПремия имени Гельмгольца «Испытание временем» Премия имени Дэвида Марра,
стипендиат IEEE
Научная карьера
ПоляИнформатика
Прикладная математика
УчрежденияПекинский университет
Калифорнийский университет, Лос-Анджелес
ТезисСтатистические и вычислительные теории сегментации изображений, моделирования текстур и распознавания объектов  (1996)
научный руководительДэвид Мамфорд
Веб-сайтwww.stat.ucla.edu/~sczhu

Сон-Чунь Чжу ( кит .朱松纯; родился в июне 1968 г.) — китайский учёный-компьютерщик и прикладной математик, известный своими работами в области компьютерного зрения , когнитивного искусственного интеллекта и робототехники . В настоящее время Чжу работает в Пекинском университете , а ранее был профессором кафедр статистики и компьютерных наук Калифорнийского университета в Лос-Анджелесе . [1] Ранее Чжу также занимал должность директора Центра зрения, познания, обучения и автономии Калифорнийского университета в Лос-Анджелесе (VCLA). [2]

В 2005 году Чжу основал Lotus Hill Institute, независимую некоммерческую организацию для содействия международному сотрудничеству в области компьютерного зрения и распознавания образов . [3] Чжу опубликовал множество работ и читал лекции по всему миру об искусственном интеллекте, а в 2011 году он стал членом IEEE ( Институт инженеров по электротехнике и электронике ) за «вклад в статистическое моделирование, обучение и выводы в области компьютерного зрения». [4]

У Чжу две дочери, Стефани и И. [5] Чжу И ( кит. :朱易) — профессиональная фигуристка . [6]

Ранняя жизнь и образование

Родившийся и выросший в Эчжоу , Китай, Чжу в юности черпал вдохновение в разработке компьютеров, играя в шахматы, что пробудило в нем интерес к искусственному интеллекту. В 1991 году Чжу получил степень бакалавра в области компьютерных наук в Университете науки и технологий Китая в Хэфэе . Во время учебы в бакалавриате Чжу, найдя вычислительную теорию зрения покойного нейробиолога из Массачусетского технологического института Дэвида Марра глубоко влиятельной, стремился заняться общей унифицированной теорией зрения и ИИ. [7] В 1992 году Чжу продолжил изучение компьютерного зрения в Гарвардской высшей школе искусств и наук . В Гарварде Чжу учился под руководством американского математика Дэвида Мамфорда и получил введение в «вероятно приблизительно правильное» (PAC) обучение под руководством Лесли Валианта . Чжу завершил свое обучение в Гарварде в 1996 году, получив докторскую степень. в области компьютерных наук и последовал за Мамфордом на отделение прикладной математики в Университете Брауна в качестве постдокторанта. [3]

Карьера

После своей постдокторской стипендии Чжу недолго читал лекции на кафедре компьютерных наук Стэнфордского университета . В 1998 году он присоединился к Университету штата Огайо в качестве доцента на кафедрах компьютерных наук и когнитивных наук. В 2002 году Чжу присоединился к Калифорнийскому университету в Лос-Анджелесе на кафедрах компьютерных наук и статистики в качестве доцента, поднявшись до звания полного профессора в 2006 году. В Калифорнийском университете в Лос-Анджелесе Чжу основал Центр зрения, познания, обучения и автономии. Его главный исследовательский интерес заключался в создании единой статистической и вычислительной структуры для зрения и интеллекта, которая включает в себя пространственный, временной и причинный график И-ИЛИ (STC-AOG) в качестве единого представления и многочисленные методы Монте-Карло для вывода и обучения. [8] [9]

В 2005 году Чжу основал независимую некоммерческую организацию в своем родном городе Эчжоу, Lotus Hill Institute (LHI). LHI занимается сбором крупномасштабных наборов данных изображений и аннотированием объектов, сцен и видов деятельности, получив вклад от многих известных ученых, включая Гарри Шума . В институте также есть постоянная команда аннотаторов для анализа структур изображений, накопившая на сегодняшний день более 500 000 изображений. [ необходима цитата ]

С момента основания LHI Чжу организовал множество семинаров и конференций, а также был генеральным председателем как Конференции по компьютерному зрению и распознаванию образов (CVPR) 2012 года в Провиденсе, штат Род-Айленд , где он вручил Ульфу Гренандеру медаль «Пионер», так и CVPR 2019 года, состоявшейся в Лонг-Бич, штат Калифорния . [10]

В июле 2017 года Чжу основал DMAI в Лос-Анджелесе как стартап в области искусственного интеллекта, занимающийся разработкой единой когнитивной платформы искусственного интеллекта. [11]

В сентябре 2020 года Чжу вернулся в Китай, чтобы присоединиться к Пекинскому университету и возглавить его Институт искусственного интеллекта, таким образом присоединившись к другому китайскому эксперту по ИИ в США и давнему знакомому Чжу, бывшему руководителю отдела искусственного интеллекта и исследований Microsoft Гарри Шуму. В августе Шум также был назначен Пекинским университетом председателем академического комитета Института искусственного интеллекта. [12]

Чжу работает над созданием нового и отдельного института исследований ИИ - Пекинского института общего искусственного интеллекта (BIGAI). Согласно введению, основанный на парадигме «малые данные для больших задач», BIGAI фокусируется на передовых технологиях ИИ, междисциплинарной интеграции, международном академическом обмене, чтобы воспитывать новое поколение молодых талантов в области ИИ. [12] Ожидается, что институт объединит профессиональных исследователей, ученых и экспертов, чтобы воплотить в жизнь теоретическую основу искусственного интеллекта Чжу и совместно продвигать китайские оригинальные технологии ИИ и создавать новое поколение общих платформ ИИ. [ необходима ссылка ]

Исследования и работа

Чжу опубликовал более трехсот статей в рецензируемых журналах и сборниках трудов по следующим четырем этапам:

Новаторские статистические модели для формулирования концепций в рамках Марра

В начале 1990-х годов Чжу с соавторами в группе теории образов разработали передовые статистические модели для компьютерного зрения. Сосредоточившись на разработке унифицированной статистической структуры для ранних представлений зрения, представленных в посмертно опубликованной работе Дэвида Марра под названием Vision , они сначала сформулировали текстуры в новой модели случайного поля Маркова , называемой FRAME, используя принцип минимаксной энтропии для введения открытий в области нейронауки и психофизики в распределения Гиббса в статистической физике. [13] Затем они доказали эквивалентность между моделью FRAME и микроканоническим ансамблем, [14] который они назвали ансамблем Жюлеша. Эта работа получила почетную номинацию на премию Марра во время Международной конференции по компьютерному зрению (ICCV) в 1999 году. [15]

В 1990-х годах Чжу разработал два новых класса нелинейных уравнений в частных производных (PDE). Один класс для сегментации изображений называется конкуренцией областей. [16] Эта работа, связывающая PDE со статистическими моделями изображений, получила премию Helmholtz Test of Time Award в ICCV 2013. Другой класс, называемый GRADE (уравнения реакции и диффузии Гиббса), был опубликован в 1997 году и использует подход динамики Ланжевена для вывода и обучения стохастическому градиентному спуску (SGD). [17]

В начале 2000-х годов Чжу сформулировал текстоны [18], используя генеративные модели с теорией разреженного кодирования, и интегрировал как модели текстуры, так и текстона для представления первичного наброска. [19] Совместно с Ин Нянь Ву Чжу продвинулся в изучении перцептивных переходов между режимами моделей в масштабировании информации и предложил теорию пространства перцептивного масштаба для расширения пространства масштаба изображения. [20]

Расширение грамматической парадигмы Фу с помощью стохастического графа «и-или»

С 1999 по 2002 год Чжу вместе со своим аспирантом Чжовэнь Ту разработал парадигму Монте-Карло с использованием управляемых данными цепей Маркова (DDMCMC) [21] для обхода всего пространства состояний путем расширения работы по скачкообразной диффузии Гренандера-Миллера. С другим аспирантом Адрианом Барбу он обобщил алгоритм кластерной выборки ( Свендсен-Ванг ) в физике из моделей Изинга/Поттса на произвольные вероятности. Это достижение в этой области впервые в литературе сделало операторы разделения-слияния обратимыми и достигло 100-кратного ускорения по сравнению с сэмплером Гиббса и скачкообразной диффузией. Это достижение привело к работе по анализу изображений [22] , которая выиграла премию Марра на ICCV 2003. [15]

В 2004 году Чжу перешел к зрению высокого уровня, изучая стохастическую грамматику . Метод грамматики восходит к подходу синтаксического распознавания образов, пропагандируемому Кинг-Сунь Фу в 1970-х годах. Чжу разработал грамматические модели для нескольких ключевых проблем зрения, таких как моделирование лица, старение лица, одежда, обнаружение объектов, разбор прямоугольной структуры и сортировка. В 2006 году он написал монографию с Мамфордом под названием «Стохастическая грамматика изображений» . [23] В 2007 году Чжу и соавторы были номинированы на премию Марра. В следующем году Чжу получил премию Дж. К. Аггарвала от Международной ассоциации распознавания образов за «вклад в единую основу для концептуализации, моделирования, обучения и вывода визуальных образов». [24]

Чжу расширил модели графа «и-или» до пространственного, временного и причинного графа «и-или» (STC-AOG), чтобы выразить композиционные структуры как единое представление объектов, сцен, действий, событий и причинных эффектов в задачах понимания физических и социальных сцен.

Изучение «темной материи ИИ» познания и визуального здравого смысла

С 2010 года Чжу сотрудничает с учёными в области когнитивной науки, искусственного интеллекта, робототехники и языка, чтобы исследовать то, что он называет «Тёмной материей искусственного интеллекта» — 95% интеллектуальной обработки, которую невозможно напрямую обнаружить с помощью сенсорного ввода.

Вместе они расширили проблему анализа изображений и понимания сцен с помощью когнитивного моделирования и рассуждений о следующих аспектах: функциональность (функции объектов и сцен, использование инструментов), интуитивная физика (поддерживающие отношения, материалы, устойчивость и риск), намерение и внимание (что люди знают, думают и намереваются делать в социальной сцене), причинность (причинные эффекты действий по изменению флюэнтов объектов) и полезность (общие ценности, определяющие действия человека в видео). [25] [26] [27] Результаты распространяются посредством серии семинаров. [28]

В этот период Чжу исследовал множество других тем, в том числе: формулирование концепций ИИ, таких как инструменты, контейнер, жидкости; интеграция анализа трехмерной сцены и реконструкции из отдельных изображений с помощью функциональности рассуждений, физической устойчивости, ситуативных диалогов с помощью совместного анализа видео и текста; разработка коммуникативного обучения; и картирование энергетического ландшафта невыпуклых задач обучения. [29]

Следование парадигме «малые данные для больших задач» для общего ИИ

В широко распространенной публичной статье, написанной на китайском языке в 2017 году, Чжу назвал популярные исследования глубокого обучения на основе данных парадигмой «большие данные для малых задач», которая обучает нейронную сеть для каждой конкретной задачи с помощью массивных аннотированных данных, что приводит к неинтерпретируемым моделям и узкому ИИ. Вместо этого Чжу выступал за парадигму «малые данные для больших задач» для достижения общего ИИ. [30]

На заседании Национального комитета Народного политического консультативного совета Китая в 2023 году Чжу заявил, что после выпуска ChatGPT Китаю следует сделать искусственный интеллект стратегической целью, аналогичной стремлению к ядерным, ракетным и спутниковым технологиям в рамках проекта « Две бомбы, один спутник» 1960-х годов. [31]

В феврале 2024 года Пекинский институт общего искусственного интеллекта (BIGAI), работающий под руководством Чжу, представил то, что они назвали первым в мире ребенком с искусственным интеллектом (ИИ) по имени «Тонг Тонг», который обладает собственными эмоциями и интеллектом и способен самостоятельно ставить себе задачи, демонстрируя уровень автономии, ранее невиданный у виртуальных существ. [32]

Публикации

Книги

  • SC Zhu и DB Mumford, Стохастическая грамматика изображений , монография, теперь Publishers Inc., 2007.
  • А. Барбу и С. К. Чжу, Методы Монте-Карло , Springer, опубликовано в 2019 г.
  • SC Zhu, ИИ: эпоха большой интеграции — объединение дисциплин в рамках искусственного интеллекта , DMAI, Inc., опубликовано в 2019 г.
  • SC Zhu и YN Wu, Концепции и представления в зрении и познании , черновик, преподаваемый более 10 лет, Springer, Подготовка к 2020 году.

Статьи

  • Чжу, СК, Ву, И. и Мамфорд, Д. (1998). FRAME: фильтры, случайные поля и минимаксная энтропия на пути к единой теории моделирования текстур. Международный журнал компьютерного зрения, 27(2) стр. 1–20.
  • YN Wu, SC Zhu и XW Liu, (2000). Эквивалентность ансамбля Julesz и моделей FRAME International Journal of Computer Vision, 38(3), 247–265.
  • Ту, З. и Чжу, С.-Ч. Сегментация изображений с помощью Монте-Карло на основе цепей Маркова, IEEE Trans. on PAMI, 24(5), 657–673, 2002.
  • Барбу, А. и Чжу, С.-Ч., Обобщение Свендсена-Вана для выборки произвольных апостериорных вероятностей, IEEE Trans. on PAMI, 27(8), 1239–1253, 2005.
  • Tu, Z., Chen, X., Yuille, & Zhu, S.-C. (2003). Анализ изображений: унификация сегментации, обнаружения и распознавания. Труды Девятой международной конференции IEEE по компьютерному зрению.
  • Чжу, СК и Юйлле, А. (1996). Конкуренция регионов: объединение змей, рост регионов и Байес/MDL для сегментации многополосных изображений. Труды IEEE по анализу образов и машинному интеллекту, 18(9), 884–900.
  • Чжу, С. К. и Мамфорд, Д. (1997). Предшествующее обучение и реакция-диффузия Гиббса. Труды IEEE по анализу образов и машинному интеллекту, 19(11), 1236–1250.
  • Чжу, С.-Ч., Го, Ч., Ван, И. и Сюй, З. (2005). Что такое текстоны? Международный журнал компьютерного зрения, 62(1/2), 121–143.
  • Чжу, С.-К. и Мамфорд, Д. (2006). Стохастическая грамматика изображений. Основы и тенденции в компьютерной графике и зрении, 2(4), 259–362.
  • Го, Ц. Чжу, С.-Ц. и Ву, И. (2007), Первичный набросок: интеграция текстуры и структуры. Компьютерное зрение и понимание изображений, т. 106, выпуск 1, 5–19.
  • YN Wu, CE Guo и SC Zhu (2008), От информационного масштабирования естественных изображений к режимам статистических моделей, Quarterly of Applied Mathematics, т. 66, № 1, 81–122.
  • B. Zheng, Y. Zhao, J. Yu, K. Ikeuchi и SC Zhu (2015), Понимание сцены с помощью рассуждений об устойчивости и безопасности, Международный журнал компьютерного зрения, т. 112, № 2, стр. 221–238, 2015.
  • Y. Zhu, YB Zhao и SC Zhu (2015), Понимание инструментов: проблемно-ориентированное моделирование объектов, обучение и распознавание, Труды конференции IEEE по компьютерному зрению и распознаванию образов (CVPR).
  • Файр, А. и С. К. Чжу (2016), Изучение перцептивной причинности с помощью видео, ACM Trans. по интеллектуальным системам и технологиям, 7(2): 23.
  • YX Zhu, C. Jiang, Y. Zhao, D. Terzopoulos и SC Zhu (2016), Вывод сил и изучение человеческих утилит по видео, Труды конференции IEEE по компьютерному зрению и распознаванию образов (CVPR).
  • D. Xie, T. Shu, S. Todorovic и SC Zhu (2018), Изучение и вывод «темной материи» и прогнозирование намерений и траекторий человека в видео, IEEE Trans on Pattern Analysis and Machine Intelligence, 40(7): 1639–1652.
  • Чжу, И. и др. (2020) Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Human-like Commonsense, специальный выпуск Engineering, посвященный ИИ.
  • SC Zhu, (2019) ИИ: эпоха большой интеграции – объединение дисциплин в рамках искусственного интеллекта, DMAI, Inc..

Ссылки

  1. ^ "Сон-Чун Чжу".
  2. ^ «Центр зрения, познания, обучения и автономии».
  3. ^ ab "Профессор Сонг-Чун Чжу, Калифорнийский университет в Лос-Анджелесе".
  4. ^ "Сон-Чун Чжу".
  5. ^ «Исследования: на правильном ли пути мы?».
  6. ^ "Родившаяся в США фигуристка присоединяется к программе тренировок в Китае - Global Times". 2018-09-28 . Получено 2022-02-06 .
  7. ^ "ACM图灵大会上的"华山论剑":朱松纯对话沈向洋 Диалог доктора Сон-Чун Чжу и Гарри Шума на ACM TURC 2019" .
  8. ^ «Единая структура для передачи знаний от человека к роботу».
  9. ^ «Методы Монте-Карло (Твёрдый переплёт)».
  10. ^ «Письмо от организаторов ТК ПАМИ и CVPR 2019».
  11. ^ "ДМАИ".
  12. ^ ab "DMAI".
  13. ^ Чжу, СК, Ву, И. и Мамфорд, Д. (1998). FRAME: фильтры, случайные поля и минимаксная энтропия на пути к единой теории моделирования текстур. Международный журнал компьютерного зрения, 27(2) стр. 1-20.
  14. ^ YN Wu, SC Zhu и XW Liu, (2000). Эквивалентность ансамбля Julesz и моделей FRAME International Journal of Computer Vision, 38(3), 247-265.
  15. ^ ab «Премия Computer Vision».
  16. ^ Чжу, СК и Юйлле, А. (1996). Конкуренция регионов: объединение змей, рост регионов и Байес/MDL для сегментации многополосных изображений. Труды IEEE по анализу образов и машинному интеллекту, 18(9), 884–900.
  17. ^ Чжу, С. К. и Мамфорд, Д. (1997). Предшествующее обучение и реакция-диффузия Гиббса. Труды IEEE по анализу образов и машинному интеллекту, 19(11), 1236–1250.
  18. ^ Чжу, С.-Ч., Го, Ч., Ван, И. и Сюй, З. (2005). Что такое текстоны? Международный журнал компьютерного зрения, 62(1/2), 121–143.
  19. ^ Го, Ц. Чжу, С.-Ц. и Ву, И. (2007), Первичный набросок: интеграция текстуры и структуры. Компьютерное зрение и понимание изображений, т. 106, выпуск 1, 5-19.
  20. ^ YN Wu, CE Guo и SC Zhu (2008), От масштабирования информации естественных изображений к режимам статистических моделей, Quarterly of Applied Mathematics, т. 66, № 1, 81-122.
  21. ^ Ту, З. и Чжу, С.-Ч. Сегментация изображений с помощью Монте-Карло на основе данных Марковской цепи, IEEE Trans. на PAMI, 24(5), 657-673, 2002.
  22. ^ Tu, Z., Chen, X., Yuille, & Zhu, S.-C. (2003). Анализ изображений: унификация сегментации, обнаружения и распознавания. Труды Девятой международной конференции IEEE по компьютерному зрению.
  23. ^ Чжу, С.-К. и Мамфорд, Д. (2006). Стохастическая грамматика изображений. Основы и тенденции в компьютерной графике и зрении, 2(4), 259–362.
  24. ^ "Премия имени Дж. К. Аггарвала 2008 года присуждена профессору Сонг-Чун Чжу".
  25. ^ B. Zheng, Y. Zhao, J. Yu, K. Ikeuchi и SC Zhu (2015), Понимание сцены с помощью рассуждений об устойчивости и безопасности, Int'l Journal of Computer Vision, т. 112, № 2, стр. 221-238, 2015.
  26. ^ Y. Zhu, YB Zhao и SC Zhu (2015), Понимание инструментов: проблемно-ориентированное моделирование объектов, обучение и распознавание, Труды конференции IEEE по компьютерному зрению и распознаванию образов (CVPR).
  27. ^ YX Zhu, C. Jiang, Y. Zhao, D. Terzopoulos и SC Zhu (2016), Вывод сил и изучение человеческих утилит из видео, Труды конференции IEEE по компьютерному зрению и распознаванию образов (CVPR).
  28. ^ «Зрение встречается с познанием».
  29. ^ "Сон-чунь Чжу".
  30. ^ «Некоторые приглашенные доклады».
  31. ^ «Предложения по ИИ на «Двух сессиях»: ИИ как «Две бомбы, один спутник»?».
  32. ^ "Китай создает первого в мире ребенка с искусственным интеллектом, который проявляет человеческие эмоции". Interesting Engineering.com . Получено 16 апреля 2024 г.
Взято с "https://en.wikipedia.org/w/index.php?title=Сонг-Чун_Чжу&oldid=1246417477"