Эта биографическая статья написана как резюме . ( Ноябрь 2023 ) |
Сонг-Чун Чжу | |
---|---|
朱松纯 | |
Рожденный | Июнь 1968 г. (56 лет) |
Альма-матер | Китайский университет науки и технологий ( бакалавр наук ), Гарвардский университет ( магистр наук , доктор философии ) |
Род занятий | Специалист по информатике, прикладной математик |
Дети | Чжу И |
Награды | Премия имени Гельмгольца «Испытание временем» Премия имени Дэвида Марра, стипендиат IEEE |
Научная карьера | |
Поля | Информатика Прикладная математика |
Учреждения | Пекинский университет Калифорнийский университет, Лос-Анджелес |
Тезис | Статистические и вычислительные теории сегментации изображений, моделирования текстур и распознавания объектов (1996) |
научный руководитель | Дэвид Мамфорд |
Веб-сайт | www.stat.ucla.edu/~sczhu |
Сон-Чунь Чжу ( кит .朱松纯; родился в июне 1968 г.) — китайский учёный-компьютерщик и прикладной математик, известный своими работами в области компьютерного зрения , когнитивного искусственного интеллекта и робототехники . В настоящее время Чжу работает в Пекинском университете , а ранее был профессором кафедр статистики и компьютерных наук Калифорнийского университета в Лос-Анджелесе . [1] Ранее Чжу также занимал должность директора Центра зрения, познания, обучения и автономии Калифорнийского университета в Лос-Анджелесе (VCLA). [2]
В 2005 году Чжу основал Lotus Hill Institute, независимую некоммерческую организацию для содействия международному сотрудничеству в области компьютерного зрения и распознавания образов . [3] Чжу опубликовал множество работ и читал лекции по всему миру об искусственном интеллекте, а в 2011 году он стал членом IEEE ( Институт инженеров по электротехнике и электронике ) за «вклад в статистическое моделирование, обучение и выводы в области компьютерного зрения». [4]
У Чжу две дочери, Стефани и И. [5] Чжу И ( кит. :朱易) — профессиональная фигуристка . [6]
Родившийся и выросший в Эчжоу , Китай, Чжу в юности черпал вдохновение в разработке компьютеров, играя в шахматы, что пробудило в нем интерес к искусственному интеллекту. В 1991 году Чжу получил степень бакалавра в области компьютерных наук в Университете науки и технологий Китая в Хэфэе . Во время учебы в бакалавриате Чжу, найдя вычислительную теорию зрения покойного нейробиолога из Массачусетского технологического института Дэвида Марра глубоко влиятельной, стремился заняться общей унифицированной теорией зрения и ИИ. [7] В 1992 году Чжу продолжил изучение компьютерного зрения в Гарвардской высшей школе искусств и наук . В Гарварде Чжу учился под руководством американского математика Дэвида Мамфорда и получил введение в «вероятно приблизительно правильное» (PAC) обучение под руководством Лесли Валианта . Чжу завершил свое обучение в Гарварде в 1996 году, получив докторскую степень. в области компьютерных наук и последовал за Мамфордом на отделение прикладной математики в Университете Брауна в качестве постдокторанта. [3]
После своей постдокторской стипендии Чжу недолго читал лекции на кафедре компьютерных наук Стэнфордского университета . В 1998 году он присоединился к Университету штата Огайо в качестве доцента на кафедрах компьютерных наук и когнитивных наук. В 2002 году Чжу присоединился к Калифорнийскому университету в Лос-Анджелесе на кафедрах компьютерных наук и статистики в качестве доцента, поднявшись до звания полного профессора в 2006 году. В Калифорнийском университете в Лос-Анджелесе Чжу основал Центр зрения, познания, обучения и автономии. Его главный исследовательский интерес заключался в создании единой статистической и вычислительной структуры для зрения и интеллекта, которая включает в себя пространственный, временной и причинный график И-ИЛИ (STC-AOG) в качестве единого представления и многочисленные методы Монте-Карло для вывода и обучения. [8] [9]
В 2005 году Чжу основал независимую некоммерческую организацию в своем родном городе Эчжоу, Lotus Hill Institute (LHI). LHI занимается сбором крупномасштабных наборов данных изображений и аннотированием объектов, сцен и видов деятельности, получив вклад от многих известных ученых, включая Гарри Шума . В институте также есть постоянная команда аннотаторов для анализа структур изображений, накопившая на сегодняшний день более 500 000 изображений. [ необходима цитата ]
С момента основания LHI Чжу организовал множество семинаров и конференций, а также был генеральным председателем как Конференции по компьютерному зрению и распознаванию образов (CVPR) 2012 года в Провиденсе, штат Род-Айленд , где он вручил Ульфу Гренандеру медаль «Пионер», так и CVPR 2019 года, состоявшейся в Лонг-Бич, штат Калифорния . [10]
В июле 2017 года Чжу основал DMAI в Лос-Анджелесе как стартап в области искусственного интеллекта, занимающийся разработкой единой когнитивной платформы искусственного интеллекта. [11]
В сентябре 2020 года Чжу вернулся в Китай, чтобы присоединиться к Пекинскому университету и возглавить его Институт искусственного интеллекта, таким образом присоединившись к другому китайскому эксперту по ИИ в США и давнему знакомому Чжу, бывшему руководителю отдела искусственного интеллекта и исследований Microsoft Гарри Шуму. В августе Шум также был назначен Пекинским университетом председателем академического комитета Института искусственного интеллекта. [12]
Чжу работает над созданием нового и отдельного института исследований ИИ - Пекинского института общего искусственного интеллекта (BIGAI). Согласно введению, основанный на парадигме «малые данные для больших задач», BIGAI фокусируется на передовых технологиях ИИ, междисциплинарной интеграции, международном академическом обмене, чтобы воспитывать новое поколение молодых талантов в области ИИ. [12] Ожидается, что институт объединит профессиональных исследователей, ученых и экспертов, чтобы воплотить в жизнь теоретическую основу искусственного интеллекта Чжу и совместно продвигать китайские оригинальные технологии ИИ и создавать новое поколение общих платформ ИИ. [ необходима ссылка ]
Чжу опубликовал более трехсот статей в рецензируемых журналах и сборниках трудов по следующим четырем этапам:
В начале 1990-х годов Чжу с соавторами в группе теории образов разработали передовые статистические модели для компьютерного зрения. Сосредоточившись на разработке унифицированной статистической структуры для ранних представлений зрения, представленных в посмертно опубликованной работе Дэвида Марра под названием Vision , они сначала сформулировали текстуры в новой модели случайного поля Маркова , называемой FRAME, используя принцип минимаксной энтропии для введения открытий в области нейронауки и психофизики в распределения Гиббса в статистической физике. [13] Затем они доказали эквивалентность между моделью FRAME и микроканоническим ансамблем, [14] который они назвали ансамблем Жюлеша. Эта работа получила почетную номинацию на премию Марра во время Международной конференции по компьютерному зрению (ICCV) в 1999 году. [15]
В 1990-х годах Чжу разработал два новых класса нелинейных уравнений в частных производных (PDE). Один класс для сегментации изображений называется конкуренцией областей. [16] Эта работа, связывающая PDE со статистическими моделями изображений, получила премию Helmholtz Test of Time Award в ICCV 2013. Другой класс, называемый GRADE (уравнения реакции и диффузии Гиббса), был опубликован в 1997 году и использует подход динамики Ланжевена для вывода и обучения стохастическому градиентному спуску (SGD). [17]
В начале 2000-х годов Чжу сформулировал текстоны [18], используя генеративные модели с теорией разреженного кодирования, и интегрировал как модели текстуры, так и текстона для представления первичного наброска. [19] Совместно с Ин Нянь Ву Чжу продвинулся в изучении перцептивных переходов между режимами моделей в масштабировании информации и предложил теорию пространства перцептивного масштаба для расширения пространства масштаба изображения. [20]
С 1999 по 2002 год Чжу вместе со своим аспирантом Чжовэнь Ту разработал парадигму Монте-Карло с использованием управляемых данными цепей Маркова (DDMCMC) [21] для обхода всего пространства состояний путем расширения работы по скачкообразной диффузии Гренандера-Миллера. С другим аспирантом Адрианом Барбу он обобщил алгоритм кластерной выборки ( Свендсен-Ванг ) в физике из моделей Изинга/Поттса на произвольные вероятности. Это достижение в этой области впервые в литературе сделало операторы разделения-слияния обратимыми и достигло 100-кратного ускорения по сравнению с сэмплером Гиббса и скачкообразной диффузией. Это достижение привело к работе по анализу изображений [22] , которая выиграла премию Марра на ICCV 2003. [15]
В 2004 году Чжу перешел к зрению высокого уровня, изучая стохастическую грамматику . Метод грамматики восходит к подходу синтаксического распознавания образов, пропагандируемому Кинг-Сунь Фу в 1970-х годах. Чжу разработал грамматические модели для нескольких ключевых проблем зрения, таких как моделирование лица, старение лица, одежда, обнаружение объектов, разбор прямоугольной структуры и сортировка. В 2006 году он написал монографию с Мамфордом под названием «Стохастическая грамматика изображений» . [23] В 2007 году Чжу и соавторы были номинированы на премию Марра. В следующем году Чжу получил премию Дж. К. Аггарвала от Международной ассоциации распознавания образов за «вклад в единую основу для концептуализации, моделирования, обучения и вывода визуальных образов». [24]
Чжу расширил модели графа «и-или» до пространственного, временного и причинного графа «и-или» (STC-AOG), чтобы выразить композиционные структуры как единое представление объектов, сцен, действий, событий и причинных эффектов в задачах понимания физических и социальных сцен.
С 2010 года Чжу сотрудничает с учёными в области когнитивной науки, искусственного интеллекта, робототехники и языка, чтобы исследовать то, что он называет «Тёмной материей искусственного интеллекта» — 95% интеллектуальной обработки, которую невозможно напрямую обнаружить с помощью сенсорного ввода.
Вместе они расширили проблему анализа изображений и понимания сцен с помощью когнитивного моделирования и рассуждений о следующих аспектах: функциональность (функции объектов и сцен, использование инструментов), интуитивная физика (поддерживающие отношения, материалы, устойчивость и риск), намерение и внимание (что люди знают, думают и намереваются делать в социальной сцене), причинность (причинные эффекты действий по изменению флюэнтов объектов) и полезность (общие ценности, определяющие действия человека в видео). [25] [26] [27] Результаты распространяются посредством серии семинаров. [28]
В этот период Чжу исследовал множество других тем, в том числе: формулирование концепций ИИ, таких как инструменты, контейнер, жидкости; интеграция анализа трехмерной сцены и реконструкции из отдельных изображений с помощью функциональности рассуждений, физической устойчивости, ситуативных диалогов с помощью совместного анализа видео и текста; разработка коммуникативного обучения; и картирование энергетического ландшафта невыпуклых задач обучения. [29]
В широко распространенной публичной статье, написанной на китайском языке в 2017 году, Чжу назвал популярные исследования глубокого обучения на основе данных парадигмой «большие данные для малых задач», которая обучает нейронную сеть для каждой конкретной задачи с помощью массивных аннотированных данных, что приводит к неинтерпретируемым моделям и узкому ИИ. Вместо этого Чжу выступал за парадигму «малые данные для больших задач» для достижения общего ИИ. [30]
На заседании Национального комитета Народного политического консультативного совета Китая в 2023 году Чжу заявил, что после выпуска ChatGPT Китаю следует сделать искусственный интеллект стратегической целью, аналогичной стремлению к ядерным, ракетным и спутниковым технологиям в рамках проекта « Две бомбы, один спутник» 1960-х годов. [31]
В феврале 2024 года Пекинский институт общего искусственного интеллекта (BIGAI), работающий под руководством Чжу, представил то, что они назвали первым в мире ребенком с искусственным интеллектом (ИИ) по имени «Тонг Тонг», который обладает собственными эмоциями и интеллектом и способен самостоятельно ставить себе задачи, демонстрируя уровень автономии, ранее невиданный у виртуальных существ. [32]