Энди Зенг | |
---|---|
Альма-матер | |
Известный | |
Научная карьера | |
Учреждения | |
Тезис | Изучение визуальных возможностей для роботизированных манипуляций (2019) |
Энди Цзэн — американский компьютерный ученый и инженер искусственного интеллекта в Google DeepMind . Он наиболее известен своими исследованиями в области робототехники и машинного обучения , включая алгоритмы обучения роботов , которые позволяют машинам разумно взаимодействовать с физическим миром и совершенствоваться с течением времени. Цзэн был удостоен стипендии Gordon YS Wu Fellowship in Engineering и премии Wu Prize в 2016 году, а также премии Princeton SEAS Award for Excellence в 2018 году. [1] [2]
Цзэн изучал информатику и математику в качестве студента бакалавриата в Калифорнийском университете в Беркли . [3] Затем он перешел в Принстонский университет , где в 2019 году получил докторскую степень. Его диссертация была посвящена алгоритмам глубокого обучения, которые позволяют роботам понимать визуальный мир и взаимодействовать с незнакомыми физическими объектами. [4] Он разработал класс архитектур глубоких нейронных сетей, вдохновленных концепцией возможностей в когнитивной психологии (восприятие мира с точки зрения действий), которые позволяют машинам изучать навыки, которые могут быстро адаптироваться и обобщаться для новых сценариев. [5] Будучи докторантом, он был одним из руководителей команды MIT-Princeton [6], которая заняла 1-е место в Stow Task [7] на Amazon Picking Challenge, [8] глобальном конкурсе, ориентированном на развитие роботизированных манипуляций и сбора мусора . Он также провел некоторое время в качестве студента-исследователя в Google Brain . [9] Его аспирантура была поддержана стипендией NVIDIA. [10]
Цзэн исследует возможности роботов по интеллектуальному самосовершенствованию с течением времени посредством самоконтролируемых алгоритмов обучения, таких как обучение сборке объектов путем их разборки [11] или приобретение новых ловких навыков путем просмотра видеороликов людей [12] . Среди известных демонстраций — TossingBot от Google [13] , робот, который может научиться хватать и бросать незнакомые объекты, используя физику в качестве предварительной модели того, как работает мир. Его исследования также изучают алгоритмы 3D- компьютерного зрения .
Он был пионером в использовании моделей Foundation в робототехнике, от систем, которые выполняют действия, записывая свой собственный код, [14] до роботов, которые могут планировать и рассуждать, основывая язык на возможностях. [15] [16] Он был одним из разработчиков больших мультимодальных моделей и показал, что их можно использовать для интеллектуальной навигации роботов, моделирования мира и вспомогательных агентов. [17] Он также работал над алгоритмами, которые позволяют большим языковым моделям знать, когда они не знают, и просить о помощи. [18]
В 2024 году Цзэн был удостоен премии IEEE Early Career Award в области робототехники и автоматизации «за выдающийся вклад в обучение роботов». [19]