Наташа Ной | |
---|---|
Рожденный | Наталья Фридман Ной Россия |
Альма-матер |
|
Известный | Редактор онтологии Protégé Поиск Google Dataset |
Награды | Стипендиат AAAI (2020) Стипендиат ACM (2023) [1] |
Научная карьера | |
Поля | Семантическая паутина Онтологии Структурированные данные Интеграция данных [2] |
Учреждения | Google Стэнфордский университет |
Тезис | Представление знаний для интеллектуального поиска информации в экспериментальных науках (1997) |
Веб-сайт | Research.google.com/pubs/NatalyaNoy.html |
Наташа Фридман Ной — американский исследователь, родившаяся в России [3] , которая работает в Google Research в Маунтин-Вью, Калифорния , [4], и фокусируется на том, чтобы сделать структурированные данные более доступными и удобными для использования. [5] [2] [6] Она является руководителем группы Dataset Search, веб-поисковой системы для всех наборов данных. [7] Наташа работала в Стэнфордском центре исследований биомедицинской информатики до прихода в Google, где она внесла значительный вклад в создание и согласование онтологий, а также в совместную разработку онтологий. [4] Наташа входит в редколлегии многих изданий по семантической паутине и информационным системам и является бывшим президентом Ассоциации науки семантической паутины. [4] С 2011 по 2017 год она была президентом Ассоциации науки семантической паутины. [7]
Наташа Ной получила степень бакалавра прикладной математики в Московском государственном университете, степень магистра компьютерных наук в Бостонском университете и докторскую степень в Северо-Восточном университете. [2] Ее диссертация была посвящена документам, содержащим знания, в частности поиску информации для научных статей. [8]
Ной перешла из Северо-Восточного в Стэнфордский университет , чтобы работать с Марком Мусеном над редактором онтологии Protégé в качестве постдокторанта , а затем и как научный сотрудник. Именно здесь она завершила свою важную работу над Prompt, средой для автоматизированного выравнивания онтологий, которая была опубликована в 2002 году. [9] [10] За признание специфики проблемы и предоставление изобретательского решения это исследование получило награду AAAI classic paper award в 2018 году. Однако, безусловно, ее самой широко распространенной работой [2] был учебник Ontology 101, [11] который Ной разработал в рамках образовательной программы для клиентов Protégé, учебник стал стандартным вводным документом для семантической паутины и онтологий. По состоянию на 2018 год он был процитирован почти 6800 раз и часто загружался. [2]
В апреле 2014 года Ной обратилась в Google Research; Google выпустила поисковую систему, помогающую исследователям находить общедоступные онлайн-данные. 5 сентября программа была запущена, и она нацелена на «ученых, журналистов, специалистов по данным или кого-либо еще». [7] Dataset Search, которая теперь следует за другими специализированными поисковыми системами Google, включая поиск новостей и изображений, а также Google Scholar и Google Books, находит файлы и базы данных на основе того, как их владельцы классифицировали их. Она не считывает содержимое файлов так же, как поисковые системы считывают веб-страницы. [7] Исследователи, которые хотят узнать, какие типы данных доступны, или те, кто хочет найти данные, о существовании которых они уже знают, по словам Наташи Ной, часто должны полагаться на сарафанное радио; эта проблема особенно остра, по словам Ной, для начинающих ученых, которые еще не «подключились» к сети профессиональных связей. Ной и ее коллега из Google Дэн Брикли написали сообщение в блоге в январе 2017 года, предложив решение этой проблемы. Типичные поисковые системы работают в два этапа: первый этап — поиск в Интернете сайтов для индексации на регулярной основе, второй этап — ранжирование этих индексированных сайтов, чтобы система могла возвращать соответствующие результаты в порядке, когда пользователь вводит поисковое слово. Владельцы наборов данных должны «помечать» их, используя стандартизированный словарь под названием Schema.org. По словам Ноя и Брикли, Google и три других гиганта поисковых систем (Microsoft, Yahoo и Yandex) создали Schema.org, чтобы помочь поисковым системам сканировать существующие наборы данных. [7]
Ной наиболее известна своей работой над редактором онтологий Protégé и инструментом выравнивания Prompt, за которую она и соавтор Марк Мусен получили премию AAAI Classic Paper в 2018 году. Премия AAAI Classic Paper присуждается авторам наиболее влиятельных статей определенного года проведения конференции, при этом рассматриваемый временной период увеличивается на один год каждый год. [12] Она была избрана членом AAAI в 2020 году [13] и членом ACM в 2023 году [1].