Премия Хаттера

Денежный приз за достижения в области сжатия данных

Премия Хаттера — это денежная премия, финансируемая Маркусом Хаттером , которая присуждается за улучшение сжатия данных в конкретном текстовом файле на английском языке объемом 1 ГБ с целью поощрения исследований в области искусственного интеллекта (ИИ).

Премия, учрежденная в 2006 году, присуждает 5000 евро за каждый процент улучшения (при общем финансировании в 500 000 евро) [1] сжатого размера файла enwik9 , который является наибольшим из двух файлов, используемых в тесте сжатия больших текстов (LTCB); [2] enwik9 состоит из первых 10 9 байтов определенной версии английской Википедии . [3] Текущий [4] конкурс организован Хаттером, Мэттом Махони и Джимом Бауэри. [1]

Премия была объявлена ​​6 августа 2006 года [1] с меньшим текстовым файлом: enwik8, состоящим из 100 МБ. 21 февраля 2020 года она была расширена в 10 раз, до enwik9 размером 1 ГБ, премия выросла с 50 000 до 500 000 евро.

Цели

Целью премии Хаттера является поощрение исследований в области искусственного интеллекта (ИИ). Организаторы считают, что сжатие текста и ИИ являются эквивалентными проблемами. Хаттер доказал, что оптимальное поведение агента, ищущего цель, в неизвестной, но вычислимой среде — предполагать на каждом шаге, что среда, вероятно, контролируется одной из самых коротких программ, совместимых со всеми взаимодействиями до сих пор. [5] Однако общего решения не существует, поскольку сложность Колмогорова невычислима. Хаттер доказал, что в ограниченном случае (называемом AIXI tl ), где среда ограничена временем t и пространством l , решение может быть вычислено за время O (t2 l ), ​​что все еще неразрешимо.

Организаторы также полагают, что сжатие текста на естественном языке является сложной проблемой ИИ , эквивалентной прохождению теста Тьюринга . Таким образом, прогресс в достижении одной цели представляет собой прогресс в достижении другой. Они утверждают, что предсказание того, какие символы с наибольшей вероятностью встретятся следующими в текстовой последовательности, требует обширных знаний реального мира. Текстовый компрессор должен решить ту же проблему, чтобы назначить самые короткие коды наиболее вероятным текстовым последовательностям. [6]

Такие модели, как ChatGPT, не подходят для премии Хаттера по ряду причин: они могут потребовать больше вычислительных ресурсов, чем разрешено конкурентами (вычислительное и дисковое пространство).

Правила

Конкурс открытый. Он открыт для всех. Для участия участник должен предоставить программу сжатия и декомпрессор, который распаковывает в файл enwik9 . [3] Также можно предоставить сжатый файл вместо программы сжатия. Общий размер сжатого файла и декомпрессора (как исполняемого файла Win32 или Linux) должен быть меньше или равен 99% от предыдущего призового файла. За каждый процент улучшения участник выигрывает 5000 евро. Программа распаковки также должна соответствовать ограничениям по времени выполнения и памяти.

Заявки должны быть опубликованы, чтобы обеспечить независимую проверку. Существует 30-дневный период ожидания для публичных комментариев перед вручением премии. В 2017 году правила были изменены, чтобы потребовать публикации исходного кода по лицензии свободного программного обеспечения , из-за опасений, что «предыдущие заявки [которые не раскрывали свой исходный код] были бесполезны для других, и идеи в них могут быть утеряны навсегда». [4]

Победители

АвторДатаПрограммаОбщий размерНаграда
Кайдо Орав и Брайон Нолл3 сентября 2024 г.fx2-cmix110,793,1287,950€
Кайдо Орав2 февраля 2024 г.fx-cmix112,578,3226,911€
Саурабх Кумар16 июля 2023 г.быстрый микс114,156,1555,187€
Артемий Маргаритов31 мая 2021 г.звездный115,352,9389000€
Александр Ратушняк4 июля 2019 г.phda9v1.8116,673,681Нет приза
Александр Ратушняк4 ноября 2017 г.фда915,284,9442085€
Александр Ратушняк23 мая 2009 г.разложение815,949,6881,614€
Александр Ратушняк14 мая 2007 г.paq8hp1216,481,6551,732€
Александр Ратушняк25 сентября 2006 г.paq8hp517,073,0183,416€
Мэтт Махони24 марта 2006 г.paq8f18,324,887Нет приза

Смотрите также

Ссылки

  1. ^ abc "500'000€ Prize for Compressing Human Knowledge". Премия Хаттера . Получено 2023-01-08 .
  2. ^ Махони, Мэтт (2022-12-02). "Тест сжатия больших текстов" . Получено 08.01.2023 .
  3. ^ ab Mahoney, Matt (2011-09-01). "О тестовых данных" . Получено 2022-11-16 .
  4. ^ ab "Конкурс сжатия человеческих знаний. Часто задаваемые вопросы и ответы". Премия Хаттера . Получено 14 октября 2022 г.
  5. ^ Хаттер, Маркус (2005). Универсальный искусственный интеллект: последовательные решения на основе алгоритмической вероятности. Тексты по теоретической информатике, серия EATCS. ​​Springer . doi :10.1007/b138233. ISBN 3-540-22139-5.
  6. ^ Махони, Мэтт (2009-07-23). ​​"Обоснование для эталонного теста сжатия большого текста" . Получено 16 ноября 2022 г.
  • Официальный сайт
Взято с "https://en.wikipedia.org/w/index.php?title=Hutter_Prize&oldid=1251665979"