« Венецианская машина времени» — крупный международный проект, запущенный Федеральной политехнической школой Лозанны (EPFL) и Венецианским университетом Ка' Фоскари в 2012 году, целью которого является создание совместной многомерной модели Венеции путем создания открытого цифрового архива культурного наследия города, охватывающего более 1000 лет эволюции. [1] Целью проекта является отслеживание циркуляции новостей, денег, коммерческих товаров, миграции, художественных и архитектурных моделей и т. д. для создания Больших данных прошлого. [2] Его реализация будет представлять собой самую большую базу данных, когда-либо созданную по венецианским документам. [3] Проект является примером новой области научной деятельности, возникшей в цифровую эпоху : цифровые гуманитарные науки .
Широкое признание проекта критиками привело к подаче европейского предложения в Европейскую комиссию в апреле 2016 года. [4] Венецианская машина времени является технологической основой предлагаемой Европейской машины времени. [5]
Первая полная реконструкция Венеции, показывающая эволюцию города между 900 и 2000 годами, была представлена на Венецианской биеннале архитектуры в 2018 году. [6] Модель Венецианской машины времени 1750 года также использовалась для выставки в Большом дворце в Париже в сентябре 2018 года. [7]
Организация и финансирование
Проект «Венецианская машина времени» был запущен EPFL и университетом Ка' Фоскари в Венеции в 2012 году. Он включает сотрудничество с основными венецианскими патримониальными учреждениями: Государственным архивом в Венеции, Библиотекой Марчиана, Институтом Венето и Фондом Чини . В настоящее время проект поддерживается проектом европейской электронной инфраструктуры READ (Распознавание и обогащение архивных документов), проектом SNF Linked Books и проектом ANR-SNF GAWS. В международный совет входят известные ученые из Стэнфорда , Колумбии, Принстона и Оксфорда. В 2014 году Фонд Ломбарда Одье присоединился к проекту «Венецианская машина времени» в качестве финансового партнера. [8]
Технологии и инструменты
Государственный архив Венеции содержит огромное количество рукописной документации на языках, которые развивались со времен Средневековья до XX века. По оценкам, 80 км полок заполнены более чем тысячелетними административными документами, от свидетельств о рождении, свидетельств о смерти и налоговых деклараций до карт и проектов городского планирования. Эти документы часто очень деликатны и иногда находятся в хрупком состоянии сохранности. Разнообразие, объем и точность венецианских административных документов являются уникальными в западной истории. Объединяя эту массу информации, можно реконструировать большие сегменты прошлого города: полные биографии, политическую динамику или даже внешний вид зданий и целых районов.
Сканирование
Бумажные документы превращаются в цифровые изображения высокого разрешения с помощью сканирующих машин. Различные типы документов накладывают различные ограничения на тип сканирующих машин, которые могут использоваться, и на скорость, с которой может быть отсканирован документ. В партнерстве с промышленностью EPFL работает над полуавтоматическим роботизированным сканирующим устройством, способным оцифровывать около 1000 страниц в час. Будет построено несколько устройств такого типа для создания эффективного конвейера оцифровки, адаптированного к древним документам. Другое решение, которое в настоящее время изучается в EPFL, заключается в сканировании книг без переворачивания страниц. Эта техника использует рентгеновское синхротронное излучение, создаваемое ускорителем частиц . [9]
Транскрипция
Графическая сложность и разнообразие рукописных документов делают транскрипцию сложной задачей. Для Venice Time Machine ученые в настоящее время разрабатывают новые алгоритмы , которые могут преобразовывать изображения в вероятные слова. Изображения автоматически разбиваются на подизображения, которые потенциально представляют слова. Каждое подизображение сравнивается с другими подизображениями и классифицируется в соответствии с формой слова, которое оно представляет. Каждый раз, когда транскрибируется новое слово, это позволяет распознать в базе данных миллионы других транскрипций слов.
Обработка текста
Затем текстовый процессор преобразует строки вероятных слов в возможные предложения. Этот шаг выполняется с использованием, среди прочего, алгоритмов, вдохновленных анализом структуры белка, которые могут определять повторяющиеся закономерности.
Подключение данных
Настоящее богатство венецианских архивов заключается в связности их документации. Несколько ключевых слов связывают различные типы документов, что делает данные доступными для поиска. Эта перекрестная ссылка на внушительные объемы данных организует информацию в гигантские графики взаимосвязанных данных. Ключевые слова в предложениях связаны друг с другом в гигантские графики, что позволяет перекрестно ссылаться на огромные объемы данных, тем самым позволяя появляться новым аспектам информации.
Цифровая гуманитарная лаборатория EPFL объявила 1 марта 2016 года о разработке REPLICA, новой поисковой системы для изучения и расширенного использования венецианского культурного наследия, которая будет доступна в сети к концу 2016 года. [10]
Прием
Хвалить
Междисциплинарность и интернационализм . Крупнейшие венецианские патримониальные учреждения, академические институты и профессора из разных дисциплин и разных учреждений по всему миру сотрудничают для достижения этого коллективного усилия. На странице «Машина времени в Венеции» описываются триста исследователей и студентов из разных дисциплин (естественные науки, инженерия, компьютерные науки, архитектура, история и история искусств), которые сотрудничали для этого проекта.
Развитие технологий . Программа сталкивается с многочисленными техническими проблемами, связанными с преобразованием уникального и обширного культурного наследия в цифровой архив. Массовая оцифровка требует не только систематического сканирования древних рукописей, но и автоматической обработки различных стилей почерка, а также анализа латыни и нескольких других языков по мере их развития с течением времени. Исследователи EPFL, работающие над проектом Venice Time Machine, например, представили методологию анализа языковых изменений, изучая 200-летние швейцарские газетные архивы. [11]
Демократизация знаний и культуры . Проект стремится открыть знания и историю для более широкой аудитории через виртуальную базу данных, к которой может получить доступ любой, тем самым укрепляя связь между учеными и широкой общественностью. Более того, в свою очередь цифровые гуманитарные науки стремятся уменьшить барьеры для вклада и обмена знаниями и данными, позволяя более широкой общественности вносить свой вклад в усилия по сбору данных. Элитная группа ученых и профессионалов больше не должна быть единственной, кто может вносить и рассеивать культурные и исторические знания, и цифровые гуманитарные науки стремятся уменьшить это.
Критика
Искаженная аудитория . Весь проект, вместе с развитием технологий, которые он влечет за собой, кажется, предназначен для чисто западной аудитории. И «Венецианская машина времени», и последующая «Европейская машина времени» сосредоточены вокруг европейской истории, культуры и родового наследия. Пока ничего не сделано для включения большего количества культурной истории регионов (хотя проект и цифровые гуманитарные науки все еще находятся на ранних стадиях), но это все еще показывает, что европейской истории придается большее значение. [ необходима цитата ]
Выбор контента . Ученые и исследователи, работающие над проектом, который разрабатывает наборы данных, по-прежнему имеют право выбирать информацию, представляемую аудитории, что противоречит цели инициативы по демократизации знаний. Ученые, участвующие в проекте, имеют право курировать контент и образовательную информацию венецианской базы данных.
Скрытая бизнес-возможность . Предыдущие подобные инициативы предполагают, что создание связи между учеными и широкой общественностью представляет собой бизнес-возможность для тех, кто контролирует такую платформу данных. Например, Google Books и Google Scholar помогли реализовать долгосрочную стратегию Google по изменению привычек пользователей в поиске книг как академического, так и популярного чтения и превращению цифровых технологий в ключевое средство поиска знаний, информации и исторического прошлого. [12]
Этические проблемы, связанные с Большими данными . Хотя данные собираются в основном от населения, жившего в прошлом, тем не менее возникают те же этические проблемы, что и с Большими данными. Сбор данных не всегда гарантированно анонимен, например, «если индивидуальные особенности человека достаточно уникальны, внешняя информация может быть использована для связывания данных с конкретным человеком». [13] По словам Джошуа Фэрфилда, поскольку технологии продолжают развиваться, текущие процедуры анонимизации, вероятно, сократятся. Исследователи могут обнаружить, что требование согласия от соответствующих семей экономически неэффективно. [14]
Другие последствия
Программа стремится разработать многочисленные инструменты и технологии, которые ставят под сомнение и бросают вызов роли историков и гуманистов в целом. Алан Лю и Уильям Г. Томас III в своем вкладе «Гуманитарные науки в цифровую эпоху» [15] определяют сдвиг парадигмы, при котором технологические инструменты становятся все более незаменимыми, и считают, что гуманисты должны формировать долгосрочное цифровое будущее гуманитарных наук и, следовательно, должны проявлять инициативу, чтобы избежать создания цифровой инфраструктуры для них.
^ Эбботт, Элисон (2017). «Машина времени, реконструирующая социальные сети древней Венеции». Nature . 546 (7658): 341– 344. Bibcode :2017Natur.546..341A. doi : 10.1038/546341a . PMID 28617482.
^ Каплан, Фредерик (2015). «Венецианская машина времени». Труды симпозиума ACM 2015 года по проектированию документов . стр. 73. doi :10.1145/2682571.2797071. ISBN9781450333078. S2CID 7114931.
^ Каплан, Фредерик (29 апреля 2016 г.). "Venice Time Machine Flagship". Европейская комиссия . Получено 9 мая 2017 г.
^ Каплан, Фредерик (2015). «Венецианская машина времени». Труды симпозиума ACM 2015 года по проектированию документов . стр. 73. doi :10.1145/2682571.2797071. ISBN9781450333078. S2CID 7114931.
^ Маргаритондо, Джорджио; Каплан, Фредерик; Хву, Йеукуанг; Печенини, Ева; Стампанони, Марко; Альбертин, Фаузия (2015). «Рентгеновская спектрометрия и визуализация древних административных рукописных документов» (PDF) . Рентгеновская спектрометрия . 44 (3): 93–98 . Bibcode : 2015XRS....44...93A. doi : 10.1002/xrs.2581. S2CID 93245100.
^ "Реплика". 22 июля 2019 г.{{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Каплан, Фредерик; Борне, Сирил; Бантинкс, Винсент (2017). «Изучение лингвистических изменений за 200 лет существования газет с помощью анализа устойчивых слов». Frontiers in Digital Humanities . 4 : 2. doi : 10.3389/fdigh.2017.00002 .
^ Гардинер, Эйлин; Мусто, Рональд Г. (2015). Цифровые гуманитарные науки: учебник для студентов и ученых . Нью-Йорк, Нью-Йорк: Cambridge University Press. стр. 149. ISBN978-1-107-01319-3.
^ де Монжуайе, Ив-Александр; Идальго, Сезар А.; Верлейсен, Мишель; Блондель, Винсент Д. (2013). «Уникальный в толпе: границы конфиденциальности человеческой мобильности». Scientific Reports . 3 : 1376. Bibcode :2013NatSR...3.1376D. doi :10.1038/srep01376. PMC 3607247 . PMID 23524645.
^ Фэрфилд, Джошуа; Стайн, Ханна (2014). «Большие данные, большие проблемы: возникающие вопросы в этике науки о данных и журналистике». Журнал этики массовых СМИ . 29 : 38–51 . doi :10.1080/08900523.2014.863126. S2CID 145698329.
^ Лю, Алан; Томас III, Уильям Г. (2012). «Гуманитарные науки в цифровую эпоху». Inside Higher Ed .
Внешние ссылки
Европейский флагман Time Machine FET
Страница Машины времени EPFL в Венеции
Венецианская машина времени — история и большие данные