Информационный взрыв — это быстрое увеличение объема опубликованной информации или данных и последствий этого изобилия. [1] По мере роста объема доступных данных проблема управления информацией становится все более сложной, что может привести к информационной перегрузке . Онлайновый Оксфордский словарь английского языка указывает на использование этой фразы в статье New Statesman за март 1964 года . [2] The New York Times впервые использовала эту фразу в своем редакционном контенте в статье Уолтера Салливана от 7 июня 1964 года, в которой он описал эту фразу как «много обсуждаемую». (стр. 11.) [3] Самое раннее известное использование этой фразы было в речи президента NBC Пэта Уивера о телевидении в Институте практиков рекламы в Лондоне 27 сентября 1955 года. Речь была ретранслирована на радиостанции WSUI в Айова-Сити и отрывок в газете Daily Iowan два месяца спустя. [4]
Во многих секторах наблюдается быстрый рост объема доступной информации, например, в здравоохранении, супермаркетах и правительствах. [5] Другим сектором, на который влияет это явление, является журналистика. Такая профессия, которая в прошлом отвечала за распространение информации, может быть подавлена переизбытком информации сегодня. [6]
Методы сбора знаний из избыточного объема электронной информации (например, слияние данных может помочь в добыче данных ) существуют с 1970-х годов. Другой распространенный метод работы с таким объемом информации — качественное исследование . [7] Такие подходы направлены на организацию информации, синтез, категоризацию и систематизацию, чтобы сделать ее более удобной для использования и поиска.
Новая метрика, которая используется в попытке охарактеризовать рост информации, специфичной для конкретного человека, — это дисковое хранилище на человека (DSP), которое измеряется в мегабайтах на человека (где мегабайт равен 10 6 байт и сокращенно обозначается МБ). Глобальный DSP (GDSP) — это общее пространство на жестком диске (в МБ) новых единиц, проданных за год, деленное на численность населения мира в этом году. Метрика GDSP — это грубая мера того, какой объем дискового хранилища может быть потенциально использован для сбора данных, специфичных для конкретного человека, о населении мира. [5] В 1983 году во всем мире было продано один миллион фиксированных дисков с предполагаемым общим объемом 90 терабайт ; диски на 30 МБ имели самый большой сегмент рынка. [9] В 1996 году было продано 105 миллионов дисков общим объемом 160 623 терабайт, причем лидировали в отрасли диски на 1 и 2 гигабайта . [10] К 2000 году, когда 20-гигабайтные диски станут лидерами отрасли, ожидается, что общий объем продаж жестких дисков за год составит 2 829 288 терабайт. В 1997 году объем продаж жестких дисков превысит 34 миллиарда долларов.
По словам Латаньи Суини , сегодня существуют три тенденции в сборе данных:
Тип 1. Расширение количества собираемых полей, известное как тенденция «собирать больше».
Тип 2. Заменить существующий сбор агрегированных данных на сбор данных, специфичный для конкретного человека, известный как тенденция «собирать конкретные данные».
Тип 3. Собирайте информацию, начиная новый сбор данных, специфичный для конкретного человека, известный как тенденция «соберите, если сможете». [5]
Поскольку «информация» в электронных СМИ часто используется как синоним «данных», термин «информационный взрыв» тесно связан с концепцией потока данных (также называемого потоком данных ). Иногда также используется термин «информационный поток» . Все они в основном сводятся к постоянно растущему объему электронных данных, обмениваемых за единицу времени. Термин, который охватывает потенциальные негативные последствия информационного взрыва, — это информационная инфляция . [11] Осознание неуправляемых объемов данных росло вместе с появлением все более мощной обработки данных с середины 1960-х годов. [12]
Несмотря на то, что обилие информации может быть полезным на нескольких уровнях, некоторые проблемы могут вызывать беспокойство, такие как конфиденциальность , правовые и этические принципы, фильтрация и точность данных. [13] Фильтрация относится к поиску полезной информации среди такого большого количества данных, что относится к работе специалистов по данным. Типичным примером необходимости фильтрации данных ( интеллектуального анализа данных ) является здравоохранение, поскольку в ближайшие годы должны быть доступны электронные медицинские карты (ЭМК ) пациентов. При таком количестве доступной информации врачам необходимо будет иметь возможность выявлять закономерности и выбирать важные данные для диагностики пациента. [13] С другой стороны, по мнению некоторых экспертов, наличие такого большого количества общедоступных данных затрудняет предоставление данных, которые фактически являются анонимными. [5] Еще один момент, который следует учитывать, — это правовые и этические принципы, которые касаются того, кто будет владельцем данных и как часто он/она обязан(а) их раскрывать и на какой срок. [13] При таком количестве источников данных еще одной проблемой будет их точность. Ненадежный источник может быть оспорен другими, заказав новый набор данных, что приведет к повторению информации. [13] По словам Эдварда Хута, еще одной проблемой является доступность и стоимость такой информации. [14] Уровень доступности может быть улучшен либо за счет снижения стоимости, либо за счет повышения полезности информации. Снижение стоимости, по мнению автора, может быть достигнуто ассоциациями, которые должны оценить, какая информация является релевантной, и собрать ее более организованным образом.
По состоянию на август 2005 года насчитывалось более 70 миллионов веб-серверов . [15] По состоянию на сентябрь 2007 года [обновлять]насчитывалось более 135 миллионов веб-серверов. [16]
Согласно Technorati , количество блогов удваивается примерно каждые 6 месяцев, и по состоянию на апрель 2006 года общее количество блогов составило 35,3 миллиона [ссылка]. [17] Это пример ранних стадий логистического роста , где рост приблизительно экспоненциальный , поскольку блоги являются недавним нововведением. По мере того, как количество блогов приближается к количеству возможных производителей (людей), происходит насыщение, рост снижается, и количество блогов в конечном итоге стабилизируется.
считаю, что за последние несколько лет мы привели в движение информационный взрыв. На каждого человека обрушивается больше информации, чем он может сейчас обработать, но он учится с ней справляться, и по мере того, как он учится, это пойдет ему на пользу.