Хранение компьютерных данных

Хранение цифровых данных, считываемых компьютерами

ГиБ SDRAM , установленный в компьютере . Пример первичного хранилища .
Жесткий диск PATA (HDD) объемом 15  ГБ , выпущенный в 1999 году. При подключении к компьютеру служит в качестве дополнительного хранилища.
Ленточный картридж SDLT на 160  ГБ , пример автономного хранилища. При использовании в роботизированной ленточной библиотеке он классифицируется как третичное хранилище.
DVD-привод для чтения/записи с расширенной подставкой для носителей

Хранение компьютерных данных или цифровое хранение данных — это технология, состоящая из компьютерных компонентов и носителей записи , которые используются для сохранения цифровых данных . Это основная функция и фундаментальный компонент компьютеров. [1] : 15–16 

Центральный процессор (ЦП) компьютера — это то, что манипулирует данными, выполняя вычисления. На практике почти все компьютеры используют иерархию хранения , [1] : 468–473  , которая помещает быстрые, но дорогие и небольшие варианты хранения близко к ЦП, а более медленные, но менее дорогие и большие варианты — дальше. Как правило, быстрые [a] технологии называются «памятью», в то время как более медленные постоянные технологии называются «хранением».

Даже первые компьютерные разработки, аналитическая машина Чарльза Бэббиджа и аналитическая машина Перси Ладгейта , четко различали обработку и память (Бэббидж хранил числа как вращения шестеренок, в то время как Ладгейт хранил числа как смещения стержней в челноках). Это различие было расширено в архитектуре фон Неймана , где ЦП состоит из двух основных частей: блока управления и арифметико-логического устройства (АЛУ). Первое управляет потоком данных между ЦП и памятью, а второе выполняет арифметические и логические операции с данными.

Функциональность

Без значительного объема памяти компьютер мог бы просто выполнять фиксированные операции и немедленно выводить результат. Его пришлось бы перенастраивать, чтобы изменить его поведение. Это приемлемо для таких устройств, как настольные калькуляторы , цифровые сигнальные процессоры и другие специализированные устройства. Машины фон Неймана отличаются наличием памяти, в которой они хранят свои рабочие инструкции и данные. [1] : 20  Такие компьютеры более универсальны, поскольку им не нужно перенастраивать свое оборудование для каждой новой программы, а можно просто перепрограммировать с помощью новых инструкций в памяти; они также, как правило, проще в проектировании, поскольку относительно простой процессор может сохранять состояние между последовательными вычислениями для создания сложных процедурных результатов. Большинство современных компьютеров являются машинами фон Неймана.

Организация и представление данных

Современный цифровой компьютер представляет данные с помощью двоичной системы счисления . Текст, числа, изображения, аудио и почти любая другая форма информации может быть преобразована в строку битов или двоичных цифр, каждая из которых имеет значение 0 или 1. Наиболее распространенной единицей хранения является байт , равный 8 битам. Фрагмент информации может обрабатываться любым компьютером или устройством, чье пространство для хранения достаточно велико, чтобы вместить двоичное представление фрагмента информации или просто данных . Например, полное собрание сочинений Шекспира , около 1250 страниц в печатном виде, может быть сохранено примерно в пяти мегабайтах (40 миллионов бит) с одним байтом на символ.

Данные кодируются путем назначения битового шаблона каждому символу , цифре или мультимедийному объекту. Существует множество стандартов кодирования (например, кодировки символов, такие как ASCII , кодировки изображений, такие как JPEG , и кодировки видео, такие как MPEG-4 ).

Добавляя биты к каждой закодированной единице, избыточность позволяет компьютеру обнаруживать ошибки в закодированных данных и исправлять их на основе математических алгоритмов. Ошибки обычно возникают с низкой вероятностью из-за случайного переворота значения бита или «физической усталости бита», потери физическим битом в хранилище его способности поддерживать различимое значение (0 или 1) или из-за ошибок в межкомпьютерной или внутрикомпьютерной коммуникации. Случайное переворот бита (например, из-за случайного излучения ) обычно исправляется при обнаружении. Бит или группа неисправных физических битов (конкретный дефектный бит не всегда известен; определение группы зависит от конкретного устройства хранения) обычно автоматически ограждается, выводится из использования устройством и заменяется другой функционирующей эквивалентной группой в устройстве, где исправленные значения битов восстанавливаются (если это возможно). Метод циклического избыточного кода (CRC) обычно используется в коммуникациях и хранилищах для обнаружения ошибок . Затем обнаруженная ошибка повторяется.

Методы сжатия данных позволяют во многих случаях (например, в базе данных) представлять строку битов более короткой строкой битов («сжимать») и восстанавливать исходную строку («распаковывать») при необходимости. Это использует существенно меньше памяти (десятки процентов) для многих типов данных за счет большего объема вычислений (сжимать и распаковывать при необходимости). Анализ компромисса между экономией затрат на хранение и затратами на связанные вычисления и возможными задержками в доступности данных выполняется до принятия решения о том, сохранять определенные данные сжатыми или нет.

В целях безопасности определенные типы данных (например, информация о кредитных картах ) могут храниться в зашифрованном виде в хранилище, чтобы предотвратить возможность несанкционированного восстановления информации из фрагментов снимков хранилища.

Иерархия хранения

Различные формы хранения, разделенные в зависимости от их расстояния от центрального процессора . Основными компонентами универсального компьютера являются арифметико-логическое устройство , управляющая схема , пространство для хранения и устройства ввода/вывода . Технология и емкость как у обычных домашних компьютеров около 2005 года.

Как правило, чем ниже хранилище в иерархии, тем меньше его пропускная способность и тем больше задержка доступа к нему со стороны ЦП. Это традиционное разделение хранилища на первичное, вторичное, третичное и автономное хранилище также руководствуется стоимостью за бит.

В современном использовании память обычно является быстрой, но временной полупроводниковой памятью для чтения-записи , как правило, DRAM (динамическая оперативная память) или другими подобными устройствами. Хранилище состоит из устройств хранения и их носителей, не доступных напрямую ЦП ( вторичная или третичная память ), как правило, жестких дисков , оптических дисководов и других устройств, более медленных, чем ОЗУ, но энергонезависимых (сохраняющих содержимое при выключении питания). [2]

Исторически память , в зависимости от технологии, называлась центральной памятью , основной памятью , основным хранилищем , барабаном , основной памятью , реальным хранилищем или внутренней памятью . Между тем, более медленные постоянные устройства хранения назывались вторичным хранилищем , внешней памятью или вспомогательным/периферийным хранилищем .

Первичное хранилище

Первичная память (также известная как основная память , внутренняя память или первичная память ), часто называемая просто памятью , является единственной, к которой напрямую имеет доступ ЦП. ЦП непрерывно считывает хранящиеся там инструкции и выполняет их по мере необходимости. Любые активно используемые данные также хранятся там единообразно.

Исторически первые компьютеры использовали линии задержки , трубки Уильямса или вращающиеся магнитные барабаны в качестве первичного хранилища. К 1954 году эти ненадежные методы были в основном заменены памятью на магнитных сердечниках . Память на сердечниках оставалась доминирующей до 1970-х годов, когда достижения в области технологии интегральных схем позволили полупроводниковой памяти стать экономически конкурентоспособной.

Это привело к появлению современной оперативной памяти (ОЗУ). Она небольшая, легкая, но в то же время довольно дорогая. Конкретные типы ОЗУ, используемые для первичного хранения, являются энергозависимыми , то есть они теряют информацию, когда не включены. Помимо хранения открытых программ, она служит в качестве дискового кэша и буфера записи для повышения производительности чтения и записи. Операционные системы заимствуют емкость ОЗУ для кэширования, пока она не нужна работающему программному обеспечению. [3] Резервная память может использоваться в качестве ОЗУ для временного высокоскоростного хранения данных.

Как показано на схеме, традиционно, помимо основной оперативной памяти большой емкости, существуют еще два подуровня первичной памяти:

  • Регистры процессора расположены внутри процессора. Каждый регистр обычно содержит слово данных (часто 32 или 64 бита). Инструкции ЦП предписывают арифметико-логическому устройству выполнять различные вычисления или другие операции с этими данными (или с их помощью). Регистры являются самой быстрой из всех форм хранения компьютерных данных.
  • Кэш процессора — это промежуточный этап между сверхбыстрыми регистрами и гораздо более медленной основной памятью. Он был введен исключительно для повышения производительности компьютеров. Наиболее активно используемая информация в основной памяти просто дублируется в кэш-памяти, которая быстрее, но имеет гораздо меньшую емкость. С другой стороны, основная память намного медленнее, но имеет гораздо большую емкость хранения, чем регистры процессора. Также широко используется многоуровневая иерархическая настройка кэша — первичный кэш является наименьшим, самым быстрым и расположен внутри процессора; вторичный кэш несколько больше и медленнее.

Основная память напрямую или косвенно подключена к центральному процессору через шину памяти . На самом деле это две шины (не показаны на схеме): адресная шина и шина данных . Сначала ЦП отправляет число через адресную шину, число, называемое адресом памяти , которое указывает желаемое местоположение данных. Затем он считывает или записывает данные в ячейки памяти, используя шину данных. Кроме того, блок управления памятью (MMU) — это небольшое устройство между ЦП и ОЗУ, пересчитывающее фактический адрес памяти, например, для предоставления абстракции виртуальной памяти или других задач.

Поскольку типы RAM, используемые для первичного хранения, являются энергозависимыми (не инициализированными при запуске), компьютер, содержащий только такое хранилище, не будет иметь источника для чтения инструкций, чтобы запустить компьютер. Следовательно, энергонезависимое первичное хранилище, содержащее небольшую программу запуска ( BIOS ), используется для начальной загрузки компьютера, то есть для чтения более крупной программы из энергонезависимого вторичного хранилища в RAM и начала ее выполнения. Энергонезависимая технология, используемая для этой цели, называется ROM, что означает память только для чтения (терминология может быть несколько запутанной, поскольку большинство типов ROM также способны к произвольному доступу ).

Многие типы "ПЗУ" не являются буквально только для чтения , поскольку возможны обновления; однако это медленно, и память должна быть стерта большими порциями, прежде чем ее можно будет перезаписать. Некоторые встроенные системы запускают программы непосредственно из ПЗУ (или аналогичного), поскольку такие программы редко изменяются. Стандартные компьютеры не хранят нерудиментарные программы в ПЗУ, а вместо этого используют большие емкости вторичной памяти, которая также является энергонезависимой и не такой дорогой.

В последнее время термины «первичное хранилище» и «вторичное хранилище» в некоторых случаях относятся к тому, что исторически называлось соответственно «вторичным хранилищем» и «третичным хранилищем» . [4]

Первичная память, включая ПЗУ , ЭСППЗУ , флэш-память NOR и ОЗУ [5] , обычно имеет байтовую адресацию .

Вторичное хранилище

Вторичное хранилище (также известное как внешняя память или вспомогательное хранилище ) отличается от первичного хранилища тем, что оно не доступно напрямую ЦП. Компьютер обычно использует свои каналы ввода/вывода для доступа к вторичному хранилищу и передачи нужных данных в первичное хранилище. Вторичное хранилище является энергонезависимым (сохраняет данные при отключении питания). Современные компьютерные системы обычно имеют на два порядка больше вторичного хранилища, чем первичного, поскольку вторичное хранилище дешевле.

В современных компьютерах жесткие диски (HDD) или твердотельные накопители (SSD) обычно используются в качестве вторичного хранилища. Время доступа на байт для HDD или SSD обычно измеряется в миллисекундах (тысячных долях секунды), в то время как время доступа на байт для первичного хранилища измеряется в наносекундах (миллиардных долях секунды). Таким образом, вторичное хранилище значительно медленнее первичного хранилища. Вращающиеся оптические запоминающие устройства, такие как CD и DVD -приводы, имеют еще большее время доступа. Другие примеры технологий вторичного хранения включают USB-флеш-накопители , дискеты , магнитную ленту , бумажную ленту , перфокарты и RAM-диски .

Как только головка чтения/записи диска на HDD достигает надлежащего размещения и данные, последующие данные на дорожке очень быстро доступны. Чтобы сократить время поиска и задержку вращения, данные передаются на диски и с дисков большими непрерывными блоками. Последовательный или блочный доступ к дискам на порядки быстрее, чем случайный доступ, и было разработано много сложных парадигм для проектирования эффективных алгоритмов, основанных на последовательном и блочном доступе. Другим способом уменьшения узкого места ввода/вывода является параллельное использование нескольких дисков для увеличения пропускной способности между первичной и вторичной памятью. [6]

Вторичное хранилище часто форматируется в соответствии с форматом файловой системы , который обеспечивает абстракцию, необходимую для организации данных в файлы и каталоги , а также предоставляет метаданные, описывающие владельца определенного файла, время доступа, разрешения на доступ и другую информацию.

Большинство операционных систем компьютеров используют концепцию виртуальной памяти , что позволяет использовать больше первичной емкости хранилища, чем физически доступно в системе. По мере заполнения первичной памяти система перемещает наименее используемые фрагменты ( страницы ) в файл подкачки или файл подкачки на вторичном хранилище, извлекая их позже, когда это необходимо. Если много страниц перемещается на более медленное вторичное хранилище, производительность системы ухудшается.

Вторичные хранилища, включая HDD , ODD и SSD , обычно имеют блочную адресацию.

Третичное хранилище

Большая библиотека лент , с картриджами, размещенными на полках спереди, и роботизированной рукой, движущейся сзади. Видимая высота библиотеки составляет около 180 см.

Третичное хранилище или третичная память [7] — это уровень ниже вторичного хранилища. Обычно он включает в себя роботизированный механизм, который монтирует (вставляет) и демонтирует съемные носители массовой информации в устройство хранения в соответствии с требованиями системы; такие данные часто копируются во вторичное хранилище перед использованием. Он в основном используется для архивирования редко используемой информации, поскольку он намного медленнее вторичного хранилища (например, 5–60 секунд против 1–10 миллисекунд). Это в первую очередь полезно для чрезвычайно больших хранилищ данных, доступ к которым осуществляется без участия человека. Типичные примеры включают ленточные библиотеки и оптические музыкальные автоматы .

Когда компьютеру необходимо прочитать информацию из третичного хранилища, он сначала обращается к базе данных каталога , чтобы определить, какая лента или диск содержит информацию. Затем компьютер дает указание роботизированной руке извлечь носитель и поместить его в привод. Когда компьютер закончит чтение информации, роботизированная рука вернет носитель на его место в библиотеке.

Третичное хранилище также известно как хранилище nearline , потому что оно «почти онлайн». Формальное различие между хранилищем online, nearline и offline следующее: [8]

  • Онлайн-хранилище сразу же становится доступным для ввода-вывода.
  • Хранилище Nearline недоступно немедленно, но его можно быстро перевести в режим онлайн без вмешательства человека.
  • Офлайн-хранилище недоступно немедленно и требует вмешательства человека для перехода в режим онлайн.

Например, постоянно включенные вращающиеся жесткие диски являются онлайн-хранилищем, в то время как вращающиеся диски, которые автоматически останавливаются, например, в массивах бездействующих дисков ( MAID ), являются nearline-хранилищем. Съемные носители, такие как картриджи с лентой, которые могут быть автоматически загружены, как в ленточных библиотеках , являются nearline-хранилищем, в то время как картриджи с лентой, которые должны быть загружены вручную, являются offline-хранилищем.

Оффлайн хранение

Оффлайновое хранилище — это компьютерное хранилище данных на носителе или устройстве, которое не находится под контролем процессорного блока . [9] Носитель записывается, как правило, на вторичном или третичном устройстве хранения, а затем физически удаляется или отключается. Он должен быть вставлен или подключен человеком-оператором, прежде чем компьютер сможет снова получить к нему доступ. В отличие от третичного хранилища, к нему нельзя получить доступ без взаимодействия с человеком.

Офлайн- хранение используется для передачи информации , поскольку отсоединенный носитель может быть легко физически перемещен. Кроме того, оно полезно в случаях катастроф, когда, например, пожар уничтожает исходные данные, носитель в удаленном месте не будет затронут, что позволяет выполнить аварийное восстановление . Офлайн-хранение повышает общую информационную безопасность , поскольку оно физически недоступно с компьютера, а конфиденциальность или целостность данных не могут быть затронуты методами компьютерных атак. Кроме того, если информация, хранящаяся в архивных целях, редко используется, офлайн-хранение обходится дешевле, чем третичное хранилище.

В современных персональных компьютерах большинство вторичных и третичных носителей информации также используются для автономного хранения. Оптические диски и устройства флэш-памяти являются наиболее популярными, и в гораздо меньшей степени съемные жесткие диски; более старые примеры включают дискеты и Zip-диски. В корпоративном использовании преобладают картриджи с магнитной лентой; более старые примеры включают открытую катушку магнитной ленты и перфокарты.

Характеристики хранения

Модуль оперативной памяти DDR2 для ноутбука объемом 1 ГиБ

Технологии хранения на всех уровнях иерархии хранения можно дифференцировать, оценивая определенные основные характеристики, а также измеряя характеристики, характерные для конкретной реализации. Эти основные характеристики — это изменчивость, изменчивость, доступность и адресуемость. Для любой конкретной реализации любой технологии хранения характеристики, которые стоит измерить, — это емкость и производительность.

Обзор
ХарактеристикаЖесткий дискОптический дискФлэш-памятьОперативная памятьЛинейная лента-открытая
ТехнологииМагнитный дискЛазерный лучПолупроводникМагнитная лента
ВолатильностьНетНетНетЛетучийНет
Произвольный доступДаДаДаДаНет
Задержка (время доступа)~15 мс (быстро)~150 мс (умеренно)Нет (мгновенно)Нет (мгновенно)Отсутствие произвольного доступа (очень медленно)
КонтроллерВнутреннийВнешнийВнутреннийВнутреннийВнешний
Сбой с неизбежной потерей данныхУдар головойСхемы
Обнаружение ошибокДиагностика ( SMART )Измерение частоты ошибокОбозначается нисходящими скачками в скорости передачи данных(Кратковременное хранение)Неизвестный
Цена за местоНизкийНизкийВысокийОчень высокийОчень низкий (но дорогие диски)
Цена за единицуУмеренныйНизкийУмеренныйВысокийУмеренные (но дорогие диски)
Основное применениеСреднесрочное архивирование, регулярное резервное копирование, расширение хранилища сервера, рабочей станцииДолгосрочное архивирование, распространение печатных копийПортативная электроника; операционная системаВ режиме реального времениДолгосрочное архивирование

Волатильность

Энергонезависимая память сохраняет сохраненную информацию, даже если не снабжается постоянно электроэнергией. Она подходит для долгосрочного хранения информации. Энергонезависимая память требует постоянного питания для поддержания сохраненной информации. Самые быстрые технологии памяти — энергозависимые, хотя это не универсальное правило. Поскольку первичное хранилище должно быть очень быстрым, оно в основном использует энергозависимую память.

Динамическая память с произвольным доступом — это форма энергозависимой памяти, которая также требует периодического перечитывания и перезаписи или обновления хранимой информации , в противном случае она исчезнет. Статическая память с произвольным доступом — это форма энергозависимой памяти, похожая на DRAM, за исключением того, что ее никогда не нужно обновлять, пока подается питание; она теряет свое содержимое, когда питание пропадает.

Источник бесперебойного питания (ИБП) может использоваться для предоставления компьютеру короткого окна времени для перемещения информации из первичного энергозависимого хранилища в энергонезависимое хранилище до того, как разрядятся батареи. Некоторые системы, например, EMC Symmetrix , имеют встроенные батареи, которые поддерживают энергозависимое хранилище в течение нескольких минут.

Изменчивость

Хранилище для чтения/записи или изменяемое хранилище
Позволяет перезаписывать информацию в любое время. Компьютер без некоторого объема памяти для чтения/записи в качестве основного хранилища будет бесполезен для многих задач. Современные компьютеры обычно используют память для чтения/записи также и в качестве вторичного хранилища.
Медленная запись, быстрое чтение хранилища
Хранилище для чтения/записи, которое позволяет многократно перезаписывать информацию, но при этом операция записи намного медленнее операции чтения. Примерами служат CD-RW и SSD .
Хранилище однократной записи
Write once read many (WORM) позволяет записывать информацию только один раз в какой-то момент после изготовления. Примерами служат полупроводниковые программируемые постоянные запоминающие устройства и CD-R .
Хранилище только для чтения
Сохраняет информацию, сохраненную во время производства. Примерами служат маски ПЗУ ИС и CD-ROM .

Доступность

Произвольный доступ
К любому месту в хранилище можно получить доступ в любой момент примерно за одинаковое время. Такая характеристика хорошо подходит для первичного и вторичного хранения. Большинство полупроводниковых запоминающих устройств , флэш-памяти и жестких дисков обеспечивают произвольный доступ, хотя и полупроводниковые, и флэш-память имеют минимальную задержку по сравнению с жесткими дисками, поскольку никакие механические части не нужно перемещать.
Последовательный доступ
Доступ к фрагментам информации будет осуществляться последовательно, один за другим; поэтому время доступа к определенному фрагменту информации зависит от того, к какому фрагменту информации был получен последний доступ. Такая характеристика типична для офлайнового хранилища.

Адресуемость

Адресуемый по местоположению
Каждая индивидуально доступная единица информации в хранилище выбирается с помощью ее числового адреса памяти . В современных компьютерах адресное хранилище обычно ограничивается первичным хранилищем, доступ к которому осуществляется изнутри компьютерными программами, поскольку адресное хранилище очень эффективно, но обременительно для людей.
Файл адресуемый
Информация делится на файлы переменной длины, и конкретный файл выбирается с понятными человеку каталогами и именами файлов. Базовое устройство по-прежнему адресуется по местоположению, но операционная система компьютера предоставляет абстракцию файловой системы , чтобы сделать операцию более понятной. В современных компьютерах вторичные, третичные и офлайновые хранилища используют файловые системы.
Адресуемый по содержанию
Каждая индивидуально доступная единица информации выбирается на основе (части) хранящегося в ней содержимого. Хранилище с адресацией по содержимому может быть реализовано с использованием программного обеспечения (компьютерной программы) или оборудования (компьютерного устройства), причем оборудование является более быстрым, но более дорогим вариантом. Аппаратная память с адресацией по содержимому часто используется в кэше ЦП компьютера .

Емкость

Сырая мощность
Общий объем хранимой информации, которую может вместить устройство хранения или носитель. Выражается в виде количества бит или байтов (например, 10,4 мегабайта ).
Плотность хранения памяти
Компактность хранимой информации. Это емкость носителя, деленная на единицу длины, площади или объема (например, 1,2 мегабайта на квадратный дюйм).

Производительность

Задержка
Время, необходимое для доступа к определенному месту в хранилище. Соответствующей единицей измерения обычно является наносекунда для первичного хранилища, миллисекунда для вторичного хранилища и секунда для третичного хранилища. Может иметь смысл разделить задержку чтения и задержку записи (особенно для энергонезависимой памяти), а в случае хранилища с последовательным доступом — минимальную, максимальную и среднюю задержку.
Пропускная способность
Скорость, с которой информация может быть прочитана или записана в хранилище. В компьютерном хранилище данных пропускная способность обычно выражается в мегабайтах в секунду (МБ/с), хотя может также использоваться битрейт . Как и в случае с задержкой, может потребоваться дифференцировать скорость чтения и скорость записи. Кроме того, последовательный доступ к носителям, в отличие от случайного, обычно обеспечивает максимальную пропускную способность.
Зернистость
Размер наибольшего «фрагмента» данных, к которому можно эффективно получить доступ как к единому целому, например, без внесения дополнительной задержки.
Надежность
Вероятность спонтанного изменения значения бита при различных условиях или общая интенсивность отказов .

Для измерения производительности ввода-вывода в Linux можно использовать такие утилиты, как hdparm и sar .

Использование энергии

  • Устройства хранения данных, которые снижают использование вентиляторов, автоматически отключаются во время бездействия, а жесткие диски с низким энергопотреблением могут снизить потребление энергии на 90 процентов. [10] [11]
  • 2,5-дюймовые жесткие диски часто потребляют меньше энергии, чем более крупные. [12] [13] Твердотельные диски малой емкости не имеют движущихся частей и потребляют меньше энергии, чем жесткие диски. [14] [15] [16] Кроме того, память может потреблять больше энергии, чем жесткие диски. [16] Большие кэши, которые используются для предотвращения столкновений со стеной памяти , также могут потреблять большое количество энергии.

Безопасность

Полное шифрование диска , шифрование тома и виртуального диска, а также шифрование файлов/папок легко доступно для большинства устройств хранения данных. [17]

Аппаратное шифрование памяти доступно в архитектуре Intel, поддерживающей полное шифрование памяти (TME) и гранулярное шифрование памяти на уровне страниц с несколькими ключами (MKTME). [18] [19] и в поколении SPARC M7 с октября 2015 года. [20]

Уязвимость и надежность

Предупреждение программного обеспечения SMART указывает на приближающийся отказ жесткого диска.

Различные типы хранилищ данных имеют разные точки отказа и разные методы прогнозного анализа отказов .

Уязвимости, которые могут мгновенно привести к полной потере данных, — это поломка головок на механических жестких дисках и отказ электронных компонентов на флэш-накопителях.

Обнаружение ошибок

Измерение частоты ошибок на DVD+R . Незначительные ошибки исправимы и находятся в пределах нормы.

Надвигающийся отказ жестких дисков можно оценить с помощью диагностических данных SMART, которые включают часы работы и количество запусков, хотя надежность этих данных оспаривается. [21]

Скорость передачи данных во флэш-памяти может резко снижаться из-за накопления ошибок, которые контроллер флэш-памяти пытается исправить.

Состояние оптических носителей можно определить путем измерения исправимых незначительных ошибок , высокие показатели которых указывают на ухудшение и/или низкое качество носителя. Слишком много последовательных незначительных ошибок могут привести к повреждению данных. Не все производители и модели оптических приводов поддерживают сканирование ошибок. [22]

Носители информации

По состоянию на 2011 год [обновлять]наиболее часто используемыми носителями данных являются полупроводниковые, магнитные и оптические, в то время как бумага все еще имеет ограниченное применение. Предлагается разработать некоторые другие фундаментальные технологии хранения, такие как массивы all-flash (AFA).

Полупроводник

Полупроводниковая память использует полупроводниковые интегральные схемы (ИС) для хранения информации. Данные обычно хранятся в ячейках памяти металл-оксид-полупроводник (МОП) . Микросхема полупроводниковой памяти может содержать миллионы ячеек памяти, состоящих из крошечных полевых МОП-транзисторов (МОП-транзисторов) и/или МОП-конденсаторов . Существуют как энергозависимые , так и энергонезависимые формы полупроводниковой памяти, первые используют стандартные МОП-транзисторы, а вторые — МОП-транзисторы с плавающим затвором .

В современных компьютерах первичная память почти исключительно состоит из динамической энергозависимой полупроводниковой памяти с произвольным доступом (RAM), в частности динамической памяти с произвольным доступом (DRAM). С начала века тип энергонезависимой полупроводниковой памяти с плавающим затвором, известный как флэш-память, неуклонно набирает популярность в качестве автономного хранилища для домашних компьютеров. Энергонезависимая полупроводниковая память также используется для вторичного хранения в различных современных электронных устройствах и специализированных компьютерах, которые разработаны для них.

Еще в 2006 году производители ноутбуков и настольных компьютеров начали использовать твердотельные накопители (SSD) на основе флэш-памяти в качестве стандартных вариантов конфигурации для вторичного хранилища в дополнение к более традиционным жестким дискам или вместо них. [23] [24] [25] [26] [27]

Магнитный

Магнитное хранилище использует различные схемы намагничивания на магнитно- покрытой поверхности для хранения информации. Магнитное хранилище является энергонезависимым . Доступ к информации осуществляется с помощью одной или нескольких головок чтения/записи, которые могут содержать один или несколько записывающих преобразователей. Головка чтения/записи покрывает только часть поверхности, так что головка или носитель или и то, и другое должны быть перемещены относительно друг друга для доступа к данным. В современных компьютерах магнитное хранилище будет принимать следующие формы:

В ранних компьютерах магнитная память также использовалась как:

Магнитные накопители не имеют определенного предела циклов перезаписи, как флэш-накопители и перезаписываемые оптические носители, поскольку изменение магнитных полей не вызывает физического износа. Скорее, их срок службы ограничен механическими частями. [28] [29]

Оптический

Оптическое хранилище , типичный оптический диск , хранит информацию в деформациях на поверхности круглого диска и считывает эту информацию, освещая поверхность лазерным диодом и наблюдая за отражением. Оптическое хранилище на диске является энергонезависимым . Деформации могут быть постоянными (только для чтения), сформированными один раз (однократно записываемые носители) или обратимыми (записываемые или считываемые/записываемые носители). Следующие формы широко используются по состоянию на 2009 год [обновлять]: [30]

  • CD , CD-ROM , DVD , BD-ROM : хранилище только для чтения, используемое для массового распространения цифровой информации (музыки, видео, компьютерных программ);
  • CD-R , DVD-R , DVD+R , BD-R : однократно записываемое хранилище, используемое для третичного и автономного хранения;
  • CD-RW , DVD-RW , DVD+RW , DVD-RAM , BD-RE : Медленная запись, быстрое чтение, используется для третичного и автономного хранения;
  • Оптический накопитель сверхвысокой плотности (UDO) по емкости аналогичен BD-R или BD-RE и представляет собой хранилище с медленной записью и быстрым чтением, используемое для третичного и автономного хранения.

Магнитооптический дисковый накопитель — это оптический дисковый накопитель, в котором магнитное состояние на ферромагнитной поверхности сохраняет информацию. Информация считывается оптически и записывается путем объединения магнитных и оптических методов. Магнитооптический дисковый накопитель — это энергонезависимое хранилище с последовательным доступом , медленной записью и быстрым чтением, используемое для третичного и автономного хранения.

Было также предложено трехмерное оптическое хранение данных .

Светоиндуцированное плавление намагниченности в магнитных фотопроводниках также было предложено для высокоскоростного магнитооптического хранения с низким потреблением энергии. [31]

Бумага

Хранилище данных на бумаге , обычно в виде бумажной ленты или перфокарт , долгое время использовалось для хранения информации для автоматической обработки, особенно до появления компьютеров общего назначения. Информация записывалась путем прокалывания отверстий в бумажном или картонном носителе и считывалась механически (или позднее оптически) для определения того, было ли определенное место на носителе сплошным или содержало отверстие. Штрихкоды позволяют надежно прикреплять к продаваемым или транспортируемым объектам некоторую информацию, считываемую компьютером.

Относительно небольшие объемы цифровых данных (по сравнению с другими хранилищами цифровых данных) могут быть сохранены на бумаге в виде матричного штрих-кода для очень долгосрочного хранения, поскольку долговечность бумаги обычно превышает даже долговечность магнитного хранения данных. [32] [33]

Другие носители информации или подложки

Память на электронных лампах
Трубка Уильямса использовала электронно-лучевую трубку , а трубка Selectron использовала большую вакуумную трубку для хранения информации. Эти первичные запоминающие устройства недолго просуществовали на рынке, поскольку трубка Уильямса была ненадежной, а трубка Selectron была дорогой.
Электроакустическая память
Память с задержкой использовала звуковые волны в веществе, таком как ртуть, для хранения информации. Память с задержкой была динамическим энергозависимым, циклически последовательным хранилищем чтения/записи и использовалась для первичного хранения.
Оптическая лента
это носитель для оптического хранения, обычно состоящий из длинной и узкой полоски пластика, на которую можно записывать узоры и с которой узоры можно считывать. Он разделяет некоторые технологии с кинопленкой и оптическими дисками, но не совместим ни с тем, ни с другим. Мотивацией разработки этой технологии была возможность гораздо большей емкости хранения, чем у магнитной ленты или оптических дисков.
Память с изменением фазы
использует различные механические фазы материала с фазовым переходом для хранения информации в адресуемой матрице X–Y и считывает информацию, наблюдая за изменяющимся электрическим сопротивлением материала. Память с фазовым переходом будет энергонезависимой, произвольно доступной для чтения/записи и может использоваться для первичного, вторичного и автономного хранения. Большинство перезаписываемых и многие оптические диски с однократной записью уже используют материал с фазовым переходом для хранения информации.
Голографическое хранение данных
хранит информацию оптически внутри кристаллов или фотополимеров . Голографическое хранилище может использовать весь объем носителя информации, в отличие от оптического дискового хранилища, которое ограничено небольшим количеством поверхностных слоев. Голографическое хранилище будет энергонезависимым, с последовательным доступом и либо с однократной записью, либо с чтением/записью. Его можно использовать для вторичного и автономного хранения. См. Holographic Versatile Disc (HVD).
Молекулярная память
хранит информацию в полимере , который может хранить электрический заряд. Молекулярная память может быть особенно подходящей для первичного хранения. Теоретическая емкость хранения молекулярной памяти составляет 10 терабит на квадратный дюйм (16 Гбит/мм 2 ). [34]
Магнитные фотопроводники
хранить магнитную информацию, которая может быть изменена при слабом освещении. [31]
ДНК
хранит информацию в нуклеотидах ДНК . Впервые это было сделано в 2012 году, когда исследователи достигли соотношения 1,28 петабайт на грамм ДНК. В марте 2017 года ученые сообщили, что новый алгоритм, называемый ДНК-фонтаном, достиг 85% от теоретического предела, при 215 петабайт на грамм ДНК. [35] [36] [37] [38]

Избыточность

В то время как группа битовых неисправностей может быть устранена с помощью механизмов обнаружения и исправления ошибок (см. выше), неисправность запоминающего устройства требует других решений. Следующие решения широко используются и действительны для большинства запоминающих устройств:

  • Зеркальное копирование устройств (репликация) – распространенное решение проблемы – постоянное поддержание идентичной копии содержимого устройства на другом устройстве (обычно того же типа). Недостатком является то, что это удваивает хранилище, и оба устройства (копии) должны обновляться одновременно с некоторыми накладными расходами и, возможно, некоторыми задержками. Положительным моментом является возможное одновременное чтение одной и той же группы данных двумя независимыми процессами, что повышает производительность. Когда одно из реплицированных устройств обнаруживается как неисправное, другая копия все еще работает и используется для создания новой копии на другом устройстве (обычно доступном в рабочем состоянии в пуле резервных устройств для этой цели).
  • Избыточный массив независимых дисков ( RAID ) — этот метод обобщает описанное выше зеркалирование устройств, позволяя одному устройству в группе устройств выйти из строя и заменить его восстановленным содержимым (зеркалирование устройств — это RAID с n=2 ). Группы RAID с n=5 или n=6 являются обычным явлением. n>2 экономит хранилище по сравнению с n=2 за счет большей обработки как во время обычной работы (с часто сниженной производительностью), так и при замене неисправного устройства.

Зеркальное отображение устройств и типичный RAID предназначены для обработки отказа одного устройства в группе RAID устройств. Однако если второй отказ происходит до того, как группа RAID будет полностью восстановлена ​​после первого отказа, то данные могут быть потеряны. Вероятность одного отказа обычно невелика. Таким образом, вероятность двух отказов в одной и той же группе RAID в непосредственной близости по времени намного меньше (приблизительно квадрат вероятности, т. е. умноженная на себя). Если база данных не может выдержать даже такую ​​меньшую вероятность потери данных, то сама группа RAID реплицируется (зеркалируется). Во многих случаях такое зеркалирование выполняется географически удаленно, в другом массиве хранения, для обработки восстановления после сбоев (см. восстановление после сбоев выше).

Сетевое подключение

Вторичное или третичное хранилище может подключаться к компьютеру с помощью компьютерных сетей . Эта концепция не относится к первичному хранилищу, которое в меньшей степени разделено между несколькими процессорами.

  • Прямое хранилище (DAS) — это традиционное массовое хранилище, которое не использует сеть. Это по-прежнему самый популярный подход. Этот ретроним был придуман недавно, вместе с NAS и SAN.
  • Сетевое хранилище (NAS) — это массовое хранилище, подключенное к компьютеру, к которому другой компьютер может получить доступ на уровне файлов через локальную сеть , частную глобальную сеть или, в случае онлайн-хранилища файлов , через Интернет . NAS обычно ассоциируется с протоколами NFS и CIFS/SMB .
  • Сеть хранения данных (SAN) — это специализированная сеть, которая предоставляет другим компьютерам емкость для хранения. Главное различие между NAS и SAN заключается в том, что NAS представляет и управляет файловыми системами для клиентских компьютеров, в то время как SAN обеспечивает доступ на уровне блочной адресации (сырой), оставляя подключаемым системам управление данными или файловыми системами в пределах предоставленной емкости. SAN обычно ассоциируется с сетями Fibre Channel .

Роботизированное хранилище

Большие количества отдельных магнитных лент, оптических или магнитооптических дисков могут храниться в роботизированных третичных устройствах хранения. В области ленточных накопителей они известны как ленточные библиотеки , а в области оптических накопителей — оптические музыкальные автоматы или библиотеки оптических дисков по аналогии. Наименьшие формы любой из этих технологий, содержащие только одно приводное устройство, называются автозагрузчиками или авточейнджерами .

Устройства хранения с роботизированным доступом могут иметь несколько слотов, каждый из которых содержит отдельные носители, и обычно одного или нескольких роботов-сборщиков, которые проходят по слотам и загружают носители во встроенные накопители. Расположение слотов и устройств-сборщиков влияет на производительность. Важными характеристиками такого хранилища являются возможные варианты расширения: добавление слотов, модулей, накопителей, роботов. Ленточные библиотеки могут иметь от 10 до более чем 100 000 слотов и предоставлять терабайты или петабайты информации near-line. Оптические музыкальные автоматы — это несколько меньшие решения, до 1000 слотов.

Роботизированное хранилище используется для резервного копирования и для архивов большой емкости в индустрии обработки изображений, медицины и видео. Иерархическое управление хранилищем — наиболее известная стратегия архивирования, которая заключается в автоматическом перемещении давно неиспользуемых файлов с быстрого жесткого диска в библиотеки или музыкальные автоматы. Если файлы нужны, они извлекаются обратно на диск.

Смотрите также

Основные темы хранения

Вторичное, третичное и автономное хранение информации

Конференции по хранению данных

Примечания

  1. ^ Большинство современных компьютеров используют энергозависимые технологии (которые теряют данные при отключении питания); ранние компьютеры использовали как энергозависимые, так и постоянные технологии.

Ссылки

Общественное достояние В этой статье использованы материалы из общедоступного Федерального стандарта 1037C. Администрация общих служб . Архивировано из оригинала 22 января 2022 г.

  1. ^ abc Паттерсон, Дэвид А.; Хеннесси, Джон Л. (2005). Организация и проектирование компьютеров: интерфейс аппаратного и программного обеспечения (3-е изд.). Амстердам : Morgan Kaufmann Publishers . ISBN 1-55860-604-1. OCLC  56213091.
  2. ^ Хранилище , как определено в Microsoft Computing Dictionary, 4-е изд. (c)1999 или в The Authoritative Dictionary of IEEE Standard Terms, 7-е изд., (c) 2000.
  3. ^ «Документация по /proc/sys/vm/ — Документация по ядру Linux».
  4. ^ "Основное хранилище или аппаратное обеспечение для хранения (показывает использование термина "основное хранилище" в значении "хранение на жестком диске")". searchstorage.techtarget.com . Архивировано из оригинала 10 сентября 2008 г. . Получено 18 июня 2011 г. .
  5. ^ Основы организации и архитектуры компьютера. Jones & Bartlett Learning. 2006. ISBN 978-0-7637-3769-6.
  6. ^ JS Vitter (2008). Алгоритмы и структуры данных для внешней памяти (PDF) . Серия по основам и тенденциям в теоретической информатике. Ганновер, Массачусетс: теперь издательство. ISBN 978-1-60198-106-6. Архивировано (PDF) из оригинала 4 января 2011 года.
  7. ^ "Диссертация о третичном хранилище" (PDF) . Архивировано (PDF) из оригинала 27 сентября 2007 г. . Получено 18 июня 2011 г. .
  8. ^ Пирсон, Тони (2010). «Корректное использование термина nearline». IBM developer-works, внутренняя система хранения данных . Архивировано из оригинала 24 ноября 2015 г. Получено 16 августа 2015 г.
  9. ^ Национальная система связи (7 августа 1996 г.). Федеральный стандарт 1037C – Телекоммуникации: Глоссарий терминов телекоммуникаций (технический отчет). Администрация общих служб. FS-1037C. Архивировано из оригинала 2 марта 2009 г. Получено 8 октября 2007 г.См. также статью Федеральный стандарт 1037C .
  10. ^ "Калькулятор экономии энергии". Архивировано из оригинала 21 декабря 2008 года.
  11. ^ "Насколько [re]drive на самом деле экологичен?". Простая технология . Архивировано из оригинала 5 августа 2008 г.
  12. Майк Чин (8 марта 2004 г.). «Будущее бесшумных ПК шириной 2,5 дюйма?». Архивировано из оригинала 20 июля 2008 г. Получено 2 августа 2008 г.
  13. Майк Чин (18 сентября 2002 г.). «Рекомендуемые жесткие диски». Архивировано из оригинала 5 сентября 2008 г. Получено 2 августа 2008 г.
  14. ^ "Super Talent's 2.5" IDE flash hard drive". Технический отчет . 12 июля 2006 г. стр. 13. Архивировано из оригинала 26 января 2012 г. Получено 18 июня 2011 г.
  15. ^ "Энергопотребление – Аппаратное обеспечение Тома: Устаревание традиционных жестких дисков? Предварительный просмотр флэш-накопителя Samsung емкостью 32 ГБ". tomshardware.com . 20 сентября 2006 г. Получено 18 июня 2011 г.
  16. ^ ab Алексей Меев (23 апреля 2008 г.). "SSD, i-RAM и традиционные жесткие диски". X-bit labs. Архивировано из оригинала 18 декабря 2008 г.
  17. ^ Карен Скарфон; Муруджиа Суппайя; Мэтт Секстон (ноябрь 2007 г.). «Руководство по технологиям шифрования хранения для устройств конечного пользователя» (PDF) . Национальный институт стандартов и технологий.
  18. ^ "Encryption specs" (PDF) . software.intel.com. Архивировано (PDF) из оригинала 9 октября 2022 г. Получено 28 декабря 2019 г.
  19. ^ "Предлагаемый API для шифрования всей памяти". Lwn.net . Получено 28 декабря 2019 г. .
  20. ^ "Введение в SPARC M7 и кремниевую защищенную память (SSM)". swisdev.oracle.com. Архивировано из оригинала 21 января 2019 г. Получено 28 декабря 2019 г.
  21. ^ "О чем на самом деле говорят нам ошибки жесткого диска SMART". Backblaze . 6 октября 2016 г.
  22. ^ "QPxTool - проверка качества". qpxtool.sourceforge.io .
  23. ^ "Новый ноутбук Samsung заменяет жесткий диск на флэш-память". Extreme tech . 23 мая 2006 г. Архивировано из оригинала 30 декабря 2010 г. Получено 18 июня 2011 г.
  24. ^ "Toshiba бросает шляпу в кольцо флэш-памяти ноутбука". technewsworld.com . Архивировано из оригинала 18 марта 2012 г. Получено 18 июня 2011 г.
  25. ^ "Mac Pro – Storage and RAID options for your Mac Pro". Apple. 27 июля 2006 г. Архивировано из оригинала 6 июня 2013 г. Получено 18 июня 2011 г.
  26. ^ "MacBook Air – лучшее из iPad встречает лучшее из Mac". Apple. Архивировано из оригинала 27 мая 2013 года . Получено 18 июня 2011 года .
  27. ^ "MacBook Air заменяет стандартный жесткий диск ноутбука на твердотельную флэш-память". news.inventhelp.com . 15 ноября 2010 г. Архивировано из оригинала 23 августа 2011 г. Получено 18 июня 2011 г.
  28. ^ "Сравнение выносливости SSD и HDD в эпоху QLC SSD" (PDF) . Технология Micron. Архивировано (PDF) из оригинала 9 октября 2022 г.
  29. ^ "Сравнение SSD и HDD - комплексное сравнение накопителей". www.stellarinfo.co.in .
  30. ^ "DVD FAQ - Полный справочник по технологиям DVD". Архивировано из оригинала 22 августа 2009 г.
  31. ^ ab Náfrádi, Bálint (24 ноября 2016 г.). "Оптически переключаемый магнетизм в фотоэлектрическом перовските CH3NH3(Mn:Pb)I3". Nature Communications . 7 : 13406. arXiv : 1611.08205 . Bibcode : 2016NatCo...713406N. doi : 10.1038/ncomms13406. PMC 5123013 . PMID  27882917. 
  32. ^ «Решение для резервного копирования на бумажных носителях (не такое глупое, как кажется)». 14 августа 2012 г.
  33. Стерлинг, Брюс (16 августа 2012 г.). «Бумажная резервная копия PaperBack». Wired .
  34. ^ "Новый метод самоорганизации наноразмерных элементов может трансформировать индустрию хранения данных". sciencedaily.com . 1 марта 2009 г. Архивировано из оригинала 1 марта 2009 г. Получено 18 июня 2011 г.
  35. ^ Йонг, Эд. «Эта крупинка ДНК содержит фильм, компьютерный вирус и подарочную карту Amazon». The Atlantic . Архивировано из оригинала 3 марта 2017 года . Получено 3 марта 2017 года .
  36. ^ "Исследователи хранят компьютерную операционную систему и короткий фильм на ДНК". phys.org . Архивировано из оригинала 2 марта 2017 г. . Получено 3 марта 2017 г. .
  37. ^ «ДНК могла бы хранить все данные мира в одной комнате». Science Magazine. 2 марта 2017 г. Архивировано из оригинала 2 марта 2017 г. Получено 3 марта 2017 г.
  38. ^ Эрлих, Янив; Зелински, Дина (2 марта 2017 г.). «DNA Fountain обеспечивает надежную и эффективную архитектуру хранения». Science . 355 (6328): 950–954. Bibcode :2017Sci...355..950E. doi :10.1126/science.aaj2038. PMID  28254941. S2CID  13470340.
  39. ^ «Аварийное восстановление в облаке AWS». 18 августа 2023 г.

Дальнейшее чтение

  • Года, К.; Кицурегава, М. (2012). «История систем хранения». Труды IEEE . 100 : 1433–1440. doi : 10.1109/JPROC.2012.2189787 .
  • Память и хранение, Музей истории компьютеров
Взято с "https://en.wikipedia.org/w/index.php?title=Хранилище_компьютерных_данных&oldid=1251741459"