Кусочек

Unit of information

Бит это самая базовая единица информации в вычислительной технике и цифровой связи . Название является производным от binary digit (двоичная цифра) . [1] Бит представляет логическое состояние с одним из двух возможных значений . Эти значения чаще всего представляются как « 1 » или « 0 » , но также широко используются и другие представления, такие как true / false (истина/ложь) , yes / no ( да/ нет) , on / off ( вкл / выкл ) или +/− .

Связь между этими значениями и физическими состояниями базового хранилища или устройства является вопросом соглашения, и различные назначения могут использоваться даже в пределах одного устройства или программы . Физически это может быть реализовано с помощью устройства с двумя состояниями.

Непрерывная группа двоичных цифр обычно называется битовой строкой , битовым вектором или одномерным (или многомерным) битовым массивом . Группа из восьми бит называется одним  байтом , но исторически размер байта не был строго определен. [2] Часто половинные, полные, двойные и учетверенные слова состоят из числа байтов, которое является низкой степенью двойки. Строка из четырех бит обычно называется полубайтом .

В теории информации один бит — это информационная энтропия случайной двоичной переменной, которая с равной вероятностью равна 0 или 1, [3] или информация, которая получается, когда значение такой переменной становится известным. [4] [5] Как единица информации или негэнтропии , бит также известен как шеннон , [6] названный в честь Клода Э. Шеннона . Как мера длины цифровой строки, которая кодируется как символы в алфавите 0-1 (двоичном), бит был назван бинитом, [7] но это использование сейчас редко. [8]

При сжатии данных цель состоит в том, чтобы найти более короткое представление для строки, так чтобы оно требовало меньше битов памяти, но оно должно быть «сжато» перед сохранением, а затем (обычно) «распаковано» перед использованием в вычислениях. Область алгоритмической теории информации посвящена изучению «неприводимого информационного содержания» строки (т. е. ее кратчайшей возможной длины представления в битах), при условии, что получатель имеет минимальные априорные знания о методе, используемом для сжатия строки.

Символом двоичной цифры является либо «бит», согласно стандарту IEC 80000-13 :2008, либо строчная буква «b», согласно стандарту IEEE 1541-2002 . Использование последнего может создать путаницу с заглавной буквой «B», которая является международным стандартным символом для байта.

История

Ральф Хартли предложил использовать логарифмическую меру информации в 1928 году. [9] Клод Э. Шеннон впервые использовал слово «бит» в своей основополагающей статье 1948 года « Математическая теория связи ». [10] [11] [12] Он приписал его происхождение Джону У. Тьюки , который написал служебную записку Bell Labs 9 января 1947 года, в которой он сократил «двоичную информационную цифру» до просто «бит». [10]

Физическое представление

Бит может храниться цифровым устройством или другой физической системой, которая существует в одном из двух возможных различных состояний . Это могут быть два устойчивых состояния триггера , два положения электрического переключателя , два различных уровня напряжения или тока, допускаемых схемой , два различных уровня интенсивности света , два направления намагничивания или поляризации , ориентация обратимой двухцепочечной ДНК и т. д.

Возможно, самым ранним примером двоичного запоминающего устройства была перфокарта, изобретенная Базилем Бушоном и Жаном-Батистом Фальконом (1732), разработанная Жозефом Мари Жаккаром (1804), а позже принятая Семеном Корсаковым , Чарльзом Бэббиджем , Германом Холлеритом и ранними производителями компьютеров, такими как IBM . Вариантом этой идеи была перфорированная бумажная лента . Во всех этих системах носитель (карта или лента) концептуально нес массив позиций отверстий; каждая позиция могла быть либо пробита, либо нет, таким образом перенося один бит информации. Кодирование текста битами также использовалось в азбуке Морзе (1844) и ранних цифровых коммуникационных машинах, таких как телетайпы и биржевые тикеры (1870).

Первые электрические устройства для дискретной логики (такие как схемы управления лифтами и светофорами , телефонные коммутаторы и компьютер Конрада Цузе) представляли биты как состояния электрических реле , которые могли быть либо «открытыми», либо «закрытыми». Когда реле были заменены электронными трубками , начиная с 1940-х годов, разработчики компьютеров экспериментировали с различными методами хранения, такими как импульсы давления, перемещающиеся по ртутной линии задержки , заряды, хранящиеся на внутренней поверхности электронно-лучевой трубки , или непрозрачные пятна, напечатанные на стеклянных дисках с помощью фотолитографических методов.

В 1950-х и 1960-х годах эти методы были в значительной степени вытеснены магнитными запоминающими устройствами, такими как память на магнитных сердечниках , магнитные ленты , барабаны и диски , где бит был представлен полярностью намагничивания определенной области ферромагнитной пленки или изменением полярности с одного направления на другое. Тот же принцип был позже использован в памяти на магнитном пузыре, разработанной в 1980-х годах, и до сих пор встречается в различных предметах с магнитной полосой , таких как билеты метро и некоторые кредитные карты .

В современной полупроводниковой памяти , такой как динамическая память с произвольным доступом или твердотельный накопитель , два значения бита представлены двумя уровнями электрического заряда, хранящегося в конденсаторе или плавающем затворе MOSFET . В некоторых типах программируемых логических матриц и постоянной памяти бит может быть представлен наличием или отсутствием проводящего пути в определенной точке цепи. В оптических дисках бит кодируется как наличие или отсутствие микроскопической ямки на отражающей поверхности. В одномерных штрихкодах и двумерных QR-кодах биты кодируются как линии или квадраты, которые могут быть как черными, так и белыми.

В современных цифровых вычислениях биты преобразуются в булевых логических вентилях .

Передача и обработка

При последовательной передаче биты передаются по одному . При параллельной передаче , напротив, несколько бит передаются одновременно . Последовательный компьютер обрабатывает информацию либо в последовательном, либо в последовательном режиме. С точки зрения передачи данных последовательная передача байтов представляет собой 8-канальную параллельную передачу с двоичной сигнализацией.

В таких языках программирования, как C , побитовая операция выполняется над двоичными строками так, как будто они являются векторами битов, а не интерпретирует их как двоичные числа .

Скорость передачи данных обычно измеряется в десятичных кратных СИ. Например, пропускная способность канала может быть указана как 8 кбит/с = 8 кбит/с = 1 кБ/с.

Хранилище

Размеры файлов часто измеряются в (двоичных) кратных байтам IEC, например, 1 KiB = 1024 байта = 8192 бита. Путаница может возникнуть в случаях, когда (по историческим причинам) размеры файлов указываются с помощью двоичных множителей, использующих неоднозначные префиксы K, M и G, а не стандартные префиксы IEC Ki, Mi и Gi. [13]

Устройства хранения данных обычно измеряются в десятичных единицах СИ, например, 1 ТБ = байт. 10 12 {\displaystyle 10^{12}}

Сбивает с толку тот факт, что емкость памяти с прямой адресацией, например, чипа DRAM или сборки таких чипов в модуле памяти, указывается как двоичное кратное — с использованием неоднозначного префикса G вместо рекомендуемого IEC префикса Gi. Например, чип DRAM, который указан (и рекламируется) как имеющий емкость «1 ГБ», имеет емкость в байтах. По состоянию на 2022 год разница между популярным пониманием системы памяти с емкостью «8 ГБ» и правильным в системе СИ значением «8 ГБ» все еще вызывала трудности у разработчиков программного обеспечения. [14] 2 30 {\displaystyle 2^{30}}

Единица и символ

Бит не определен в Международной системе единиц (СИ). Однако Международная электротехническая комиссия выпустила стандарт IEC 60027 , в котором указано, что символом для двоичной цифры должен быть «бит», и он должен использоваться во всех кратных, например, «кбит» для килобита. [15] Однако строчная буква «b» также широко используется и была рекомендована стандартом IEEE 1541 (2002) . Напротив, заглавная буква «B» является стандартным и общепринятым символом для байта.

Несколько бит

Десятичная дробь
ЦенитьМетрическая
1000кбиткилобит
1000 2Мбитмегабит
1000 3Гбитгигабит
1000 4Тбиттерабит
1000 5Пбитпетабит
1000 6Эбитэксабит
1000 7Збитзеттабит
1000 8Ybitйоттабит
1000 9Рбитроннабит
1000 10Кубиткеттабит
Двоичный
ЦенитьМЭКПамять
1024КибиткибибитКбитКБкилобит
1024 2МибитмебибитМбитМбмегабит
1024 3ГибитгибибитГбитГбгигабит
1024 4Тибиттебибит
1024 5Пибитпебибит
1024 6Эйбитэкспонат
1024 7Зибитзебибит
1024 8Йибитйобибит
Порядки величин данных

Несколько битов могут быть выражены и представлены несколькими способами. Для удобства представления часто встречающихся групп битов в информационных технологиях традиционно использовались несколько единиц информации . Наиболее распространенной является единица байт , введенная Вернером Бухгольцем в июне 1956 года, которая исторически использовалась для представления группы битов, используемых для кодирования одного символа текста (пока не появилась многобайтовая кодировка UTF-8 ) в компьютере [2] [16] [17] [18] [19] и по этой причине она использовалась в качестве основного адресуемого элемента во многих компьютерных архитектурах . К 1993 году тенденция в проектировании оборудования сошлась на 8-битном байте . [20] Однако из-за неоднозначности опоры на базовую конструкцию оборудования единица октет была определена для явного обозначения последовательности из восьми бит.

Компьютеры обычно оперируют битами в группах фиксированного размера, условно называемых « словами ». Как и байт, количество бит в слове также зависит от конструкции оборудования и обычно составляет от 8 до 80 бит, а в некоторых специализированных компьютерах и того больше. В начале 21-го века розничные персональные или серверные компьютеры имеют размер слова 32 или 64 бита.

Международная система единиц определяет ряд десятичных префиксов для кратных стандартизированных единиц, которые обычно используются также с битом и байтом. Префиксы от кило (10 3 ) до йотты (10 24 ) увеличиваются на кратные одной тысяче, а соответствующие единицы — от килобита (кбит) до йоттабита (Ybit).

Смотрите также

Ссылки

  1. ^ Mackenzie, Charles E. (1980). Coded Character Sets, History and Development (PDF) . The Systems Programming Series (1-е изд.). Addison-Wesley Publishing Company, Inc. стр. x. ISBN 978-0-201-14460-4. LCCN  77-90165. Архивировано (PDF) из оригинала 26 мая 2016 г. Получено 25 августа 2019 г.
  2. ^ ab Bemer, Robert William (2000-08-08). "Почему байт 8 бит? Или это так?". Computer History Vignettes . Архивировано из оригинала 2017-04-03 . Получено 2017-04-03 . […] На основе компьютера STRETCH от IBM , обрабатывающего 64-символьные слова, делимые на группы по 8 (я разработал набор символов для него под руководством доктора Вернера Бухгольца , человека, который ВВЕДЁЛ термин " байт " для 8-битной группировки). […] IBM 360 использовал 8-битные символы, хотя и не ASCII напрямую. Таким образом, "байт" Бухгольца прижился везде. Мне самому это название не нравилось по многим причинам. […]
  3. ^ Андерсон, Джон Б.; Джоннессон, Рольф (2006), Понимание передачи информации
  4. ^ Хейкин, Саймон (2006), Цифровые коммуникации
  5. ^ Стандарт IEEE 260.1-2004
  6. ^ "Units: B". Архивировано из оригинала 2016-05-04.
  7. ^ Брейполь, Артур М. (1963-08-18). Адаптивные системы связи. Университет Нью-Мексико. стр. 7. Получено 2025-01-07 .
  8. ^ "binit". Бесплатный словарь . Получено 2025-01-07 .
  9. ^ Абрамсон, Норман (1963). Теория информации и кодирование . McGraw-Hill .
  10. ^ ab Shannon, Claude Elwood (июль 1948 г.). "Математическая теория связи" (PDF) . Bell System Technical Journal . 27 (3): 379– 423. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Архивировано из оригинала (PDF) 15.07.1998 г. – через Bell Labs Computing and Mathematical Sciences Research. Выбор логарифмического основания соответствует выбору единицы измерения информации. Если используется основание 2, то полученные единицы можно назвать двоичными цифрами или, короче, битами , слово, предложенное Дж. У. Тьюки .
  11. ^ Шеннон, Клод Элвуд (октябрь 1948 г.). «Математическая теория связи». Bell System Technical Journal . 27 (4): 623– 666. doi :10.1002/j.1538-7305.1948.tb00917.x. hdl : 11858/00-001M-0000-002C-4314-2 .
  12. ^ Шеннон, Клод Элвуд ; Уивер, Уоррен (1949). Математическая теория связи (PDF) . Издательство Иллинойсского университета . ISBN 0-252-72548-4. Архивировано из оригинала (PDF) 15 июля 1998 г. – через Bell Labs Computing and Mathematical Sciences Research.
  13. ^ "UnitsPolicy - Ubuntu Wiki" . Получено 2025-01-07 .
  14. ^ "Используйте суффикс МБ/ГБ/ТБ для ввода памяти виртуальной машины". Сообщество Github Netbox . 2022 . Получено 2025-01-08 .
  15. ^ Национальный институт стандартов и технологий (2008), Руководство по использованию Международной системы единиц . Онлайн-версия. Архивировано 3 июня 2016 года на Wayback Machine
  16. ^ Бухгольц, Вернер (1956-06-11). "7. Матрица сдвига" (PDF) . Система связей . IBM . стр.  5– 6. Stretch Memo № 39G. Архивировано (PDF) из оригинала 2017-04-04 . Получено 2016-04-04 . […] Наиболее важным с точки зрения редактирования будет возможность обрабатывать любые символы или цифры длиной от 1 до 6 бит […] Матрица сдвига будет использоваться для преобразования 60-битного слова , поступающего из памяти параллельно, в символы или " байты ", как мы их назвали, для последовательной отправки в сумматор . 60 бит сбрасываются в магнитные сердечники на шести разных уровнях. Таким образом, если 1 выходит из позиции 9, она появляется во всех шести сердечниках ниже. […] Сумматор может принимать все или только некоторые биты. […] Предположим, что требуется работать с 4-битными десятичными цифрами , начиная справа. Сначала импульсируется 0-диагональ, отправляя шесть бит от 0 до 5, из которых сумматор принимает только первые четыре (0-3). Биты 4 и 5 игнорируются. Затем импульсируется 4-диагональ. Это отправляет биты от 4 до 9, из которых последние два снова игнорируются, и так далее. […] Так же просто использовать все шесть бит в алфавитно-цифровой работе или обрабатывать байты только одного бита для логического анализа или смещать байты на любое количество бит. […]
  17. ^ Бухгольц, Вернер (февраль 1977 г.). «Слово «байт» достигает зрелости...» Журнал Byte . 2 (2): 144. […] Первая ссылка, найденная в файлах, содержалась во внутренней записке, написанной в июне 1956 г. в первые дни разработки Stretch . Байт описывался как состоящий из любого количества параллельных битов от одного до шести. Таким образом, предполагалось, что байт имеет длину, соответствующую случаю. Его первое использование было в контексте оборудования ввода-вывода 1950-х годов, которое обрабатывало шесть бит за раз. Возможность перехода на 8-битные байты была рассмотрена в августе 1956 г. и вскоре после этого включена в конструкцию Stretch. Первое опубликованное упоминание этого термина произошло в 1959 году в статье «Обработка данных по битам и кускам» G A Blaauw , F P Brooks Jr и W Buchholz в IRE Transactions on Electronic Computers , июнь 1959 г., стр. 121. Понятия этой статьи были подробно изложены в главе 4 Planning a Computer System (Project Stretch) , под редакцией W Buchholz, McGraw-Hill Book Company (1962). Обоснование введения термина было объяснено там на стр. 40 следующим образом: Байт обозначает группу битов, используемых для кодирования символа, или количество битов, передаваемых параллельно на устройства ввода-вывода и из них. Здесь используется термин, отличный от символа , поскольку данный символ может быть представлен в разных приложениях более чем одним кодом, а разные коды могут использовать разное количество битов (т. е. разные размеры байтов). При передаче ввода-вывода группировка битов может быть совершенно произвольной и не иметь никакого отношения к фактическим символам. (Термин образован от bite , но изменен, чтобы избежать случайной мутации в bit .) System/360 переняла многие концепции Stretch, включая основные размеры байтов и слов, которые являются степенями числа 2. Однако в целях экономии размер байтов был зафиксирован на уровне максимум 8 бит, а адресация на уровне битов была заменена адресацией байтов. […]

  18. ^ Blaauw, Gerrit Anne ; Brooks, Jr., Frederick Phillips ; Buchholz, Werner (1962), "Глава 4: Естественные единицы данных" (PDF) , в Buchholz, Werner (ред.), Planning a Computer System – Project Stretch , McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA., стр.  39–40 , LCCN  61-10466, архивировано из оригинала (PDF) 2017-04-03 , извлечено 2017-04-03
  19. ^ Бемер, Роберт Уильям (1959). «Предложение об обобщенном карточном коде из 256 символов». Сообщения ACM . 2 (9): 19– 23. doi : 10.1145/368424.368435 . S2CID  36115735.
  20. ^ "ISO/IEC 2382-1:1993(ru) Информационные технологии — Словарь — Часть 1: Основные термины". стр. 01.02.09 . Получено 2025-01-08 .
  • Калькулятор битов – инструмент, обеспечивающий преобразование между битами, байтами, килобитами, килобайтами, мегабитами, мегабайтами, гигабитами, гигабайтами.
  • BitXByteConverter Архивировано 06.04.2016 в Wayback Machine – инструмент для вычисления размеров файлов, емкости хранилища и цифровой информации в различных единицах измерения
Retrieved from "https://en.wikipedia.org/w/index.php?title=Bit&oldid=1268110880#Multiple_bits"