Единицы количества информации

Материал из свободной русской энциклопедии «Традиция»
Перейти к: навигация, поиск

Единицы количества информации служат для измерения объёма информации — величины, исчисляемой логарифмически.[1] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Чаще всего измерение информации касается объёма компьютерной памяти и объёма данных, передаваемых по цифровым каналам связи.

Первичные единицы[править]

Сравнение разных единиц измерения информации. Дискретные величины представлены прямоугольниками, единица «нат» — горизонтальным уровнем. Риски слева — логарифмы натуральных чисел.

Объёмы информации можно представлять как логарифм[2] количества состояний.

Наименьшее целое число, логарифм которого положителен — 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Единица, соответствующая числу 3 (трит) равна \(\ \log_{2} 3 \approx 1.585\) бита, числу 10 (хартли) — \(\ \log_{2} 10 \approx 3.322\) бита.

Такая единица как нат (nat, е-бит), соответствующая натуральному логарифму применяется в вычислительной технике в инженерных и научных расчётах. Основание натуральных логарифмов не является целым числом.[3]

Единицы, производные от бита[править]

Целые количества бит отвечают количеству состояний, равному степеням двойки.

Особое название имеет 4 бита — ниббл (полубайт, тетрада, четыре двоичных разряда), которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт[править]

Измерения в байтах
ГОСТ 8.417-2002 Приставки СИ приставки МЭК
Название Символ Степень Название Степень Название Символ Степень
байт Б 20 - 100 байт B Б 20
килобайт 210 кило- 103 кибибайт KiB КиБ 210
мегабайт МБ 220 мега- 106 мебибайт MiB МиБ 220
гигабайт ГБ 230 гига- 109 гибибайт GiB ГиБ 230
терабайт ТБ 240 тера- 1012 тебибайт TiB ТиБ 240
петабайт ПБ 250 пета- 1015 пебибайт PiB ПиБ 250
эксабайт ЭБ 260 экса- 1018 эксбибайт EiB ЭиБ 260
зеттабайт ЗБ 270 зетта- 1021 зебибайт ZiB ЗиБ 270
йоттабайт ЙБ 280 йотта- 1024 йобибайт YiB ЙиБ 280
Icons-mini-icon 2main.png Основная статья: Октет (информатика)

Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Килобайт[править]

Icons-mini-icon 2main.png Основная статья: Килобайт

Для измерения больших количеств байтов служат единицы «килобайт» = 1000 байт и «Кбайт»[4] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:

  • Сектор диска обычно равен 512 байтам то есть половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.
  • Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
  • «Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт[править]

Icons-mini-icon 2main.png Основная статья: Мегабайт

Единицы «мегабайт» = 1000 килобайт = 1000000 байт и «Мбайт»[4] (мебибайт, mebibyte) = 1024 Кбайт = 1048576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт[править]

Icons-mini-icon 2main.png Основная статья: Гигабайт

Единицы «гигабайт» = 1000 мегабайт = 1000000000 байт и «Гбайт»[4] (гибибайт, gibibyte) = 1024 Мбайт = \(2^{30}\) байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 гигабайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт—тебибайт (\(10^{12}\) и \(2^{40}\) соответственно), петабайт—пебибайт (\(10^{15}\) и \(2^{50}\) соответственно) и т. д.

Терминологические тонкости[править]

Что такое «байт»?[править]

Icons-mini-icon 2main.png Основная статья: Байт

В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти, который на старых машинах не обязательно был или равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер). В современной традиции, байт часто считают равным восьми битам.

В таких обозначениях как Кбайт (русское) или KB (английское) под байт (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.

Во французском языке используются обозначения o, Ko, Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.

Чему равно «кило»?[править]

Icons-mini-icon 2main.png Основная статья: Двоичные приставки

Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:

  • двоичными кратными единицами, обозначаемыми согласно ГОСТу как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
  • единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях кратных трём).

Последние по определению равны соответственно \(10^3,\ 10^6,\ 10^9\) байт.

В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.

В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц. В английском языке для «киби»=1024 иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опираются на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».

См. также[править]

Ссылки[править]

  1. С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных же углов, пользуются различными практически удобными единицами.
  2. «логарифм» на answers.com(англ.) Не важно, какой именно логарифм выбрать, поскольку численные величины логарифмов по разным основаниям пропорциональны. Таким образом, вопрос выбора единицы измерения информации фактически равнозначен выбору основания для логарифма количества состояний. Следует также заметить, что информация случайной величины точно равна логарифму количества состояний лишь при равномерном распределении. Во всех прочих случаях количество информации будет меньше.
  3. http://books.ifmo.ru/book/pdf/35.pdf
  4. а б в ГОСТ 8.417-2002 «Единицы величин»