Информатика

Тема 1: Базовые понятия информатики

Урок 5: Системы счисления. Кодировки символов

  • Видео
  • Тренажер
  • Теория
Заметили ошибку?

Компьютер не понимает текст и цифры так, как их понимает человек. Мы этого не замечаем, благодаря современному программному обеспечению, но на самом низком уровне (он называется цифровой-логический) компьютер оперирует двоичным электрическим сигналом, у которого есть только 2 состояния: наличие тока и отсутствие тока. Чтобы понять введенные пользователем данные, компьютер должен закодировать их в двоичном формате.

Все данные хранятся в памяти компьютера в виде нулей и единиц. Система, использующая для счисления только 0 и 1, называется двоичной системой счисления. Вам хорошо известна десятичная система счисления — именно ею мы пользуемся в нашей повседневной жизни.

Когда пользователь вводит данные, компьютер кодирует их в двоичной системе, чтобы хранить в памяти. Когда пользователь запрашивает вывод информации, компьютер снова кодирует данные из двоичной системы в вид понятный пользователю, например, в числа в десятичной системе. 

Символы компьютер преобразовывает в числа с помощью таблиц символов — набора числовых значений, которые ставятся в соответствие группе алфавитно-цифровых символов, знаков пунктуации и специальных символов.

Сначала таблицы символов были уникальные для каждой модели компьютера. С распространением компьютеров понадобился единый стандарт кодирования информации. ASCII (Американский стандарт кодов для обмена информацией) — первый единый стандарт кодировки символов. Введение ASCII решило проблему кодировки в англоговорящих странах, но с кириллицей и другими письменностями проблема осталась.

В 1991 году появилась первая версия одной общей таблицы символов, названная Юникод. Она включала в себя на тот момент 7161 различный символ из 24 письменностей мира.

Юникод (Unicode) — стандарт кодировки символов, включающий в себя знаки почти всех письменных языков мира.

UTF-8, UTF-16 и т.д. — это варианты кодировок, все они основаны на Юникоде и отличаются тем, что по-разному хранят информацию. Эти варианты понадобились, чтобы экономить память компьютера. 

Использование компьютером двоичной системы счисления несет некоторые ограничения в точности. Дробные (вещественные) числа имеют ограниченную точность представления — обычно 15-20 знаков после запятой. Поскольку в памяти компьютера все числа могут быть только рациональными, то приходится полученное число округлять до заданной точности (необходимое число разрядов в ячейках памяти компьютера), что привносит ошибку. Таким образом, не все дробные числа, вводимые в десятичной системе счисления, представляются абсолютно точно в памяти компьютера.

Дополнительные материалы:

§1.1 Системы счисления (Информатика: учебник для 8 класса / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2013)

§1.2 Представление чисел в компьютере (Информатика: учебник для 8 класса / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2013)

Глава 3. Представлении информации в компьютере. (Информатика. 10 класс. Базовый уровень / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2017) 

Глава 1. Информация (Информатика. Базовый уровень: учебник для 10 класса / И.Г. Семакин, Е.К. Хеннер, Т.Ю. Шеина. — М.: БИНОМ. Лаборатория знаний, 2015)

Глава 2. Информационные процессы (Информатика. Базовый уровень: учебник для 10 класса / И.Г. Семакин, Е.К. Хеннер, Т.Ю. Шеина. — М.: БИНОМ. Лаборатория знаний, 2015) 

Лекция Гарварда из базового курса по программированию о двоичной системе счисления и ASCII