Информатика
Тема 1: Базовые понятия информатикиУрок 5: Системы счисления. Кодировки символов
- Видео
- Тренажер
- Теория
Компьютер не понимает текст и цифры так, как их понимает человек. Мы этого не замечаем, благодаря современному программному обеспечению, но на самом низком уровне (он называется цифровой-логический) компьютер оперирует двоичным электрическим сигналом, у которого есть только 2 состояния: наличие тока и отсутствие тока. Чтобы понять введенные пользователем данные, компьютер должен закодировать их в двоичном формате.
Все данные хранятся в памяти компьютера в виде нулей и единиц. Система, использующая для счисления только 0 и 1, называется двоичной системой счисления. Вам хорошо известна десятичная система счисления — именно ею мы пользуемся в нашей повседневной жизни.
Когда пользователь вводит данные, компьютер кодирует их в двоичной системе, чтобы хранить в памяти. Когда пользователь запрашивает вывод информации, компьютер снова кодирует данные из двоичной системы в вид понятный пользователю, например, в числа в десятичной системе.
Символы компьютер преобразовывает в числа с помощью таблиц символов — набора числовых значений, которые ставятся в соответствие группе алфавитно-цифровых символов, знаков пунктуации и специальных символов.
Сначала таблицы символов были уникальные для каждой модели компьютера. С распространением компьютеров понадобился единый стандарт кодирования информации. ASCII (Американский стандарт кодов для обмена информацией) — первый единый стандарт кодировки символов. Введение ASCII решило проблему кодировки в англоговорящих странах, но с кириллицей и другими письменностями проблема осталась.
В 1991 году появилась первая версия одной общей таблицы символов, названная Юникод. Она включала в себя на тот момент 7161 различный символ из 24 письменностей мира.
Юникод (Unicode) — стандарт кодировки символов, включающий в себя знаки почти всех письменных языков мира.
UTF-8, UTF-16 и т.д. — это варианты кодировок, все они основаны на Юникоде и отличаются тем, что по-разному хранят информацию. Эти варианты понадобились, чтобы экономить память компьютера.
Использование компьютером двоичной системы счисления несет некоторые ограничения в точности. Дробные (вещественные) числа имеют ограниченную точность представления — обычно 15-20 знаков после запятой. Поскольку в памяти компьютера все числа могут быть только рациональными, то приходится полученное число округлять до заданной точности (необходимое число разрядов в ячейках памяти компьютера), что привносит ошибку. Таким образом, не все дробные числа, вводимые в десятичной системе счисления, представляются абсолютно точно в памяти компьютера.
Дополнительные материалы:
§1.1 Системы счисления (Информатика: учебник для 8 класса / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2013)
§1.2 Представление чисел в компьютере (Информатика: учебник для 8 класса / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2013)
Глава 3. Представлении информации в компьютере. (Информатика. 10 класс. Базовый уровень / Л.Л. Босова, А.Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2017)
Глава 1. Информация (Информатика. Базовый уровень: учебник для 10 класса / И.Г. Семакин, Е.К. Хеннер, Т.Ю. Шеина. — М.: БИНОМ. Лаборатория знаний, 2015)
Глава 2. Информационные процессы (Информатика. Базовый уровень: учебник для 10 класса / И.Г. Семакин, Е.К. Хеннер, Т.Ю. Шеина. — М.: БИНОМ. Лаборатория знаний, 2015)
Лекция Гарварда из базового курса по программированию о двоичной системе счисления и ASCII