Понятие кодирования
Кодирование информации — одна из базовых тем курса теоретических основ информатики, отражающая фундаментальную необходимость представления информации в какой-либо форме, — т.е. кодировании информации. При этом слово «кодирование» понимается не в узком смысле — кодирование как способ сделать сообщение непонятным для всех, кто не владеет ключом кода, а в широком — как представление информации в виде сообщения на каком-либо языке.
Для представления информации в памяти ЭВМ (как числовой, так и не числовой) используется двоичный способ кодирования.
Элементарная ячейка памяти ЭВМ имеет длину 8 бит (байт). Каждый байт имеет свой номер (его называют адресом). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое, называют машинным словом. Длина машинного слова зависит от разрядности процессора и может быть равной 16, 32 битам и т.д.
Для кодирования символов достаточно одного байта. При этом можно представить 256 символов (с десятичными кодами от 0 до 255).
Этапы технологического процесса обработки информации
Слово технология происходит от греческого techne, что означает искусство, мастерство, умение, и греческого слова logos понятие, учение.
Весь технологический процесс можно подразделить на процессы сбора и ввода исходных данных в вычислительную систему, процессы размещения и хранения данных в памяти системы, процессы обработки данных с целью получения результатов и, процессы выдачи данных в виде, удобном для восприятия пользователем.
На практике существует множество вариантов (организационных форм) технологических процессов обработки данных. Это зависит от использования различных средств вычислительной и организационной техники на отдельных операциях технологического процесса. Построение технологического процесса зависит от характера решаемых задач, круга пользователей, от используемых технических средств, от систем контроля данных и т.д.
Технологический процесс обработки информации с использованием ЭВМ включает в себя следующие операции:
• прием и комплектовка первичных документов (проверка полноты и качества их заполнения, комплектовка и т.д.);
• подготовка первичных документов и контроль;
• ввод данных в ЭВМ;
• контроль, результаты которого выдаются на ПУ, терминал.
Различают визуальный и программный контроль, позволяющий отслеживать информацию на полноту ввода, нарушение структуры исходных данных, ошибки кодирования.
• запись входной информации в исходные массивы;
• сортировка (если в этом есть необходимость);
• обработка данных;
• контроль и выдача результатной информации.
Технология проектирования автоматизированной обработки экономической информации при решении любой экономической задачи подразделяется на 4 этапа:
• начальный;
• подготовительный;
• основной;
• заключительный.
Упорядочение — произвольно расположенные данные размещаются в определенной последовательности значений ключевых слов.
Корректировка — процесс внесения изменений в уже сформированные файлы данных, позволяющий поддержать их в актуальном для обработки состоянии.
Накопление — процесс периодического добавления данных в существующие файлы с целью формирования исходных данных за определенный интервал времени.
Обработка — выполнение всех арифметических и логических операций по преобразованию исходной информации в результатную.
Существуют различные формы внутримашинной технологии обработки информации. Наиболее распространенными формами являются обработка данных в пакетном и диалоговом режимах.
5. передача информации…
2.1 Информация, сообщения, сигналы
Информация – это сведения, являющиеся объектом передачи, распределения, преобразования, хранения или непосредственного использования. Сообщение является формой представления информации.
Количество информации в отдельно взятом сообщении определяется величиной, обратной вероятности появления сообщения, вычисленной в логарифмических единицах:
где р(а) – вероятность сообщения а,
k – основание логарифма.
При р(а)=1 количество информации равно нулю, то есть сообщение об известном событии никакой информации не несет. Основание логарифма чаще всего принимают равным двум (k=2), и тогда количество информации, содержащейся в сообщении, выражается в двоичных единицах:
Двоичную единицу обычно называют битом – от binarydigit (двоичная цифра).
Совокупность всех возможных сообщений и вероятностей их появления образует ансамбль сообщений. Если ансамбль состоит всего из двух сообщений а1 и а2 (например, вида да и нет или 0 и 1), которые являются независимыми и равновероятными, то есть р(а1)= р(а2) = 1/2, то каждое из сообщений несет одну двоичную единицу (один бит) информации:
Рисунок 2.1 – Принцип передачи сообщений
е сигналы могут быть подразделены на периодические, значения которых повторяются через определённые промежутки времени, и непериодические. Простейшим периодическим сигналом является гармоническое колебание [1].
S(t)=A•Sin(?•t), (2.4)
где A, ? – амплитуда и угловая частота колебания.
Любой периодический сигнал состоит из гармоник. Значение амплитуд (Аk),частот (?k) и начальных фаз (?k) которых можно найти, посредством разложения в ряд Фурье:
Формула (2.5)
Если изобразить амплитуду Аk и фазу ?k каждой гармоники на рисунке, то получим спектральные диаграммы. Распределение амплитуд Аk гармоник по частоте называется спектром амплитуд сигнала, а распределение фаз ?k – спектром фаз.
1,2 Информатика (от французского information — информация и automatioque -автоматика) — область научно-технической деятельности, занимающаяся исследованием процессов получения, передачи, обработки, хранения, представления информации, решением проблем создания, внедрения и использования информационной техники и технологии во всех сферах общественной жизни; одно из главных направлений научно-технического прогресса.
В некоторых более кратких определениях информатика трактуется как особая наука о законах и методах получения и измерения, накопления и хранения, переработки и передачи информации с применением математических и технических средств. Однако все имеющиеся определения отражают наличие двух главных составляющих информатики — информации и соответствующих средств ее обработки. Бытует и такое, самое краткое определение: информатика — это информация плюс автоматика.
Понятие информации, её виды и свойства.
Информация в переводе с латинского языка означает: разъяснение, изложение чего-либо или сведения о чём-либо.
Виды информации:
— текстовая;
— числовая;
— графическая;
— звуковая;
— световая;
— электромагнитная (информация электромагнитных волн).
Свойства информации.
Информация выступает как свойство объектов и явлений (процессов) порождать многообразие состояний, которые посредством отражения передаются от одного объекта к другому и запечатляются в его структуре (возможно, в измененном виде).
Целевая функция информации характеризуется способностью влиять на процессы управления, на соответствующее целям управления поведением людей. В этом, по существу, и состоит полезность или ценность информации.
Информация охватывает все сферы, все отрасли общественной жизни, прочно входит в жизнь каждого человека, воздействует на его образ мышления и поведение. Она обслуживает общение людей, социальных групп, классов, наций и государств, помогает людям овладеть научным мировоззрением, разбираться в многообразных явлениях и процессах общественной жизни, повышать уровень своей культуры и образованности, усваивать и соблюдать законы и нравственные принципы. Огромную, ничем незаменимую роль выполнят информация в управленческой деятельности. По существу, без информации не может быть и речи о любом виде управления, о целенаправленной деятельности взаимосвязанных объектов и систем.
Меры информации: синтаксическая, семантическая, прагматическая.
Синтаксическая (техническая) — это точность, надежность, скорость передачи сигналов и т.д.; Семантическая — это передача смысла текста с помощью кодов;
Прагматическая — это насколько эффективно информация влияет на поведение объекта.
Основные показатели качества информации
Анализируя информацию, мы сталкиваемся с необходимостью оценки качества и определения количества получения информации. Определить качество . информации чрезвычайно сложно, а часто и вообще невозможно. Какие-либо сведения, например исторические, могут десятилетиями считаться ненужными и вдруг их ценность может резко возрасти. Вместе с этим определить количество информации не только нужно, но и можно. Это прежде всего необходимо для того, чтобы сравнить друг с другом массивы информации, определить, какие размеры должны иметь материальные объекты (бумага, магнитная лента и т.д.), хранящие эту информацию.
Способы кодирования информации. Кодирование команд, чисел, знаков в компьютере. Таблица ASCII.
Способы кодирования информации: символьный, лингвистический, табличный, графический. Любой способ кодирования характеризуется наличием основы (алфавит, тезаурус, спектр цветности , система координат, основание системы счисления и т.п.) и правил конструирования информационных образов на этой основе.
В вычислительной технике используется два состояния — включено и выключено (0 и 1). Поэтому кодирование команд, чисел, знаков в компьютере осуществляется с помощью двоичной системы счисления.
Для кодирования информации в компьютере применяется таблица символов ASCII, которая кодирует русские, латинские буквы, цифры, математические знаки и другие специальные знаки всего 256 символов. Поэтому для кодировки всех указанных символов используется восьмиразрядная последовательность цифр 0 и 1. Например, русские буквы представляются восьмиразрядными последовательностями следующим образом: А — 11000001, И — 11001011, Я — 11011101.
7.Позиционные системы счисления. Двоичная система счисления. Перевод целого числа из десятичной системы в двоичную и наоборот.
Позиционная система счисления — способ записи чисел цифровыми знаками, где значение каждой входящей в число цифры зависит от её положения (позиции).
Двоичная система счисления — способ записи чисел с помощью цифр 1 и 0, которые являются коэффициентами при степени два. Её обозначение — B. Например, запись B11001 — говорит о том, что число представлено в двоичной системе счисления.
Для перевода целого числа из десятичной в двоичную систему счисления необходимо это число делить на двойку. Если поделилось без остатка, то пишем ноль; если с остатком 1, то пишем единичку. Это будет последняя цифра в записи числа. Например:
25-24=1 (остаток 1)
25/2=12
12-12=0 (остаток 0)
12/2=6
6-6=0 (остаток 0)
6/2=3
3-2=1 (остаток 1)
3/2=1 (остаток от деления числа 25 на 2) — это и будет первая цифра в записи числа 25 в двоичной системе.
Для перевода целого числа из двоичной системы в десятичную необходимо цифры умножать на двойку в степени номера позиции (номер позиции начинается с нуля и нумеруется с права на лево).
Пример для перевода в десятичную систему:
11001=1*20+0*21+0*22+1*23+1*24=1+0+0+8+16=25
43210 — номера позиции цифр в числе — они являются степенями двойки.
Устройства ввода информации: клавиатура, сканер.
Носителями информации являются жесткий диск (по другому — винчестер), дискета, компакт диск (CD-ROM). Лист бумаги тоже является носителем информации. И вообще, любой объект в нашем мире несет какую-либо информацию о себе и окружающих нас предметах, т.е. является носителем информации.
Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления — для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки — это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). Своя система существует и в вычислительной технике — она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски — binarydigit или сокращенно bit (бит). Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:
00 01 0 11
Тремя битами можно закодировать восемь различных значений:
000 001 010 011 100 101 110 111
Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:
N=2m,
где N— количество независимых кодируемых значений;
т — разрядность двоичного кодирования, принятая в данной системе.
4.Представление и обработка данных.
Для того, чтобы использовать ЭВМ для обработки данных, необходимо располагать некоторым способом представления данных. Способ представления данных будет зависеть от того, для кого эти данные предназначены: для человека (внешнее представление) или для ЭВМ (внутреннее представление).
Во внутреннем представлении данные могут быть описаны в аналоговой (непрерывной) или цифровой (дискретной) формах. В соответствии с этим различают аналоговые (в прошлом) и цифровые (сейчас) ЭВМ.
Любые виды данных, обрабатываемых на ЭВМ, могут быть сведены к совокупности простейших форм: набор символов (текст), звук (мелодия), изображение (фотографии, рисунки, схемы), вещественные и целые числа (числовая информация).
Каждый такой вид данных должен быть некоторым универсальным образом представлен в виде набора целых чисел, т.к. ЭВМ цифровые! Правила такого представления разрабатываются научными институтами и оформляются в виде стандартов.
Во внешнем представлении все данные хранятся в виде файлов. Во многих случаях требуется ещё более высокий уровень организации данных на внешнем уровне, тогда данные группируются в базы данных.