YourLib.net
Твоя библиотека
Главная arrow Информатика (Под общ. ред. А.Н. Данчула) arrow 1.1. Информация и данные
1.1. Информация и данные

1.1. Информация и данные

   Термин «информация» происходит от латинского слова informatio, означающего разъяснение, изложение, осведомление. Понятие «информация» является одним из основных понятий информатики. Общепризнана сложность проблемы определения этого понятия, которая в настоящее время все еще далека от своего решения. Если проанализировать определения информации, приводимые в различных толковых словарях, монографиях, учебниках и учебных пособиях по информатике, то можно прийти к выводу о весьма широком диапазоне подходов к определению содержания понятия «информация» и других связанных с ним основных понятий информатики. Такое разнообразие подходов объясняется многими причинами. Рассмотрим основные из них.
   1.  Термин «информация» используется не только в науке, но и в других сферах человеческой жизнедеятельности.
   Под информацией в быту понимают интересующие нас сведения об окружающем мире и протекающих в нем процессах, сообщения, осведомляющие о положении дел, о состоянии чего-либо, которые передаются, воспринимаются и интерпретируются человеком непосредственно или с помощью специальных средств. В журналистике под информацией понимают сведения, обладающие новизной. В юриспруденции информация как объект правоотношений должна быть конкретизирована, определенным образом организована, связана с возможными ситуациями и отношениями для осуществления по ее поводу действий, регулируемых нормами права. Поэтому в различных нормативных правовых актах понятие «информация» употребляется в различных видах. Федеральный закон «Об информации, информатизации и защите информации» определяет информацию как «сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления». В Федеральном законе «Об участии в международном информационном обмене» говорится, что «массовая информация — предназначенные для неограниченного круга лиц печатные, аудиосообщения, аудиовизуальные и иные сообщения и материалы». Наиболее общим является философское понимание информации как результата отражения различных сторон и элементов окружающего нас мира. Заметим, что слово «информация» широко распространилось относительно недавно. В Большой советской энциклопедии оно появилось лишь 50 лет назад, во втором издании, где ему отводилось всего несколько строк, в которых информация рассматривалась как особый вид газетного жанра, т. е. одно из понятий журналистики.
   2.  В различных науках, использующих понятие «информация», можно выделить три подхода к феномену информации.
   Атрибутивный подход полагает информацию всеобщим свойством материи, проявляющимся во взаимодействии; неотъемлемым, вечно существующим атрибутом всех систем объективной реальности, организующим началом в живой и неживой природе. Такой подход, близкий к философскому пониманию информации, нашел развитие в физике, системологии. Функциональный подход предполагает, что информация и информационные процессы возникают лишь на определенной стадии развития форм движения материи, тем самым этот подход отрицает существование информации в неживой природе. Согласно данному подходу, информация через информационные процессы реализует функцию управления (самоуправления) в биологических, социальных и социотехнических (человеко-машинных) системах. Информация рассматривается как основное отличие живого от неживого. Такой подход к информации характерен для биологии, кибернетики. Антропоцентристский подход ограничивает сферу применения понятия «информация» социальными и социотехническими системами. Информация определяется как содержание (смысл) сигнала или сообщения, полученного системой из внешнего мира. Информация как содержание воспринятого сигнала изучается в лингвистике, психологии, социологии. Информацию, понимаемую таким образом, часто называют семантической информацией.
   3.  Информатика является комплексным научным направлением, имеющим междисциплинарный характер.
   Попытки сформировать понятие, обобщающее понятия «информация», используемые в различных научных дисциплинах, наталкиваются на препятствие, состоящее втом, что в каждой из этих дисциплин они включены в различные системы понятий. Понятия этих систем при таком обобщении должны быть согласованы, непротиворечивы, а это осложняется использованием в разных системах понятий одних и тех же терминов в различных смыслах. К числу таких терминов могут быть отнесены «данные», «знания». Поскольку в каждом конкретном случае рассматривается не весь комплекс дисциплин, соотнесенных с информатикой, и, более того, не весь круг вопросов, входящих в рассматриваемые дисциплины, то в определении фиксируются лишь некоторые, наиболее важные в данном контексте аспекты информации. Вследствие этого определения информации, а также других тесно связанных с ним понятий, таких, как «данные», «знания», приводимые в разных монографиях, учебниках и учебных пособиях, не соответствуют, а иногда и противоречат друг другу.
   4.  С логической точки зрения любая теория должна содержать базовые неопределяемые понятия, содержание которых может быть лишь пояснено (интерпретировано) на примерах или выявлено путем их сопоставления с содержанием других понятий.
   Наиболее последовательно эта точка зрения проявляется при построении аксиоматических теорий, нашедших широкое распространение лишь в математике. В таких теориях вводятся базовые понятия, а основные соотношения между ними, поясняющие их содержание, формулируются в виде аксиом (постулатов). Например, в геометрии вводятся базовые понятия «точка», «прямая», «плоскость» и др., которые не выражаются через более простые понятия, а их свойства задаются набором аксиом. Ряд авторов предлагает считать понятие «информация» базовым, неопределяемым понятием информатики, содержание которого раскрывается путем указания ее свойств и соотношения с другими базовыми понятиями информатики, например сообщением.
   Мы будем рассматривать понятие «информация» как базовое, основное содержание которого поясняется определением, приведенным в Федеральном законе «Об информации, информатизации и защите информации»: информация — сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Это определение раскрывается ниже рассмотрением свойств информации и ее соотношения с другими базовыми понятиями.
   Учитывая, что информатика изучает общие свойства информации с целью рациональной организации информационных процессов с использованием средств вычислительной техники и связи в различных сферах человеческой деятельности, будем считать, что понятие информации связывает объект, являющийся первоисточником информации, и субъекта, заинтересованного в информации об этом объекте для достижения определенных целей своей деятельности. Для уточнения содержания понятия «информация» выделим некоторую общую схему, лежащую в основе различных вариантов его определения.
   Все физические объекты находятся в состоянии непрерывного движения и изменения, сопровождающегося обменом энергией и переходом ее из одной формы в другую. Все виды энергетического обмена сопровождаются появлением сигналов, несущих в себе сведения о некотором реальном объекте, явлении или процессе, который назовем информационным объектом. Сигналы могут воздействовать на другие физические объекты, вызывая определенные изменения их свойств. Эти измененные свойства объекта также содержат в себе сведения об отражаемом информационном объекте и представляют тем самым результат его отражения. Такие изменения можно наблюдать, а при необходимости измерять разными способами. При этом образуются новые сигналы, воздействующие уже на какой-то другой объект. После окончания воздействия сигнала на объект его измененные свойства могут либо зафиксироваться и сохраняться неизменными достаточно длительное время, либо вернуться к исходному или какому-то другому состоянию, т. е. не фиксироваться. Явление зафиксированного изменения свойств физического объекта (объекта-регистратора) под воздействием сигнала, несущего сведения об информационном объекте, называется регистрацией сигнала. Зарегистрированные сигналы называются данными (рис. 1.1).

Рис. 1.1. Регистрация сигнала 

Рис. 1.1. Регистрация сигнала

   Организацию наблюдения, измерения, фиксации сигналов осуществляет человек непосредственно или с помощью созданных им технических устройств. Очевидно, что делает он это с определенной целью: использовать зарегистрированные сведения об информационном объекте для решения стоящих перед ним или кем-то другим задач. Для того чтобы человек мог использовать данные в любое удобное для него время и там, где это необходимо, он должен уметь их распространять. Процессы распространения данных позволяют разделить получение и использование сведений об информационном объекте во времени, в пространстве, а также по исполнителям (рис. 1.2).
   Распространение данных во времени осуществляется путем их хранения на специальных материальных объектах-регистра- торах — носителях данных. Размещение данных на носителе с целью их хранения называется записью данных на носитель.

 Рис. 1.2. Регистрация сигналов, распространение и использование данных

Рис. 1.2. Регистрация сигналов, распространение и использование данных

   Самым распространенным носителем данных в настоящее время является, по-видимому, бумага. Данные на бумаге регистрируются путем изменения оптических характеристик ее поверхности, воспринимаемого глазом человека или считывающим оптоэлектронным устройством, входящим в состав сканера или факса. Данные, предназначенные для использования в компьютерах, могут храниться на специальных носителях, использующих для регистрации изменение магнитных (дискеты, винчестеры) или оптических (CD-ROM) свойств своей поверхности. Распространение данных в пространстве основано на их передаче в виде сигналов (сообщений) по каналу связи.
   Форма, в которой представлены данные, должна быть удобна для их передачи, хранения и использования. Сигналы, с помощью которых передаются сведения о некотором реальном объекте, явлении или процессе, представляют собой изменяющиеся во времени физические характеристики. Различают механические, электрические, оптические (световые), звуковые и другие сигналы. На логическом уровне сигналы и данные разделяют на непрерывные (аналоговые) и дискретные. Аналоговые сигналы представляет собой непрерывно изменяющиеся физические величины, они могут быть описаны с помощью непрерывных функций непрерывного аргумента. Человек в своей естественной жизни в основном воспринимает непрерывные сигналы (звук, свет). Речь человека — непрерывный звуковой сигнал, поэтому на незнакомом языке она воспринимается слитно. Аналоговые сигналы более удобны для передачи; они широко используются не только в природе, но и в технике: телефонной связи, телевидении, радиовещании.
   Сигнал называется дискретным, если представляющая его физическая величина может принимать лишь конечное число значений. Поскольку каждому возможному значению дискретного сигнала можно сопоставить некоторое число, то такие сигналы часто называют цифровыми. Цифровые сигналы проще хранить и легче обрабатывать. Большинство технических устройств работает либо с аналоговыми, либо с дискретными сигналами. Поэтому часто возникает необходимость их преобразования из одного вида в другой. В последнее время все более широкое распространение находят бытовые и профессиональные устройства (музыкальная аппаратура, фотоаппараты, видеокамеры, телевизоры и др.), в которых звук и изображение хранятся в цифровой форме, допускающей их обра-ботку и воспроизведение. Поскольку звук и речь являются аналоговыми сигналами, возникает необходимость их преобразования в дискретный цифровой вид. Процесс такого преобразования называется дискретизацией. С другой стороны, для обеспечения передачи по телефонной линии цифровых данных из ЭВМ нужно их преобразовать в аналоговые сигналы, которые могут быть переданы по этой линии связи. Процесс такого преобразования называется модуляцией. Процесс восстановления цифровых данных из модулированного сигнала называется демодуляцией.
   Информационные объекты не обязательно являются физическими. Они могут относиться и к социальной сфере. В этом случае введенные понятия сигнала, объекта-регистратора, регистрации и данных сохраняются. Специфику составляют лишь виды сигналов и способы их регистрации. Сигналы, которыми обмениваются люди, называются сообщениями; чаще всего они представлены в языковой форме. Наш повседневный язык — знаковая система. Основной формой представления данных при их регистрации (записи) людьми также являются знаки. В лингвистике выделяют следующие свойства знаков (рис. 1.3). У каждого знака имеются обозначающее, которое доступно восприятию с помощью органов чувств, и обозначаемое, являющееся частью мира мыслей. Условная связь между обозначающим и обозначаемым обеспечивает возможность интерпретации данных, выраженных с помощью языка. Любой знак должен рассматриваться не изолированно, а в соотнесенности с другими знаками.

 Рис. 1.3. Знак в лингвистике

Рис. 1.3. Знак в лингвистике

   Слово также представляет собой знак, т. е. единство обозначающего и обозначаемого. Обозначающим является звучание слова, последовательность звуков или представляющих их при записи букв слова. Значение слова — обозначаемое им понятие или образ, т. е. форма мысли. Звучание слова и его значение связаны друг с другом условно. Знаками могут быть не только слова, но и предложения и целые тексты, а также тембр, интонация голоса.
   Не все знаки устной речи возможно передать в письменной. Изобретение письменности вызвало одну из информационных революций, существенно изменивших направление и ускоривших темпы развития цивилизации (см. 1.8). Наиболее развитой является алфавитная система письменности. В этой системе каждое слово в соответствии с правилами грамматики представляется упорядоченным набором элементарных знаков — символов алфавита (букв). Из слов по правилам синтаксиса образуются предложения. Для построения предложений используются и специальные символы — знаки препинания. Наряду с естественными языками используются и формальные (системы счисления, языки программирования и др.). Формальные языки характеризуются жестко зафиксированным алфавитом, строгими правилами грамматики и синтаксиса. Некоторые символы этих языков могут применяться и в естественном языке, расширяя набор его символов, например знаки арифметических операций: «+», «—», «=».
   Естественный язык с его алфавитом является универсальной знаковой системой по отношению ко всем остальным знаковым системам. Любой знак любой системы может быть выражен средствами естественного языка. С другой стороны, часто возникает необходимость записать данные на некотором искусственном формальном языке, например с помощью азбуки Морзе. Процесс представления данных в виде соответствующей им последовательности символов некоторого языка, согласно правилам грамматики и синтаксиса этого языка, называется кодированием. Полученная в результате форма представления данных называется кодом. Отметим, что зачастую и аналоговые сигналы регистрируются человеком в виде кода, как правило, цифрового.
   В любой деятельности у осуществляющего ее возникает информационная потребность — потребность в информации, необходимой для эффективного выполнения определенной работы.
   Эту информацию человек как информационный субъект использует непосредственно или с помощью средств вычислительной техники.
   Обычно отличительные признаки информации связаны с различными аспектами (группами свойств) использования данных информационным субъектом, среди которых можно выделить три основных.
   Первый из них связан с фактическим или предполагаемым использованием информации. С этой точки зрения информация — это данные, используемые информационным субъектом или полезные ему для решения стоящей перед ним задачи, достижения поставленной цели. Данные, которые по ка- ким-то причинам не используются, а только хранятся, иногда называются потенциальной информацией; данные превращаются в информацию при появлении возможности их использовать.
   Вторая группа свойств относится к информационному субъекту. Информация — это содержание, присваиваемое информационным субъектом данным, результат интерпретации им данных. Правило интерпретации устанавливает в определенном контексте соответствие между данными и получаемой из них субъектом информацией. Одну и ту же информацию можно получить из различных данных. Одни и те же данные могут быть по-разному интерпретированы (поняты) различными субъектами. Некоторые данные, например текст на незнакомом языке, субъект не может интерпретировать, так как не обладает соответствующим правилом интерпретации. Исключение возможности (существенное затруднение) извлечения информации из данных посторонними лицами путем усложнения правила интерпретации для лиц, не владеющих специальным «ключом», лежит в основе идеи шифрования. Со второй группой свойств можно связать определение информации как снятой неопределенности знаний информационного субъекта, т. е. не любого содержания данных, а лишь представляющего для него новизну.
   Свойства третьей группы уточняют предыдущее определение информации, фиксируя необходимость процессов, предшествующих использованию данных. Информация — это сведения, являющиеся объектом хранения, передачи и преобразования, полученные в результате взаимодействия данных и методов их обработки, адекватных решаемой задаче.

Рис. 1.4. Информация и данные 

Рис. 1.4. Информация и данные

   Различные свойства, отличающие информацию от данных, показаны на рис. 1.4.
   Кратко, но неполно связь между информацией и данными можно охарактеризовать следующим образом.
   Информация — это полезное содержание данных.
   Данные — это удобная форма представления информации.
   Более развернутая характеристика этой связи может быть дана путем выделения трех аспектов информации: прагматического, семантического и синтаксического (рис. 1.5).

Рис. 1.5. Аспекты информации 

Рис. 1.5. Аспекты информации

   Прагматический аспект отражает соответствие информации цели, для достижения которой ее предполагает использовать информационный субъект. Определение информации как полезного содержания данных отражает в первую очередь именно прагматический аспект. С этой точки зрения анализируются потребительские свойства информации. Однако если ограничиться лишь этим аспектом, то будет утеряна связь между информацией и данными, а также сужены возможности эффективного использования данных.
   Семантический аспект определяет степень соответствия информационного объекта и его образа, содержащегося в информации (данных), т. е. характеризует смысловое содержание информации. В семантическом аспекте в информации выделяются различные информационные единицы, имеющие смысловые связи как между собой, так и, возможно, с входящими в них более мелкими информационными единицами. Информационные единицы могут отражать различные стороны информационного объекта или его составных частей.
   Синтаксический аспект информации связан с формой ее представления и не затрагивает ее смыслового содержания. Таким образом, данные представляют собой информацию в синтаксическом аспекте.

 
< Пред.   След. >