Введение[править]
Информация — психический продукт любого психофизического организма, производимый им при использовании какого-либо средства, называемого средством информации. Информация или сообщение, или данные не передаются от организма к организму, но формируются при пользовании средствами информации, которые могут передаваться-получаться от одного организма к другому. Например, книги являются средствами информации. С помощью книг — определенных изделий человек может, действуя на себя данными средствами (книгами) производить информацию;в разговорном языке означает передаваемые сведения, знания; нечто осмысленное и как-то полезное получателю. Такое словоупотребление довольно верно́: informare с латыни — «научать». Информацией является и эта книга. Для примера — кусочек информации:
Это слово несёт обширный и притом чёткий смысл: вы знаете о деревьях и видели их немало, можете вспомнить научные истины о природе, строении и видах деревьев или вообразить какое-нибудь дерево в уме. Но что вы воистину знаете? Ведь, глядя на дерево, мы не принимаем в память само вещественное дерево, а видим лишь отражённый от него свет, и даже тот не «захватываем» по правде: попав на сетчатку глаза, свет преобразуется в электрические импульсы в нашем мозгу. Под их действием состояния многих-премногих нейронов поменялись и зримый образ дерева отпечатался в памяти.
Информация — не есть Знание.
«Информированный Человек» не значит «Знающий Человек».
С другой стороны, одно и то же сообщение может как нести информацию, так и не содержать её вовсе. Когда человек впервые слышит фразу «Волга впадает в Каспийское море», это несёт ему информацию о впадении данной реки в данное море, однако если ему это повторить, то теперь эта фраза не будет для него нести новой информации.
Избыточность источника
Под избыточностью понимают наличие в сообщении «лишних» элементов, т. е. элементов не несущих смысловой нагрузки (например, союзы, предлоги). Данные элементы могут быть восстановлены за счет статистических взаимосвязей между другими элементами сообщения. Например, союзы, предлоги и знаки препинания можно восстановить, зная правила построения предложений. Таким образом:
избыточность — это мера сокращения сообщения без потери информации, за счет статистических взаимосвязей между элементами сообщения.
Количественной мерой информации является коэффициент избыточности:
cи= /Hmax(A) (12)
где Н(А) — энтропия, вычисленная на основе учета статистических характеристик сообщений;
Hmax(A) — максимальная энтропия источника, которая согласно второму свойству равна:
Hmax(A)= log2 Ma; бит/сообщ. (13)
Наличие избыточности при передаче сообщений имеет свои положительные и отрицательные стороны. Сообщение, обладающее избыточности требует большего времени передачи и, соответственно большего времени занятия канала. Однако повышение избыточности приводит к увеличению помехоустойчивости сообщения. Она способствует обнаружению и исправлению ошибок в принятых сообщениях. Это связано с тем, что для формирования сообщения используются не все возможные комбинации символов, а лишь определенные (разрешенные), которые заносятся в специальные справочники (словари). При приеме сообщения с элементами (словами) которых нет в справочниках говорит о наличии ошибки и ошибочный элемент может быть заменен похожим по написанию или подходящим по смыслу. Все языки обладают избыточностью равной cи»0,5.
Данные с ошибками
Среди ошибок чаще всего встречается неполнота данных. В некоторых случаях в зависимости от выдвигаемых заказчиком требований и матрицы критериев такие данные могут считаться качественными и использоваться в определенных сферах. Например, в банке при создании единого клиентского справочника заказчик поставил задачу, что данные должны содержать ФИО, дату и место рождения клиента. В ходе работы выяснилось, что место рождения указано только у 2% клиентов. Такие данные можно использовать только в ограниченном сегменте, а для составления справочника их недостаточно.
Среди ошибок не редко возникает недостоверность данных. Например, когда имеет место неверный тип данных (значения в определенном столбце должны иметь определенный тип данных), диапазон (временной, числовой и др.), неверный набор значений.
Иногда встречается несоответствие данных. Оно возникает, когда два значения в наборе данных противоречат друг другу.
При выявлении ошибок их можно исправить вручную, автоматически при помощи инструментов обеспечения качества данных, при обработке данных с помощью скриптов. Исправление данных включает в себя анализ причин ошибок (определяется источник ошибочных данных, причины возникновения ошибок, изолируются факторы, влияющие на эту проблему), парсинг и стандартизацию (сопоставление записей в базах данных с заданными паттернами, грамматикой и репрезентациями для выявления неверных значений), сопоставление данных (выявление одинаковых данных и их объединение), добавление новых данных и их мониторинг. Все это осуществляют разные решения и платформы после оценки качества данных и выявления ошибок.
Низкокачественные данные препятствуют принятию эффективных бизнес-решений, проведению точных аналитических исследований, прогнозированию будущих процессов в бизнесе. Поэтому решения в сфере оценки и управления качеством данных так эффективны в работе бизнеса.
Обновлено: 15.03.2023
Опубликовано: 15.03.2023
Поделиться
ВЛИЯНИЕ АБЕРРАЦИЙ ОПТИКИ НА ПЛОТНОСТЬ ЗАПИСИ ГОЛОГРАФИЧЕСКОЙ ИНФОРМАЦИИ
Анализируются проблемы голографической записи информации. Традиционно развивавшиеся системы памяти были нацелены на хранение «холодных данных» — оцифрованных массивов длительного хранения при редких к ним обращениях. При записи для этих целей аналоговых голограмм существенную роль играют аберрации оптики. Анализируется влияние аберраций как в схемах записи двоичной информации, так и в схемах записи изображений. Полученные оценки плотности записи информации даже с понижающим коэффициентом, определяемым аберрациями, указывают на невозможность передачи таких голограмм по радиоканалу. Для решения задачи передачи голографической информации по радиоканалу в устройствах дополненной реальности и голографического телевидения предложено использовать метод кодирования близкий к известному в радиодиапазоне методу передачи информации на одной боковой полосе, выраженному в передаче двух массивов, эквивалентных по объёму обычному TV и синтезу по ним голограммы на приёмном конце канала связи.
Плотность элементов на чипе процессора
В последние годы произошел потрясающий прогресс в информационных технологиях. За 20 лет быстродействие вычислительной техники увеличилось в 1000 раз, пропускная способность каналов возросла в 10 000 раз, уже более 30 лет действует эмпирический закон Мура (удвоение плотности активных элементов на кристалле каждые полтора года).
Используемая технология на кремнии позволяет работать с разрешением ~15 нм (середина 2014 года). Но постоянная кристаллической решетки кремния ~0,54 нм.
Рис. 1. Экстраполяция закона Мура до 2021-го года
Предполагается, что действие закона Мура прекратится после 2020 года (см. рис. 1). Достаточно трудно представить себе активный элемент на кремнии размером менее 5 нм.
Разработчик чипов компании Arm Майк Мюллер считает, что закон Мура прекратил свою работу (см. «‘Moore’s Law is dead’: Three predictions about the computers of tomorrow«, Nick Heath, September 19, 2018). Компания Arm поставляет свои процессоры практически для всех мобильных телефонов. Закон Мура успешно проработал около 50 лет и вышел на плато (см. рис. 1А) при разрешении около 10 нанометров (ограничение, сопряженное с постоянной кристаллической решетки кремния). Разрабатывается технология, при которой процессор и память размещаются в разных слоях (3D-технология). Трудности для разработчиков чипов будут нарастать лавинообразно. Видно, что технологические проблемы также нарастают, прогноз 2015 года пессиместичнее прогноза 2013-го. 5-нанометровая технология, видимо, не будет реализована.
Рис. 1А. Закон Мура до 2030-го года
70% поверхности кристалла процессора сегодня занята проводниками, соединяющими активные элементы, что также препятствует росту плотности элементов на кристалле.
Повышение емкостей памяти вызывает миниатюризацию ячеек памяти, а уменьшение размера уменьшает заряд, там хранящийся, а это приводит к ухудшению отношения сигнал шум. Неслучайно первый квантовый компьютер работает при температуре 10мК. Здесь полезно помнить, что уровень теплового шума пропорционален kTB, где k — постоянная Больцмана, Т — абсолютная температура, а B — полоса сигнала на входе приемника (существуют и другие источники шума, но они обычно вносят меньший вклад). B характеризует верхнюю частотную границу спектра исследуемого сигнала. Если сигнал стационарный, можно принудительно понижать B, путем усреднения или фильтрации (быстродействие системы при этом понижается). Самый доступный метод уменьшения уровня шумов — снижение температуры T.
Где выход? Возможно это уход в 3D (многослойные кристаллические структуры, что уже используется в SSD). Но многослойность усугубит проблему рассеивания тепла, выделяемого в кристалле.
Информация с ошибками
При рассмотрении качества имеющихся данных могут обнаруживаться материалы с ошибками. Такая ситуация возникает по совершенно разным причинам. Ошибки не исключены в процессе всего анализа, могут появляться на любом его этапе.
К снижению качества данных и ошибкам более часто приводят следующие моменты:
- генерация информации;
- ввод сведений;
- дублирование;
- несовпадения в плане выбранных единиц измерения;
- изначальные значения;
- усеченные сведения.
Также на качестве данных сказываются возможные неточности и неактуальность. Ошибки 100% возникнут при использовании материалов, которые изначально были оценены как некачественные/мало качественные.
Чтобы работать с ошибочными сведениями, нужно добиться их достоверности. В противном случае – отказаться от их применения.
Нерешенные проблемы
- Объективный критерий оценки количества информации (байты не годятся, так как нельзя сказать, что 1 Мбайт логических единиц содержит в 1000 раз больше информации, чем килобайт единиц. Энтропийный метод не пригоден для сколько-нибудь длинных сообщений из-за экспоненциальной сложности вычисления энтропии.
- Критерий оценки качества информации (прагматика — ветвь семиотики, пока не может здесь предложить ничего).
- Распознавание атак нулевого дня (существует определенный прогресс, но пока у хакеров дела обстоят лучше). Универсальных алгоритмов распознавания атак нулевого дня не существует. Предпринимались попытки найти решение в рамках моделей иммунитета (сходных со схемами, реализуемыми в живой природе), но существенного успеха пока не удалось достичь.
Previous: 1.2 Депозитарий статей-первоисточников (на английском языке) UP: |
Как проводить оценку
Перед тем, как использовать те или иные сведения, нужно грамотно провести их анализ. Здесь особую роль играет качество данных. Под подобным термином кроются разные смыслы. Все зависит от конкретной информации и области ее применения.
Оценка помогает:
- Обнаруживать неполадки и оперативно устранять их.
- Грамотно планировать проекты и реализовывать те или иные идеи.
- Улучшать проверяемые базы. Это особо актуально в разработке.
Оценка данных не может решить проблему. Этот процесс нацелен лишь на диагностику «неполадок», а также на оказание помощи при поиске решений.
Здесь особую роль играют критерии качества. Это – все характеристики «чистых» материалов. Факторы, которые могут повлиять на улучшение/ухудшение качества.
Активная проверка и сохранение качества – обязанность всех аналитиков и сотрудников компании. Каждый участник «проверки» должен тщательно следить за качеством информации. Из-за этого рассматриваемый вопрос остается актуальным. Особенно с развитием Big Data.
Что такое Data Quality?
При работе с корпоративными данными важна их точность, непротиворечивость, доступность, достоверность, актуальность, целостность, измеримость, управляемость, релевантность. Совокупность оценок перечисленных показателей демонстрирует качество данных (Data Quality). Эта характеристика обозначает пригодность данных к обработке и анализу, их соответствие обязательным и специальным требованиям. На пригодность данных для работы влияет сфера бизнеса или отдела, который с ними работает, а также критерии оценки. Одни и те же данные для финансового отдела могут быть пригодны для работы, а для аналитиков – нет.
Анализ качества данных и работа с ним важна в проектах при построении хранилищ и озер данных. Чтобы данные, которые попадают в эти структуры, в последующие отчетности и аналитику данных были качественными, приемлемого уровня согласно требованиям, которые выдвигает заказчик. Это первая и наиболее частая задача при построении интеграционных и миграционных проектов
Также при перемещении систем важно восстановление качества данных до уровня требуемого другой системой.
Второй вид проектов, где есть работа с качеством данных: управление нормативно-справочной информацией, ведение справочников, выявление дубликатов данных, приведение данных к необходимому виду для дальнейшего использования. Например, приведение адресов в стандартизированный вид для сегментации данных.
Третий вид проектов – управление данными Data Governance, содержащее информацию о проверках качества, об уровне и показателях качества данных по тем метрикам, которые заказчик выбрал, чтобы понять, насколько можно и нужно использовать данные, получаемые пользователем при выгрузке информации или в отчетах. В таких проектах вопросы восстановления решаются отдельно в зависимости от того, что необходимо пользователю.
Вопросы качества важны и в процессах защиты данных. Например, при обезличивании тестовых сред.
Информационная плотность
Великий русский писатель Антон Павлович Чехов утверждал, что «краткость — сестра таланта». Увы, современные авторы часто пренебрегают этим правилом. Для этого есть несколько причин:
- Перед копирайтером стоят четкие задачи по количеству ключевых слов и размеру текста. Чтобы им соответствовать, автор «раздувает» объем материала.
- Копирайтеру зачастую платят за объем, поэтому он начинает использовать длинные, но малоинформационные шаблонные фразы («Наша компания стремится к высокому качеству оказания услуг в области информационной безопасности…»).
- Писать длинно проще и быстрее, чем коротко. В условиях недостатка бюджета копирайтеру зачастую не хватает времени на редактуру текста.
- Копирайтер может не быть профессионалом в предметной области. Чтобы не допустить фактических ошибок, он пишет общими фразами, что называется, «льет воду» в тексте.
Если в тексте много «воды», его информационная плотность снижается. Читателю приходится по крупинкам вылавливать полезную информацию из заковыристых словесных оборотов, которые использовал автор. Разумеется, это вызывает негативную реакцию как со стороны пользователей сайта, так и со стороны поисковых систем.
Водность текста оценивается по-разному, в основном отслеживается наличие:
- слов-паразитов,
- вводных фраз,
- шаблонных оборотов и штампов,
- стоп-слов,
- бессмысленных и общих фраз,
- преувеличений, пафоса и прочих стилистических ошибок.
Для оценки информационной плотности текста существуют специальные интернет-сервисы (, , ), но алгоритм их работы зачастую непрозрачен и вызывает нарекания.
К примеру, одни сервисы к стоп-словам относят только так называемые слова-связки, которые не несут самостоятельной смысловой нагрузки, но без которых невозможно написать связный текст. Это местоимения, предлоги, частицы, междометия, причастия, союзы и союзные слова, числительные. Другие системы добавляют в этот список еще и слова-усилители, некоторые наречия, а также самые распространённые существительные и глаголы.
Написать текст в условиях таких строгих ограничений может быть проблематично. Кроме того, нужно помнить о двух моментах:
- Без «водных» конструкций текст становится слишком сухим и неестественным, он плохо воспринимается пользователями. По сути, водные конструкции нужны, но в точно определённой пропорции к содержательному тексту.
- Результаты автоматических проверок могут существенно отличаться от результатов оценки поисковыми системами (которые могут использовать другие алгоритмы) и пользователями (которые оценивают текст с точки зрения «человеческой», а не машинной логики).
В качестве перспективного инструмента повышения полезной нагрузки текста можно рекомендовать информационный стиль — «приемы редактирования, которые помогают очистить текст от мусора, наполнить его полезной информацией и сделать читаемым.»
Однако нужно помнить, что никакие приемы не дают гарантированного результата. Нужно постараться привлечь профессиональных авторов и не жалеть ресурсов на написание текстов — эти инвестиции окупятся с лихвой.
Энтропия источника
Большинство реальных источников формирует сообщения с различным количеством информации, однако, при решении практических задач необходимо знать среднее количество информации приходящееся на одно сообщение. Среднее количество информации определяется как математическое ожидание количества информации в сообщении.
где Ма — количество возможных сообщений источника.
Величина Н(А) называется энтропией источника и характеризует среднее количество информации приходящейся на одно сообщение.
Приведенное выражение используется для определения энтропии источников дискретных сообщений. Для непрерывных сообщений а(t) энтропия теоретически стремится к бесконечности, т. к. сообщение может принимать бесконечное число значений, следовательно P(ai)0, а I(ai)?. Однако если сообщение подвергнуть дискретизации и представить его конечным числом квантованных значений по уровню L, то можно определить среднее количество информации в одном отсчете (энтропию отсчета):
где pi — вероятность появления в квантованном сообщении i-го уровня.
Lкв — количество уровней квантования.
Если осуществить предельный переход устремив L к бесконечности, то получится величина, называемая дифференциальной энтропией.
Энтропия является объективной информационной характеристикой источника сообщений. Она всегда положительна.
Свойства энтропии.
1 Энтропия равна нулю, если одно сообщение достоверно (P(ai)=1), а другие не возможны.
2Энтропия максимальна, когда все сообщения равновероятны, и растет с увеличением равновероятных сообщений.
3 Энтропия обладает свойством аддитивности, т. е. энтропии различных источников можно складывать.
Слайд 18Частные критерии оценки информации невозможно свести к общим правилам. Ученику приходится
вырабатывать их самостоятельно. Значит, наша задача дать ему не набор правил, а инструмент, который помог бы ему в работе с информацией.
Самые трудные вопросы по качеству информации появляются в тех случаях, когда ученическая работа, для которой подбирается информация, носит проблемный характер или касается тем, имеющих неоднозначное освещение в печати (а тем более – в Интернете).
Самое трудное в оценке информации – учет исторического контекста
Важно понимать, в какой степени время создания того или иного источника информации могло повлиять на достоверность содержащихся в нем сведений, а тем более – оценок. Это чрезвычайно трудный для понимания, но весьма важный аспект оценки достоверности информации
Он требует некоторого запаса знаний по исследуемому вопросу или хотя бы представления о том, что в разное время данные вопросы или события могли освещаться по-разному.
Слайд 3Ранее родоначальник телеграфа русский ученый и изобретатель П. Л. Шиллинг, установивший
полтора века назад первый телеграф в Зимнем Дворце, предложил специальный кодовый сигнал. Он писал: «Я нашел средство двумя знаками выразить всевозможные речи и применить к сим двум знакам всякий телеграфный словарь или сигнальную книжку». Это и была та самая двоичная система.
Математическая теория информации определяет количество информации в сообщении, но полностью игнорирует содержание передаваемой информации, оставляя в стороне ее смысл. Математик Ю. Шрейдер показал возможность оценивания информации по увеличению объема знаний у человека под воздействием информационного сообщения.
Понятие количества информации
Количеством информации называют числовую характеристику
сигнала, отражающую ту степень неопределенности (неполноту знаний), которая
исчезает после получения сообщения в виде данного сигнала. Эту меру неопределенности
в теории информации называют энтропией. Если в результате получения
сообщения достигается полная ясность в каком-то вопросе, говорят, что была получена
полная или исчерпывающая информация и необходимости в получении дополнительной
информации нет. И, наоборот, если после получения сообщения неопределенность осталась
прежней, значит, информации получено не было (нулевая информация).
Приведенные
рассуждения показывают, что между понятиями информация, неопределенность и возможность
выбора существует тесная связь. Так, любая неопределенность предполагает возможность
выбора, а любая информация, уменьшая неопределенность, уменьшает и возможность
выбора. При полной информации выбора нет. Частичная информация уменьшает число
вариантов выбора, сокращая тем самым неопределенность.
Пример. Человек
бросает монету и наблюдает, какой стороной она упадет. Обе стороны монеты равноправны,
поэтому одинаково вероятно, что выпадет одна или другая сторона. Такой ситуации
приписывается начальная неопределенность, характеризуемая двумя возможностями.
После того, как монета упадет, достигается полная ясность и неопределенность исчезает
(становится равной нулю).
Приведенный пример относится к группе событий,
применительно к которым может быть поставлен вопрос типа «да-нет». Количество
информации, которое можно получить при ответе на вопрос типа «да-нет», называется
битом (англ. bit — сокращенное от binary digit — двоичная
единица). Бит — минимальная единица количества информации, ибо получить информацию
меньшую, чем 1 бит, невозможно. При получении информации в 1 бит неопределенность
уменьшается в 2 раза. Таким образом, каждое бросание монеты дает нам информацию
в 1 бит.
В качестве других моделей получения такого же количества информации
могут выступать электрическая лампочка, двухпозиционный выключатель, магнитный
сердечник, диод и т. п. Включенное состояние этих объектов обычно обозначают цифрой
1, а выключенное — цифрой 0.
Рассмотрим систему из двух электрических лампочек,
которые независимо друг от друга могут быть включены или выключены. Для такой
системы возможны следующие состояния:
Лампа А 0 0 1 1
Лампа
В 0 1 0 1
Чтобы получить полную информацию о состоянии системы, необходимо
задать два вопроса типа «да-нет» — по лампочке А и лампочке В соответственно.
В этом случае количество информации, содержащейся в данной системе, определяется
уже в 2 бита, а число возможных состояний системы — 4. Если взять три лампочки,
то необходимо задать уже три вопроса и получить 3 бита информации. Количество
состояний такой системы равно 8 и т. д.
Связь
между количеством информации и числом состояний системы устанавливается формулой
Хартли:
i=log2N,
где i — количество информации в битах;
N —. число возможных состояний. Ту же формулу можно представить иначе:
N =2i.
Группа из 8 битов информации называется байтом.
Если бит — минимальная единица информации, то байт ее основная единица. Существуют
производные единицы информации: килобайт (кбайт, кб), мегабайт (Мбайт, Мб) и гигабайт
(Гбайт, Гб).
1 кб =1024 байта — 210 (1024) байтов.
1
Мб = 1024 кбайта = 220(1024 x 1024) байтов.
1
Гб = 1024 Мбайта — 230 (1024х1024 х 1024)байтов.
Эти единицы
чаще всего используют для указания объема памяти ЭВМ.
Машиностроительное черчение, инженерная графика, начертательная геометрия. Выполнение контрольной |
Ограничение скорости передачи данных
Постоянная поляризации диэлектрика равна 10-13 сек, а предельная скорость обмена сегодня составляет около 2×1012 бит/c (2013 год). Здесь нужно учесть, что этот канал использовал несколько потоков данных через волокно. При окне прозрачности кремния ~150нм можно обеспечить до 100 потоков через оптоволокно. Ясно, что возможности прежнего темпа роста скорости передачи данных в ближайшие годы будут исчерпаны.
Около 10 лет назад, когда тактовая частота процессоров приблизилась к 3 ГГц, стало ясно, что дальнейший темп роста тактовой частоты более невозможен. В 2004 году разработчики, чтобы обеспечить рост производительности, перешли на многоядерную архитектуру. Но рост производительности в зависимости от числа процессоров имеет логарифмический характер.
Свойства информации
Как и всякий объект, информация обладает свойствами. Характерной отличительной особенность информации от других объектов природы и общества, является дуализм: на свойства информации влияют как свойства исходных данных, составляющих ее содержательную часть, так и свойства методов, фиксирующих эту информации.
С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: объективность, достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр.
Объективность информации. Объективный – существующий вне и независимо от человеческого сознания. Информация – это отражение внешнего объективного мира. Информация объективна, если она не зависит от методов ее фиксации, чьего-либо мнения, суждения.
Пример. Сообщение «На улице тепло» несет субъективную информацию, а сообщение «На улице 22oС» – объективную, но с точностью, зависящей от погрешности средства измерения.
Объективную информацию можно получить с помощью измерительных приборов. Отражаясь в сознании конкретного человека, информация перестает быть объективной, так как, преобразовывается (в большей или меньшей степени) в зависимости от мнения, суждения, опыта, знаний конкретного субъекта.
Достоверность информации. Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение. Недостоверной информация может быть по следующим причинам:
преднамеренное искажение (дезинформация) или непреднаме
ренное искажение субъективного свойства;
искажение в результате воздействия помех и недостаточно точных
средств измерений.
Полнота информации. Информацию можно назвать полной, если
ее достаточно для понимания и принятия решений
Неполная информация может привести к ошибочному выводу или решению.
Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления (погрешностью средства измерения).
Актуальность информации – важность для настоящего времени, злободневность, насущность. Иногда только вовремя полученная информация может быть полезна.
Полезность (ценность) информации
Полезность может быть оценена применительно к нуждам конкретных ее потребителей и оценивается по тем задачам, которые можно решить с ее помощью.
Самая ценная информация – объективная, достоверная, полная, и актуальная. При этом следует учитывать, что и необъективная, недостоверная информация (например, художественная литература), имеет большую значимость для человека.
Социальная (общественная) информация обладает еще и дополнительными свойствами:
- имеет семантический (смысловой) характер, т. е. понятийный, так как
именно в понятиях обобщаются наиболее существенные признаки
предметов, процессов и явлений окружающего мира. -
имеет языковую природу (кроме некоторых видов эстетической ин
формации, например изобразительного искусства). Одно и то же содержание может быть выражено на разных естественных (разговорных) языках, записано в виде математических формул и т. д.
С течением времени количество информации растет, информация накапливается, происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и кумулированием информации. (Кумуляция – от лат; cumulatio – увеличение, скопление).
Старение информации заключается в уменьшении ее ценности с течением времени. Старит информацию появление новой информации, которая уточняет, дополняет или отвергает полностью или частично более раннюю. Научно-техническая информация стареет быстрее, эстетическая (произведения искусства) – медленнее.
Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации.
Данные – это…
Данные – фундамент, на котором базируется компания с управлением на основе данных. Информация – это абстрактное понятие. Фиксированного определения у него нет. Происходит от латинского informatio – «разъяснения».
Можно рассматривать соответствующее понятие как сведения, представленные в той или иной форме:
- письменной;
- устной;
- знаковой;
- электронной.
Информация бывает разного типа. Этот момент необходимо учитывать до проведения анализа имеющихся материалов.
Виды информации
Перед рассмотрением качества данных, стоит изучить существующие виды информации. Классификация в выбранном направлении зависит от способа восприятия, области образования, а также значения и формы представления.
Можно условно поделить информацию по:
- Восприятию. Сюда относят визуальные, аудиальные, тактильные, вкусовые и обонятельные формы.
- Области возникновения: элементарные, социальные, биологические данные.
- Форме представления и фиксации (хранения). К соответствующей категории можно отнести текстовую, графическую, машинную, числовую и звуковую формы.
- Предназначению: массовую, специальную, социальную, статистическую, специальную информацию.
Способов разделения материалов много. Предложенная классификация – самая распространенная. Она поможет в общих чертах понять, с чем предстоит иметь дело в том или ином случае.
Действия над данными
Изучение качества данных невозможно без полноценного понимания операций, совершаемых над собранными материалами. К соответствующий действиям относят:
- Сбор и накапливание. Помогает обеспечивать полноту данных, а также их достоверность и актуальность.
- Фильтрацию. Процесс, характеризующий отсеивание ненужных данных.
- Защиту. Операция, которая характеризует комплекс мероприятий, нацеленных на предотвращение потери, корректировки и взлома.
Также все собранные сведения можно преобразовывать. А именно – изменять форму представления. Пример – текст может быть напечатан на компьютере, озвучен или изображен таблицей/диаграммой.