Інформація як піраміда |
У веб часто допускають грубі помилки у тлумаченні відношень між поняттями "інформація", "дані", "знання", "мудрість" - у сфері інформаційно-аналітичної роботи, Decision Making (вироблення рішень). В силу специфіки інтернету, ці грубі помилки розмножуються в часі, можливо, по експоненційному закону. Часто помилково пишуть, що "інформація" утворюється з "даних". Про мудрість до недавного часу писали мало. Про метамудрість і премудрість як правило не згадують за винятком релігійної літератури (премудрість).
Помилки у цій сфері приводили і приводять до грубих помилок у концепціях автоматизації інформаційно-аналітичної роботи, у створенні моделей інформації, моделей даних, у моделюванні знань. Це приводить відповідно до помилок у створенні різних систем підтримки прийняття рішень (DSS - Decision Support System), експертних систем (Expert System), Software Agents (програмних агентів) та інших систем з елементами управління даними, знаннями, з елементами Artificial Intelligence (AI). Найбільш великими проблемами є необхідність великої кількості операцій ETL (Extract, Transform, Load) та зниження ефективності аналітичних функцій алгоритмічно-програмного забезпечення.
Тому далі викладено авторський погляд про дефініції "інформація", "дані", "знання", "мудрість", "метамудрість", "премудрість" і співвідношення між ними, узгоджений із "Законом про інформацію", із основними дефініціями у сфері систем керування базами даних (СКБД), Database, Relational Database з початку їх створення, із основними дефініціями у сфері Artificial Intelligence ("штучного інтелекту"), у сфері Business Intelligence, Data Warehouse (сховище даних), Data Mart (кіоск даних), Data Lake (озеро даних), Big Data, OLTP (Online Transaction Processing - транзакційні СКБД), ETL (Extract, Transform, Load), OLAP (online analytical processing - аналітична обробка у реальному часі), Data Mining ("розкопка даних"), Machine Learning (машинне навчання), Artificial Neural Networks (штучні нейронні мережі), Text Mining ("розкопка текстів"), Opinion Mining ("розкопка думок"), Sentiment Analisys ("аналіз настроїв"), Expert Systems (експертні системи), ets.
Автор цієї публікації має більший чи менший досвід розробки, реалізації, користування, супроводження й оцінювання інформаційних систем з використанням всіх перерахованих дефініцій, розроблення методик оцінки їх ефективності, визначення типів користувачів і складання інструкцій для них у друкованій формі і відеоматеріалів. Перераховані дефініції обговорені на наукових конференціях і консалтингових заходах локального, державного, міжнародного рівня за участю курсантів, студентів, учителів, науково-педагогічних і наукових працівників, практиків інформаційної роботи включно до CIO (Chief Information Officer - контролює людей, процеси та технології в ІТ-організації компані), CDO, CDAO (Chief Data and Analytics Officer - член команди виконавчого керівництва, відповідальний за аналіз даних у масштабах підприємства), CKO (Chief Knowledge Officer - відповідальний за інтелектуальний капітал та організацію, збереження і поширення знань в організації), CDTO (Chief Digital Transformation Officer - керівник з цифрової трансформації), CEO (Chief Executive Officer - генеральний (виконавчий) директор) корпоративного рівня. Опубліковані науково-практичні публікацій про всі перераховані дефініції за участю CIO, CDO/CKO, CDTO, CEO.
Активне вивчення, дискусійне обговорення перерахованих дефініцій реалізоване у авторських навчальних планах, робочих програмах, лекціях, групових, лабораторних і семінарських заняттях по навчальних дисциплінах СППР/DSS, АСУ (Industrial Control System - ICS) спеціального призначення, ТССА (Теорія систем і системний аналіз), Web-технології, та інших із студентами Житомирського військового інституту імені С.П. Корольова, МАУП.
Зміст цих термінів розкривався у авторських публікаціях з 2003 року. Розгляд моделей даних і моделей знань винесено за рамки даної публікації. Викладена тут інформація базується на загальноприйнятих визначеннях, починаючи з урахуванням Біблії, на основі Закону України "Про інформацію" та інших нормативних міжнародних і українських актів, з урахуванням поглядів «батька теорії інформації» Клода Шеннона. Відповідальність за спрощене тлумачення базових дефініцій в екосистемі навколо терміну "інформація" несе автор цієї публікації.
Інформація (Information) - це узагальнюючий, об`єднуючий термін, який визначає будь-які відомості та/або дані, знання, мудрість, метамудрість, премудрість, які можуть бути збережені на матеріальних носіях або відображені в електронному вигляді чи у когнітивному полі мозку людини. Інформація включає в себе і "дані", і "знання", і "мудрість". Потребує уточнення співвідношення між найбільш повним полем інформації і Ноосферою, де Ноосфе́ра — частина Землі й навколопланетного простору, в якому виявляється вплив людини. Зазначимо, що будь-які словесні визначення можливо дискусійно обговорювати. Але при їх визначенні для автоматизації інформаційно-аналітичної і управлінської роботи поле дискусій звужується - "моделі інформації" повинні забезпечувати високоефективний автоматизований системний аналіз інформації і синтез нової інформації для для підтримки прийнятті рішень, для вироблення рішень (Dесision Making).
Дані (Data) - це нечіткий термін, який у теперішній час доцільно визначити узгоджено з такими відносно новими термінами як: база даних (DataBase); сховище даних (Data WareHouse); кіоск або вітрина даних (Data Mart), Data Lake. Дані - це первинна інформація, яка підлягає подальшій обробці для отримання з них знань для підтримки прийняття рішень у різних сферах. Терміни "база даних", "сховище даних", "кіоск даних" з`явилися кілька десятиліть назад. У тлумаченні терміну "дані" раніше не пропонували строгого визначення. Проте, у #AI давно і чітко відрізняють дефініції "дані" і "знання", - ще в часи СРСР.
Слабоструктуровані дані - це нечіткий термін для визначення первинної інформації (текстові файли, ін. в Data Lake), до того, як вони потрапляють до баз даних, де дані приведені до більш структурованої форми.
Структуровані дані - це термін для визначення первинної інформації, яка як правило міститься у базах даних різних типів, у RDB, OLTP, Data Warehouse, Data Amrts, OLAP, Data Mining, ets. Структуровані дані, як правило, можна використовувати безпосередньо у математичних і логічних операціях та відповідно у обчислюваних таблицях, на графіках, в обчислюваних схемах для побудови простих і складних Alerts.
У 2010 році визначили початок big data age (ери "великих даних") - у доповіді PCAST «Report to the President And Congress «Designing a Digital Future: Federally Funded Research and Development in Networking and Information Technology» («Доповідь Конгресу і Президенту США «Конструювання Цифрового майбутнього: що фінансуються з федерального бюджету досліджень і розробок в області мережевих та інформаційних технологій»). Доповідь містить більше ніж 140 сторінок складного для глибокого розуміння тексту зі сфери NIT R&D. Левова частина цієї Доповіді перекладена і обговорена студентами ЖВІ у рамках навчальних дисциплін СППР (DSS), АСУ (ICS) спеціального призначення, ТССА, Web-технології, у рамках доповідей на наукових конфернціях і семінарських заняттях, дипломних проектах. Видані авторські наукові статті разом і з провідними спеціалістами у часткових сферах big data analytics.
Застереження щодо терміну "розвідувальні дані"
Необхідно зазначити щодо відомих термінів "розвідувальні дані", "розвіддані" які використовуються у радянських та пострадянських фільмах для позначення інформації, яка подається кінцевому користувачу (військовому і політичному керівництву). Очевидно, що використання терміну у вказаному контексті вносить певну плутанину у сучасне тлумачення термінів "інформація", "дані", "знання", "мудрість", "метамудрість", "премудрість". Ймовірно, варто використовувати термін "розвідувальна інформація", "інформація", "первинна інформація".
Див. Розвідувальна інформація, матеріал з Вікіпедії — вільної енциклопедії.
Знання (Knowledge) - це багатозначний термін для позначення результату аналітико-синтетичної переробки (аналізу і синтезу) первинної інформації (даних) і формування на цій основі нового типу більш цінної інформації. Знання - це "метадані", тобто "дані про дані", для прикладу: атрибути даних у базах даних. "Знання", як результат інформаційно-аналітичної обробки вхідних "даних" - подібні до 1-ї похідної у математиці, проте семантична залежність більш складна і неоднозначна.
Часто пишуть, що знання - це результат узагальнення первинної інформації, проте це може бути і фільтрація.
Знання - це також спрощені системи продукційних правил якщо...то...інакше... для порівняння вхідних даних з наявними у базі даних і виконання певних дій за результатами порівняння.
Проте, традиційно, знання містяться і у слабоструктурованій інформації, наприклад, у книзі, відеоролику, зображенні, ін.
Для оцінки можливості та особливостей автоматизації інформаційно-аналітичної роботи, систем AI (artificial intelligence) важливо знати, що розрізняють:
- Implicit Knowledge,
- Explicit Knowledge,
- Tacit Knowledge.
Відомо, що іноді знання приходять як інсайти (озаріння). На мій погляд, можна визначити знання-інсайти двох типів.
Знання інсайти, озаріння 1-го типу - це результат слабопізнаного процесу переробки мозком людини первинної інформації. Як правило - такі інсайти - це наслідок тривалої напруженої роботи експертів.
Приклад інсайту 1-го типу характеризується знаменитим вигуком "Еврика" Піфагора, який на основі тривалого осмислення особливостей виміру вмісту золота у царській короні отримав відповідний інсайт-озаріння-знання...
Знання-інсайти, озаріння 2-го типу - це результат слабопізнаного людиною процесу надходження до мозку людини інформації від оточуючого людей непізнаного глобального інформаційного поля або/та "від Бога".
Приклади інсайтів 2-го типу: реальні передбачення Вольфа Месинга; символічні передбачення Нострадамуса; передбачення "безумної Касандри" яка "бачила Трою у вогні" у легенді про Одісея; ін. Тому багато видатних керівників іноді зверталися до різних "чаклунів", "нумерологів" і т.п. Для прикладу, радянський диктатор-атеїст (бувший випускник семінарії) Йосип Джугашвілі (нік "Сталін") звертався до Вольфа Месінга, хоча передбачення Месінга виходили і за рамки атеїзма, і за рамки релігії. Керівники та спецслужби СРСР систематично зверталися до "Баби Ванги" у Болгарії.
Метамудрість з`являється за результатами аналізу результатів надвеликої кількості накопичених рішень. Метамудрість може бути аналогічною твердженню, яке засноване без знання попереднього досвіду, проте витікає з логіки здорового глузду.
Коментарі