Перейти до основного вмісту

Види Інформації, Даних, Знань, Мудрість, Премудрість як піраміда дефініцій (тези)


Інформація як піраміда 

У веб часто допускають грубі помилки у тлумаченні відношень між поняттями "інформація", "дані", "знання", "мудрість" - у сфері інформаційно-аналітичної роботи, Decision Making (вироблення рішень). В силу специфіки інтернету, ці грубі помилки розмножуються в часі, можливо, по експоненційному закону. Часто помилково пишуть, що "інформація" утворюється з "даних". Про мудрість до недавного часу писали мало. Про метамудрість і премудрість як правило не згадують за винятком релігійної літератури (премудрість). 

Помилки у цій сфері приводили і приводять до грубих помилок у концепціях автоматизації інформаційно-аналітичної роботи, у створенні моделей інформації, моделей даних, у моделюванні знань. Це приводить відповідно до помилок у створенні різних систем підтримки прийняття рішень (DSS - Decision Support System), експертних систем (Expert System), Software Agents (програмних агентів) та інших систем з елементами управління даними, знаннями, з елементами Artificial Intelligence (AI). Найбільш великими проблемами є необхідність великої кількості операцій ETL (Extract, Transform, Load) та зниження ефективності аналітичних функцій алгоритмічно-програмного забезпечення.

Тому далі викладено авторський погляд про дефініції "інформація", "дані", "знання", "мудрість", "метамудрість", "премудрість" і співвідношення між ними, узгоджений із "Законом про інформацію", із основними дефініціями у сфері систем керування базами даних (СКБД), Database, Relational Database з початку їх створення, із основними дефініціями у сфері  Artificial Intelligence ("штучного інтелекту"), у сфері Business Intelligence, Data Warehouse (сховище даних), Data Mart (кіоск даних), Data Lake (озеро даних), Big Data, OLTP (Online Transaction Processing - транзакційні СКБД), ETL (Extract, Transform, Load), OLAP (online analytical processing - аналітична обробка у реальному часі), Data Mining ("розкопка даних"), Machine Learning (машинне навчання), Artificial Neural Networks (штучні нейронні мережі), Text Mining ("розкопка текстів"), Opinion Mining ("розкопка думок"), Sentiment Analisys ("аналіз настроїв"), Expert Systems (експертні системи), ets.

Автор цієї публікації має більший чи менший досвід розробки, реалізації, користування, супроводження й оцінювання інформаційних систем з використанням всіх перерахованих дефініцій, розроблення методик оцінки їх ефективності, визначення типів користувачів і складання інструкцій для них у друкованій формі і відеоматеріалів.  Перераховані дефініції обговорені на наукових конференціях і консалтингових заходах локального, державного, міжнародного рівня за участю курсантів, студентів, учителів, науково-педагогічних і наукових працівників, практиків інформаційної роботи включно до CIO (Chief Information Officerконтролює людей, процеси та технології в ІТ-організації компані), CDO, CDAO (Chief Data and Analytics Officerчлен команди виконавчого керівництва, відповідальний за аналіз даних у масштабах підприємства), CKO (Chief Knowledge Officerвідповідальний за інтелектуальний капітал та організацію, збереження і поширення знань в організації), CDTO (Chief Digital Transformation Officer - керівник з цифрової трансформації), CEO (Chief Executive Officer - генеральний (виконавчий) директор) корпоративного рівня. Опубліковані науково-практичні публікацій про всі перераховані дефініції за участю CIO, CDO/CKO, CDTO, CEO. 

Активне вивчення, дискусійне обговорення перерахованих  дефініцій реалізоване у авторських навчальних планах, робочих програмах, лекціях, групових, лабораторних і семінарських заняттях по навчальних дисциплінах СППР/DSS, АСУ (Industrial Control System - ICS) спеціального призначення, ТССА (Теорія систем і системний аналіз), Web-технології, та інших із студентами  Житомирського військового інституту імені С.П. Корольова, МАУП.

Зміст цих термінів розкривався у авторських публікаціях з 2003 року. Розгляд моделей даних і моделей знань винесено за рамки даної публікації. Викладена тут інформація базується на загальноприйнятих визначеннях, починаючи з урахуванням Біблії, на основі Закону України "Про інформацію" та інших нормативних міжнародних і українських актів, з урахуванням поглядів «батька теорії інформації» Клода Шеннона. Відповідальність за спрощене тлумачення базових дефініцій в екосистемі навколо терміну "інформація" несе автор цієї публікації.

Інформація (Information) - це узагальнюючий, об`єднуючий термін, який визначає будь-які відомості та/або дані, знання, мудрість, метамудрість, премудрість, які можуть бути збережені на матеріальних носіях або відображені в електронному вигляді чи у когнітивному полі мозку людини. Інформація включає в себе  і "дані", і "знання", і "мудрість". Потребує уточнення співвідношення між найбільш повним полем інформації і Ноосферою, де Ноосфе́ра — частина Землі й навколопланетного простору, в якому виявляється вплив людини. Зазначимо, що будь-які словесні визначення можливо дискусійно обговорювати. Але при їх визначенні для автоматизації інформаційно-аналітичної і управлінської роботи поле дискусій звужується - "моделі інформації" повинні забезпечувати  високоефективний автоматизований системний аналіз інформації і синтез нової інформації для для підтримки прийнятті рішень, для вироблення рішень (Dесision Making).

Дані (Data) - це нечіткий термін, який у теперішній час доцільно визначити узгоджено з такими відносно новими термінами як: база даних (DataBase); сховище даних (Data WareHouse); кіоск або вітрина даних (Data Mart), Data Lake. Дані - це первинна інформація, яка підлягає подальшій обробці для отримання з них знань для підтримки прийняття рішень у різних сферах. Терміни "база даних", "сховище даних", "кіоск даних" з`явилися кілька десятиліть назад. У тлумаченні терміну "дані" раніше не пропонували строгого визначення. Проте, у #AI давно і чітко відрізняють дефініції "дані" і "знання", - ще в часи СРСР.

Слабоструктуровані дані - це нечіткий термін для визначення первинної інформації (текстові файли, ін. в Data Lake)до того, як вони потрапляють до баз даних, де дані приведені до більш структурованої форми.

Структуровані дані - це термін для визначення первинної інформації, яка як правило міститься у базах даних різних типів, у RDB, OLTP, Data Warehouse, Data Amrts, OLAP, Data Mining, ets. Структуровані дані, як правило, можна використовувати безпосередньо у математичних і логічних операціях та відповідно у обчислюваних таблицях, на графіках, в обчислюваних схемах для побудови простих і складних Alerts.

У 2010 році визначили початок big data age (ери "великих даних") - у доповіді PCAST «Report to the President And Congress «Designing a Digital Future: Federally Funded Research and Development in Networking and Information Technology» («Доповідь Конгресу і Президенту США «Конструювання Цифрового майбутнього: що фінансуються з федерального бюджету досліджень і розробок в області мережевих та інформаційних технологій»). Доповідь містить більше ніж 140 сторінок складного для глибокого розуміння тексту зі сфери NIT R&D. Левова частина цієї Доповіді перекладена і обговорена студентами ЖВІ у рамках навчальних дисциплін СППР (DSS), АСУ (ICS) спеціального призначення, ТССА, Web-технології, у рамках  доповідей на наукових конфернціях і семінарських заняттях, дипломних проектах. Видані авторські наукові статті разом і з провідними спеціалістами у часткових сферах big data analytics. 

Застереження щодо терміну "розвідувальні дані" 
Необхідно зазначити щодо відомих термінів "розвідувальні дані", "розвіддані" які використовуються у радянських та пострадянських фільмах для позначення інформації, яка подається кінцевому користувачу (військовому і політичному керівництву). Очевидно, що використання терміну у вказаному контексті вносить певну плутанину у сучасне тлумачення термінів "інформація", "дані", "знання", "мудрість", "метамудрість", "премудрість". Ймовірно, варто використовувати термін "розвідувальна інформація", "інформація", "первинна інформація".
Див. Розвідувальна інформація, матеріал з Вікіпедії — вільної енциклопедії.

Знання (Knowledge) - це багатозначний термін для позначення результату аналітико-синтетичної переробки (аналізу і синтезу)  первинної інформації (даних) і формування на цій основі нового типу більш цінної інформації. Знання - це "метадані", тобто "дані про дані", для прикладу: атрибути даних у базах даних"Знання", як результат інформаційно-аналітичної обробки вхідних "даних" - подібні до 1-ї похідної у математиці, проте семантична залежність більш складна і неоднозначна. 


Часто пишуть, що знання - це результат узагальнення первинної інформації, проте це може бути і фільтрація. 

Орієнтовно з середини 1990-х років з`явилися hi-tech програмні засоби Business Intelligence (OLAP, Data Mining, ін.) для швидкого добування нетривіальних знань з масивів даних. 

OLAP - аналіз у онлайн режимі багатовимірного OLAP-куба. Найбілш часто використовуються такі аналітичні операції:  "консолідація", "розкладання", "узагальнення", "деталізація", "обертання", "групування", "нарізання і розкладання на семантичні скибочки", підрахунок і порівняння, інші операції у режимі он-лайн із структурованою інформацією у базі даних. Результати аналізу автоматизовано виводять у формі зведених онлайн таблиць, онлайн графіків, онлайн схем. 

Data Mining ("розкопка в даних") - це насамперед такі аналітично-програмні функції як  класифікація, кластеризація, пошук одночасних подій, пошук часових послідовностей, прогнозування на основі історичних даних, пошук аномальних відхилень, інші функції. Вказані функції працють, якщо база початкової інформації (даних) відповідно структурована. у спеціально структурованих даних у базі даних (як правило, у Data Warehouse, Data Marts). Результати аналізу автоматизовано виводять у формі онлайн таблиць, онлайн графіків, онлайн схем. 

Text Mining - це на основі Data Mining додаткові функції для текстів: "вилучення з текстів ключевих слів і словосполучень", "вилучення понять", "анотування", "побудова семантичних мереж між поняттями", "оцінка настроїв", ін.

Opinion mining, Sentiment Analisys - спецчастини до Text Mining  для добування знань про думки й емоційний стан авторів текстів,  з використанням позначок типу "лайки", "японські емодзі", ін.  

Знання - це також спрощені системи продукційних правил якщо...то...інакше... для порівняння вхідних даних з наявними у базі  даних і виконання певних дій за результатами порівняння. 

У 21-му столітті дефініція "знання" повинна бути обов`язково узгодженою із термінологією баз даних і "штучного інтелекту", точніше Artificial Intelligence. Див публікацію: Intelligence & Intelligence & Intelligence

Проте, традиційно, знання містяться і у слабоструктурованій інформації, наприклад, у книзі, відеоролику, зображенні, ін. 

Для оцінки можливості та особливостей автоматизації інформаційно-аналітичної роботи, систем AI (artificial intelligence) важливо знати, що розрізняють: 
  • Implicit Knowledge, 
  • Explicit Knowledge, 
  • Tacit Knowledge. 

Відомо, що іноді знання приходять як інсайти (озаріння). На мій погляд, можна визначити знання-інсайти двох типів. 


Знання інсайти, озаріння 1-го типу - це результат слабопізнаного процесу переробки мозком людини первинної інформації. Як правило - такі інсайти - це наслідок тривалої напруженої роботи експертів. 

Приклад інсайту 1-го типу характеризується знаменитим вигуком "Еврика" Піфагора, який на основі тривалого осмислення особливостей виміру вмісту золота у царській короні отримав відповідний інсайт-озаріння-знання... 

Знання-інсайти, озаріння 2-го типу - це результат слабопізнаного людиною процесу надходження до мозку людини інформації від оточуючого людей непізнаного глобального інформаційного поля або/та "від Бога". 

Приклади інсайтів 2-го типу: реальні передбачення Вольфа Месинга; символічні передбачення Нострадамуса; передбачення "безумної Касандри" яка "бачила Трою у вогні" у легенді про Одісея; ін. Тому багато видатних керівників іноді зверталися до різних "чаклунів", "нумерологів" і т.п. Для прикладу, радянський диктатор-атеїст (бувший випускник семінарії) Йосип Джугашвілі (нік "Сталін") звертався до Вольфа Месінга, хоча передбачення Месінга виходили і за рамки атеїзма, і за рамки релігії. Керівники та спецслужби СРСР систематично зверталися до "Баби Ванги" у Болгарії.

Процес вироблення знань і перетворення їх в енергію бізнесу на основі японського підходу (узагальнення західного і радянського досвіду) розглянуто у статті:«Спіраль знань» І. Нонаки та Х. Такеучи (Model SECI By Ikujiro Nonaka And Hirotaka Takeuchi) 

Мудрість (Wisdom) - це вищий вид знань, які отримані за результатами тривалого накопичення, аналізу і синтезу інформації (даних і знань) про велику кількість подій і процесів у даній сфері. Мудрим (експертом) можна вважати людину, яка знає результати всіх помилкових і правильних рішень у сфері, де вона вважається експертом. 

Для практики корисно вважати, що "мудрість" - це третинна інформація, якщо первинною інформацією вважати "дані", а вторинною інформацією вважати "знання". Якщо "знання" подібні до 1-ї похідної від "даних", то "мудрість" подібна до 2-ї похідної від "даних", проте залежність більш складна, неоднозначна.

Метамудрість (MetaWisdom) - на мій погляд, це знання про те, що у перспективі може статися так, як до цього ніколи не було у минулому досвіді, у тому числі не зареєстровано у базі даних, у базі знань,ін. 

Тобто, метамудрість - це розуміння того, що будувати прогноз і приймати рішення лише на основі попереднього досвіду може бути помилкою. Мета мудрість повертає реально існуючу можливість невдачі навіть у наукових, мудрих прогнозів. 

Метамудрість з`являється за результатами аналізу результатів надвеликої кількості накопичених рішень. Метамудрість може бути аналогічною твердженню, яке засноване без знання попереднього досвіду, проте витікає з логіки здорового глузду.  

Метамудрість, ймовірно, також може бути досягнута за рахунок не наукових прогнозів, за рахунок використання непізнаних механізмів передбачення у окремих людей та у окремих засобів. Для прикладу, відомі правдиві передбачення легендарної "Кассандри-віщунки", Вольфа Мессінга, Баби Ванги, ін. Популярними є гадання на "Картах Таро", "на кавовій гущі", ін.  

Премудрість  - це ймовірно, релігійний термін, тоді це "Страх Божий", страх людини перед покаранням за неповагу до Бога.  Цей страх повинен утримувати людину від великих гріхів. Дане визначення дав мені знайомий дипломований (PhD) вчений-богослов
Далі поданий приклад для ілюстрації великого значення втрати людьми Премудрості. Можливо це легенда, проте відомо, що коли люди майже закінчили будівництво Вавілонської башти "до неба", "до Бога", то забули про повагу до Бога і почали жбурляти у його напрямку каміння та дрючки. За це люди були покарані - Бог змішав їх мови і тому вони не змогли будувати далі. Цей приклад дуже метафорично корисний для практики: 1) Бога треба поважати; 2) добре мати спільну мову всіх учасників проекту; 3) щоб побудувати щось велетенське, людям треба поважати Бога і мати спільну мову. Приклад причин занепаду будівництва Вавілонської вежі корисний для розуміння особливостей побудови досконалих глобальних інформаційно-аналітичних та управлінських систем.
Проте, є ще один приклад із Священного писання. Адам і Єва не послухалися Бога і тому були вигнані з Раю, стали нашими прабатьками. 

Підкреслимо, що у визначенні дефініцій екосистеми дефініції "ІНФОРМАЦІЯ" у нашій роботі  немає нічого революційно нового - вони лише уточнюють існуючі. 

Запропоновані моделі інформації, даних і знань винесені за рамки цієї публікації, вони також не є принципово новими, проте уточннють і розвивають існуючі моделі, забезпечуючи можливість здійснення і підвищення ефективності інформаційно-аналітичної обробки вхідних даних для процесу підтримки прийняття рішень за допомогою найбільш сучасних технологій і засобів - Business Intelligence Big Data, а також реалізації Network-Centric Ergatic Organizm (Мережевого ергатичного організму).

Коментарі

Популярні дописи з цього блогу

Недоліки статей Вікіпедії, які варто подолати для підвищення довіри до неї (21.05.23 виправлена дезінформація хакера)

Часто вікі-статті пишуть "всі кому не лінь" під чудернадськими нікнеймами ("легендами прикриття"), а потім правлять також "всі кому не лінь", через який завгодно час. Досвідчені вікі-ігромани у Вікіпедії є авторами кількох сотень чи тисяч вікі-статей та авторами кількох десятків тисяч вікі-правок чужих статей (це не описка), див. ст. Вікіпедія - це "енциклопедія" без довіри?  (гіперпосилання виправлено 20.05.2023 р. після заміни хакером) Найчастіше доповнення вікі-статей здійснюють кластери вікі- ігроманів  з числа вікі-патрульних та вікі-адміністраторів Вікіпедії, які для самореклами і вікі-рейтингу намагаються "відмітися" у максимальній кількості вікі-статей, ін., див. для прикладу:   Вікіпедія: патрульні  (patroller), Вікіпедія: рейтинг .  Є випадки, коли кластери вікі-ігроманів редагували тексти і посилання у статтях більше ніж 8 років, проте жоден з них не помічав елементарні принципові семантичні помилки першого ...

OSINT (Розвідка відкритих джерел) в екосистемі зв`язаних термінів

OSINT - Open Sourse Intelligence Цей ескіз статті, за винятком інформації про "російсько-українську війну" (гібридну воєнну агресію РФ проти України з 2013 року) початково написаний як фрагмент повної статті про OSINT у січні 2019 року у зв`язку із тим, що раніше створена сторінка про OSINT у Вікіпедії базувалася на джерелах російського походження, хоча сам термін і технологія мають англомовне походження. Ймовірно, даний текст і  джерела у Вікіпедії буде змінено і викривлено,  як і по багатьом іншим інформаційним hi-tech.  Далі визначення OSINT, синтезоване на основі англомовних джерел і власних досліджень:  Розвідка відкритих джерел (англ. Open source intelligence, OSINT) — концепція,  методологія і  технологія   добування з відкритих джерел  військової, політичної, економічної та іншої безпекової інформації  і використання її  для підтримки прийняття рішень у сфері національної оборони і безпеки. Добування інформації здійсню...

Виключна економічна зона України - використання безпілотників згідно міжнародного права

Карта напрямків російської агресії у Чорному морі і у Азовському морі на фоні виключних (морських) економічних зон Виключна економічна зона (Exlusive Economic Zone) це морська зона (maritime zones), до 200 морських миль, де прибережна держава має суверенне право на використання природних ресурсів і ведення економічної діяльності - з гідно з Конвенцією ООН з морського права [1-6] .  Визначені також Територіальне море ( Territorial sea ), Прилегла зона ( Contiguous zone ), Міжнародні води ( International waters ) та континентальний шельф ( Continental shelf ) - див. схему нижче. Schematic map of maritime zones, Wiki. Якщо між узбережжями держав менше 400 морських миль, то межі ВЕЗ встановлюються як «серединна  лінія» -  у Чорному морі це  приблизно 84 морських милі (~140 км) від узбережжя України до Туреччини. Чорноморський флот ЗС РФ нахабно влаштовує військові морські навчання у ВЕЗ Туреччини, не кажучи про окуповані морські зони України і Грузії. Між Росією і Т...