Business Intelligence, експертні системи та мережевий ергатичний організм у мережецентричній системі
У 2011 році нами опублікована стаття про експертну систему, узгоджену з Business Intelligence+KMS (Knowledge Management System). Там акцентована схвалена обізнаними вченими і практиками концепція Мережевого Ергатичного Організму (Network Ergatic Organizm, NEO), узгодженого з українською концепцією Ноосфери В.І. Вернадського.
Визначено, що «Мережевий Ергатичний Організм» (Network Ergatic Organizm) – це мережева людино-машинна система з виконавчими пристроями, у якій функції нетривіального добування знань і управління гармонійно розділені у єдиному інформаційному полі між програмно-технічними засобами і людьми, при цьому значна частина функцій (крім критичних для безпеки) виконується з мінімальною участю людей.
Акцентовано увагу на таких авторських дефініціях як: мережеві ергатичні організми з управлінням, що засноване на нетривіальних знаннях; глобальні мережеві ергатичні організми в Інтернеті; окремі ергатичні організми в Інтернеті.
У 2010-2017 році у цивільній сфері у світі стала популярною концепція Internet of Things, IoT ("Інтернет речей"), яка є по суті спрощеною версією нашої концепції і технології «Мережевий Ергатичний Організм» (Network Ergatic Organizm). Спрощення полягає у тому, що в IoT у користувачів немає потужних аналітичних функцій, а об`єкти управління та мережеві засоби передачі інформації менш небезпечні та більш прості ніж у військовій сфері.
Вказана стаття у науковому фаховому виданні опублікована у 2011 році з такими атрибутами:
Валюх, А.І. ЕКСПЕРТНА СИСТЕМА, УЗГОДЖЕНА З BUSINESS INTELLIGENCE 2.0 / А.І. Валюх, І.А. Круковський, В.Л. Сімаков // Вісник Житомирського державного технологічного університету. Серія: Технічні науки. – 2011. – N 2(57). - С. 53-63. – Режим доступу : DOI : 10.26642/tn-2011-2(57)-53-63.
У зв`язку зі складністю бібліотечного доступу тут подається додаткова версія статті з покращеним форматуванням і незначними стилістичними виправленнями для кращої читабельності.
Постановка проблеми та її зв’язок із
важливими науковими і практичними завданнями.
Експертні системи розвивають з 1950‑х років, а на комерційний рівень їх вивели з 1970‑х – для інтерпретації вхідних даних, діагностики, моніторингу,
проектування, прогнозування, планування, навчання, управління та іншого у
сферах науки, освіти, державного управління, оборони, правочинства, промисловості,
сільського господарства, торгівлі, ін. Вони незамінні, але мають обмежені можливості
[1-8]. Дослідження з Artificial Intelligence (перекладається як термін-метафора
«штучний інтелект») та баз даних привели
у кінці 1980-х – першій половині 1990-х років до нової генерації зв‘язаних
концепцій, технологій і засобів підтримки прийняття рішень, які узагальнено позначили
Business Intelligence [9-13]. Найбільш важливими складовими 1-ї генерації Business
Intelligence (BI 1.0) стали Data Warehouse (сховище даних), OLAP і Data Mining; введений у 1958 р. термін «A Business Intelligence System» мав дещо інше значення [9-25]. Орієнтовно з 2005 р.,
визначають нову генерацію Business Intelligence, яку позначають Business Intelligence 2.0 або DSS BI 2.0, що передбачає також інтеграцію з мережевою системою
управління знаннями (далі – KMS, Knowledge Management System) на Web технологіях, ін. [25-27]. Виходячи з цього,
доцільно узгодити архітектуру експертної системи з BI 2.0 (далі – ES/BI 2.0, Expert System/BI 2.0). Також має бути передбачена можливість її
інтеграції з системою підтримки прийняття рішень і геоінформаційною системою,
які узгоджені з BI 2.0 (далі – DSS/BI 2.0, Decision Support System/BI 2.0; GIS/BI 2.0, Geospatial Information System/BI 2.0). Це узгоджено з тенденціями ери
Business Intelligence, яку визначають з 21-го століття [10] та ери Zettabyte («Big Data»), яку визначають орієнтовно
з 2010 р. [21], - це має важливе науково-практичне значення для підвищення
ефективності діяльності державних підсистем [21]. Англомовні терміни-метафори у
статті є загальноприйнятими у глобальному інформаційному полі, дозволяють
уникнути помилок перекладу, зменшити неоднозначність тлумачення, скоротити
позначення.
Аналіз досліджень і публікацій, що відображають
питання інтеграції з OLAP, Data Mining, елементами мережевої KMS показав наступне.
1.
Запит Expert system OLAP Data Mining 05.05.2011 р. повернув у бібліотеці
AAAI 18 записів [30], в ACM SIGART – 4 [31], в ACM SIG KDD – 22 [32]. Аналіз доступних статей, їх анотацій та інших
публікацій показав, що питання створення гібридних експертних систем з OLAP і
Data Mining розкриті не повністю, а нейромережі й генетичні алгоритми у
гібридах виконують найчастіше лише часткові задачі Data Mining [1-6, 8-10, 22, 23, 30-33].
2. Не
повністю розкриті можливості інтеграції експертних систем з мережевими KMS, хоча їх інтеграція може розширити можливості логічного виведення експертної
системи шляхом його продовження на семантичних мережах KMS [1-6, 10, 30-32, 34, 35]. Навіть у "Принципах Knowledge Management Армії США" не вживається термін Expert System, хоча акцентується базовий для обох систем процес
перетворення Tacit Knowledge («мовчазних знань»
професіоналів) до Explicit Knowledge (доступних всім
«явних знань») [34-38], що можливо тільки у спрощеній
формі. Необхідно також згадати Implicit Knowledge («доступні але
раніше не висловлені знання») [38], які також необхідно перетворити до Explicit
Knowledge.
3. Не
повністю розкриті проблемні питання моделей даних, моделей знань (метаданих) і моделей метазнань, що визначають функціональні можливості інформаційно-аналітичних систем [1-6, 15, 17-21, 28, 29]. Відома
певна кількість таких моделей.
Для прикладу, моделі подання знань для Knowledge Based System ("заснованих на знаннях системах"): логіка
предикатів; фрейми; продукційна модель; семантичні мережі; гібридна
фреймово-продукційна модель, ін. [1-7].
Моделі даних для OLAP: Star Schema
(Схема «Зірка»), Snowflake Schema (Схема «Сніжинка») та їх модифікації [18, 19,
22, 23, 39].
Моделі даних для Data Mining нерегламентовані, тому процес відкриття
знань у даних (Knowledge Discovery in Date [16, 17]) часто містить
значний об’єм операцій вилучення, перетворення
і завантаження (Extract, Transform, Load, ETL) даних до форми, яка дозволяє реалізувати
алгоритми Data Mining [22, 23].
Найбільш відома модель метазнань у KMS і журналістиці – Six W's (Five W's (and
one H)), яка розроблена на основі метафори Р. Кіплінга (R. Kipling) «Six Honest Serving Men» («Шість Чесних Слуг») [40].
Шість елементів моделі Six
W's у KMS позначають: KNOW‑WHO (…ПРО КОГО), KNOW‑WHAT (…що сталося), KNOW‑WHEN
(…коли сталося), KNOW‑WHERE (…де сталося), KNOW‑WHY (…чому
сталося), KNOW‑HOW (…як сталося).
Ця модель без елемента KNOW‑WHERE показана як основа армійської KMS у принципах Knowledge Management Армії США (опубліковано для відкритого доступу в Інтернеті) [34] і підтверджена у статті [35]. Проте це порушує
логіку інтеграції KMS з GIS, яка забезпечує візуалізацію KNOW‑WHERE, ін. [29].
Модель Six W's також використовують
як шестивимірну модель метаданих Zachman Framework (Схема Захмана) для Data Warehouse [22].
Складність реалізації
в умовах конкуренції єдиних онтологій [6] і моделей метазнань
є ключовою проблемою Web 2.0 і Semantic Web (Web 3.0). Бурхливий і швидкий розвиток у цій
сфері йде відповідно до основного закону діалектики про єднання і боротьбу
протилежностей.
Цілями статті є подання
результатів розробки архітектури гібридної експертної системи, що відрізняється
інтеграцією з OLAP, Data Mining, Visual Mining, Dashboard, Scorecard,
елементами мережевої KMS та має інші узгоджені
з BI 2.0 властивості, тому її позначено Expert System / Business Intelligence 2.0 (ES/BI 2.0, ES BI2.0, ESBI, BIES) - по аналогії з DSS/BI 2.0 і подібними позначеннями. Розглянуті також деякі
особливості реалізації системи.
Виклад
основного матеріалу.
Функціональні
можливості заснованих на знаннях систем та їх гібридів визначаються структуризацією
вхідної інформації, яка повинна забезпечувати ситуативну самоактивацію знань, математичні
і текстові функції, ін. Дослідження відповідних моделей привело до розробки ES/BI 2.0, тому їм
відведена значна частина статті.
ES/BI 2.0 є гібридом чотирьох самодостатніх систем (експертна система (alerts) + OLAP + Data Mining + мережева KMS).
Для їх об’єднання
розроблені гібридна трикомпонентна модель подання знань FPS/BI 2.0 (Frame, Production system, Semantic network) і модель метазнань SixW's/BI 2.0, які прототипувалися на практиці з урахуванням можливостей сучасного програмно-апаратного забезпечення [39, 24, 25, 27-29].
Індекс BI 2.0 означає, що на відміну від BI 1.0 передбачена інтеграція з мережевими KMS, ін. [26, 25]. Особливості запропонованих моделей
розглянуто у п.п. 1-3.
1. Фрейми (Frame – 1‑й елемент FPS/BI 2.0) – основа бази фактів експертної системи.
Факти, що надходять
на експертизу характеризують у спрощеній, "рамковій" формі будь-які об’єкти, події, процеси. За її
результатами елементи фактів записують до слотів системи фреймів. Один екзофрейм
характеризує звичайно один факт [5]. Він також може характеризувати один етап процесу,
ін. Тоді весь процес (послідовність етапів), можна визначити і позначити у результатах
експертиз за допомогою алгоритмів Data Mining для пошуку асоціацій
і послідовностей. Для позначення можуть використовуватися числові, лінгвістичні або число-лінгвістичні оцінки.
На відміну від
традиційної ES, в ES/BI 2.0 база
фактів з результатами експертиз обов`язково накопичується у Data Mart (кіоску даних) у внутрішній
підсистемі, яка може мати вбудовані чи клієнтські засоби OLAP, Data Mining й інші засоби Business Intelligence, і (або) може
передаватися до зовнішньої підсистеми до групового чи корпоративного сховища даних (Data Warehouse) із більш потужними серверними BI засобами (MS SQL Server 2008 R2, ін.).
Фреймову модель знань чи даних можна реалізувати як розширену ROLAP Star Chema на основі елементів моделі
Six W's, узгодивши її елементи з проблемною
областю роботи аналітиків. При виборі формату елементів знань необхідно врахувати можливість реалізації на них функцій BI 2.0 [39]. Для забезпечення потреб часткових областей інформаційно-аналітичної роботи до Six W's додано
нові (New) елементи:
- KNOW‑FORECAST (ЗНАТИ прогноз), адже прогнозування (forecast), передбачувальна
аналітика (predictive analytics) є базовою задачею Knowledge
Discovery and Data Mining, Business Intelligence й Performance Management, Analytic
Applications, ін. [11—13, 23];
- KNOW-AS MUCH (ЗНАТИ скільки), адже без кількісних оцінок
неможлива повноцінна підтримка прийняття рішень, яка використовує також нечітку
логіку (fuzzy logic) [6-8];
- KNOW-X, де X – множина елементів
метазнань для даної проблемної області роботи, для прикладу, її елементом може
бути KNOW-sourCe (ЗНАТИ джерело інформаціІ);
- ін.
Розширену модель метазнань позначено SixW's/BI 2.0, а зміст її елементів:
Елементи KNOW‑FORECAST і KNOW‑AS MUCH є обов’язковими для підтримки рішень, адже прогнозують
можливі результати та акцентують необхідність кількісних оцінок. Тому модель SixW's/BI 2.0 більше узгоджена з Business Intelligence і з принципами Knowledge Management, адже спеціалісти-носії Tacit Knowledge й Implicit Knowledge у сфері
KNOW-FORECAST й KNOW-AS MUCH є важливим ресурсом
будь-якої корпорації.
Елемент KNOW-FORECAST дозволяє виокремити цю невелику,
але дуже цінну групу носіїв знань у KMS, яку не можуть замінити будь-які автоматизовані засоби, проте можуть значно підвищити можливості досвідчених професіоналів.
2. Продукційні правила (Production system (rules) – 2‑й елемент FPS/BI 2.0) реалізовані у "процедурах-демонах" й "процедурах-слугах" на основі правил подібних до "якщо... то... інакше... ", які приєднані до
слотів фреймів (протофреймів) і забезпечують багатокритерійне логічне виведення
на елементах фактів. У базах даних вони давно реалізовані як alerts, проте в ES/BI вони можуть бути приєднані до більш складних подій згідно функцій OLAP, Data Mining, Text Mining, Image Mining, ets. У веб їх аналогами є "боти" (bots), які у недалекому майбутньому будуть відповідати вимогам Тюрінга до artificial intelligence [5].
3. Семантичні
мережі (Semantic network – 3‑й
елемент FPS/BI 2.0) використовуються як ускладнені результати логічного
виведення експертної системи і розширюють його можливості. Вони можуть містити:
- відомості та
засоби «дружньої допомоги» користувачам шляхом їх з’єднання з експертами, які є
носіями Tacit Knowledge й Implicit Knowledge у мережевій KMS та в Інтернеті (у
соціальних мережах, ін.), чиї знання з різних причин не повністю формалізовані у внутрішній підсистемі;
- додаткові елементи
Explicit Knowledge для поглибленої
інтерпретації логічного виведення, у тому числі у приєднаних діагностичних системах
на гіпермедійних семантичних мережах з переходом між їх вузлами відповідями на
запитання «ЯКЩО…ТО…»;
- елементи DSS/BI 2.0 та GIS/BI 2.0 із заздалегідь
складеними алгоритмами аналізу, які можуть активуватися логічним виведенням;
- інформаційно-аналітичні й бойові програмно-технічні
засоби віддаленого управління пристроями, які після сигналу ES/BI 2.0 переходять до
активних дій по зв’язаному алгоритму або згідно внутрішніх цілей під керівництвом людини чи без неї, з повідомленням оператора чи без повідомлення. Таке управління повинне передбачати відповідь у разі його перехоплення конкурентами.
Отже, гібридна трикомпонентна
модель подання знань FPS/BI 2.0 є подальшим
розвитком гібридної двохкомпонентної фреймово-продукційної
моделі, яка є основою відомої традиційної архітектури експертної системи продукційного типу з логічним виведенням за
зразками. Вона відрізняється насамперед наявністю гіпермедійних семантичних мереж, які
розширюють можливості логічного виведення експертної системи та технологічною адаптованістю її елементів для аналізу засобами Business Intelligence. Для цього введені число-лінгвістичні оцінки (ЧЛО).
Моделі FPS/BI 2.0 та SixW's/BI 2.0 забезпечують синергетичну інтеграцію компонентів
ES/BI 2.0, DSS/BI 2.0, GIS/BI 2.0, ін.
Вони повинні
бути загальнокорпоративними і мати незмінну для всіх статичну частину і спеціальні для окремих користувачів чи їх груп темпоральні частини. Така можливість
підтверджена у [19], як доповнення до [18]. На статичну й темпоральну частини доцільно розділити й програмне забезпечення та моделі аналізу.
Для
ілюстрації логічного виведення експертної системи, його елементи часто подають у таблиці,
яка названа «матрицею знань» [8].
Для ES/BI 2.0 розроблено варіант удосконаленої матриці знань, яка подана у табл. 1.
Вона відрізняється від запропонованих
у [8, 24, 25] введенням множин
елементів T1j, Zk, T2j, Yj та збільшеною кількістю значень Rj.
Логічне виведення на Хij, T1j, Rj описане у [24, 25], тому розглянемо
особливості, які не описані раніше.
Результати експертиз, що відповідають
елементам множин Хij, T1j, Zк, T2j, Yj аналізують засобами OLAP, Data Mining, Visual Mining і використовують як
ключові індикатори діяльності (Key Performance Indicators, KPI) у простих інструментальних панелях (Dashboards, spark lines, micro and bullet charts, ін.) та у більш складній оціночній карті-агрегаті (Scorecard),
яка зв’язує їх з груповими й корпоративними цілями у загальній стратегічній
схемі. Доцільно будувати Scorecards з
урахуванням методик Balanced Scorecard або Six Sigma, або ін. [11-13].
Множина Zк (k=1…f, де f – номер
репліки гібридної системи) відображає
ідентифікатори екземплярів ES/BI 2.0.k у
корпоративній системі. Ії значення можуть входити до метаправил логічного
виведення, які при однакових елементах Хij у різних екземплярах виводять різні
результати, а також використовуються для групування результатів експертиз під
час аналізу засобами OLAP, Data Mining, ін.
Множина Yj, (j=1…g, де g – номер
продукційного правила розпізнавання факту) відображає ідентифікатори фактів, які виведені за результатами експертиз (застосування продукційних правил). Ці значення можуть підтверджуватися користувачем, якщо
експертне продукційне правило попереджає (виводить питання) щодо доцільності додаткового аналізу за допомогою Rj.
Ідентифікатори Yj
можуть отримувати також не розпізнані набори вхідних елементів:
- невідомі факти, для
яких треба розробити нові продукційні правила розпізнавання;
- відомі факти, у
описі або у правилах виявлення яких допущені помилки;
- інформаційний шум.
Заповнення Yj є донавчанням "з учителем" бази знань ES/BI 2.0 для подальшого добування знань засобами OLAP, Data Mining, ін.
Табл. 1 Матриця знань на моделі FPS/BI 2.0 для ES/BI 2.0
Елементи
лівої частини продукційних правил:
ЯКЩО ...
|
Елементи
правої частини продукційних правил:
ТО ...
|
||||||||
Елементи
фактів, що проходять експертизу і записуються до Data Mart (Хij)
|
Час
виникнення факту, що записується
до Data Mart (T1j)
|
Номер
репліки гібридної системи у груповій
чи корпоративній системі, що автоматично записується до Data Mart (Zк)
|
Час реєстрації
експертизи, що автоматично записується до Data Mart (T2j)
|
Множина
можливих результатів логічного виведення
(Rj)
|
Ідентифікатор факту, який записується
до Data Mart за результатами експертизи (Yj)
|
||||
e1
|
e2
|
e3
|
…
|
en
|
|||||
х111
|
х112
|
x113
|
…
|
x11n
|
t11
|
zк
|
t21
|
R1
= {w1L, w1LU, w1IU, f1I; f1U, f1IU}
|
y1
|
х121
|
x122
|
x123
|
…
|
x12n
|
|||||
x131
|
x132
|
x133
|
…
|
x13n
|
|||||
…
|
…
|
…
|
…
|
…
|
|||||
x1m1
|
x1m2
|
x1m3
|
x1mn
|
||||||
…
|
…
|
…
|
…
|
…
|
...
|
…
|
...
|
…
|
…
|
xg11
|
xg12
|
xg13
|
…
|
xg1n
|
t1g
|
zк
|
t2g
|
Rg = {wgL, wgLU, wgIU, fgI; fgU, fgIU}
|
yg
|
xg21
|
xg22
|
xg23
|
…
|
xg2n
|
|||||
xg31
|
xg32
|
xg33
|
…
|
xg3n
|
|||||
…
|
…
|
…
|
…
|
…
|
|||||
xgm1
|
xgm2
|
xgm3
|
…
|
xgmn
|
Отже, порівняно з
традиційною експертною системою, база знань ES/BI 2.0 розширена за рахунок безшовного зв‘язку з елементами мережевої KMS, а також з базою моделей OLAP і Data Mining, що забезпечує розширення
логічного виведення експертної системи у мережевій KMS та добування нових нетривіальних знань [16, 17] у результатах експертиз.
На рис. 1 у
спрощеній і узагальнені формі показана ES/BI 2.0, яка утворена шляхом об`єднання традиційної експертної системи по зображенню у [1], а також засобів Business Intelligence.
На
рис. 2 показано варіант більш деталізованої архітектури ES/BI 2 на основі запропонованої архітектури у [28].
Як видно з рис. 2, ES/BI 2.0 складається з внутрішньої та зовнішньої
підсистем.
- включенням
Data Mart для накопичення
результатів експертиз, як правило, з клієнтськими чи вбудованими
засобами OLAP, Data Mining, Dashboard, Scorecard, ін.;
- можливістю передачі результатів експертиз до
Data Warehouse із серверними засобами OLAP, Data Mining, Visual Mining, Dashboard, Scorecard та управління, або аналізу з використанням SaaS (як правило, Private Сloud Computing) та Outsourcing, якщо це дозволено вимогами з безпеки
інформації, з урахуванням «золотого
правила» Outsourcing щодо його
використання лише для виконання допоміжних завдань [10];
- включенням
форм оповіщення й діалогу з користувачем (ФОДК), які виводять до зв’язаних
елементів знань в індивідуальній, груповій чи корпоратинвій мережевій KMS; виведення може здійснюватися в
Інтернет у т.ч. до соціальних мереж, якщо це дозволено вимогами з безпеки
інформації, ін.;
- включенням
навчально-аналітичної мультимедійної підсистеми та бази програмних агентів як
автономної модульно-уніфікованої частини групової та корпоративної KMS, яку можуть розширювати користувачі за допомогою
засобів відеозапису та мов рівня 4GL, ін.
Зовнішня
підсистема ES/BI 2.0:
- розширює
функції внутрішньої підсистеми будь-якими засобами, що запускаються логічним
виведенням внутрішньої підсистеми під контролем користувача або без його участі
і які далі функціонують згідно раніше складеного алгоритму або згідно
внутрішніх цілей;
- забезпечує винесення частини знань і виконавчих функцій за межі внутрішньої частини ES BI 2.0, що зменшує
розмір і складність внутрішньої підсистеми, підвищує надійність її роботи, робастність, у
тому числі в автономному режимі з обмеженою функціональністю, ін.;
- забезпечує
поступове нарощування функцій ES/BI 2.0 та розбудову ієрархічно-синергетичної групової
і корпоративної інформаційно-управляючої системи узгоджено з BI 2.0.
Отже, експертна
система, OLAP і Data Mining, мережева KMS можуть використовуватися
окремо, проте їх об’єднання в ES/BI 2.0 забезпечує
значний синергетичний ефект у загальній функціональності, який значно перевищує
ефективність окремо взятих складових, що підтверджено методами групового
експертного оцінювання розробленого прототипу.
При
побудові корпоративної системи, модульно-уніфікована архітектура ES/BI 2.0,
DSS/BI 2.0 та GIS/BI 2.0 із
статичною і темпоральними частинами забезпечує підключення будь-якої кількості підсистем
до центральної системи з необхідною кількість Data Warehouse (або Data Warehouses) подібно до мережево-центричної
концепції. У разі відсутності чи порушення мережевого зв’язку – забезпечується функціонування автономних підсистем як окремих «островів» з
можливістю об’єднання їх інформації у будь-який доступний спосіб.
Така мережево-центрична
«острівна» система дозволяє автоматизувати найбільш важливі «острови» і «вертикальні»
ділові процеси (Business Process) та поступово
нарощувати систему при побудові надійних комп’ютерних мереж і набутті досвіду.
Мережево-центрична «острівна» система також дозволяє поступово будувати «мережевий ергатичний організм» – мережеву людино-машинну систему з
виконавчими пристроями, у якій функції нетривіального добування знань і управління, виконання - гармонійно розділені у єдиному інформаційно-аналітичному управляючому полі між програмно-технічними
засобами і людьми та значна частина цих функцій (крім критичних для безпеки) виконується
з мінімальною участю людей.
Цей підхід до автоматизації у частковій проблемній
області роботи визнано більш ефективним за відому концепцію «єдиного
інформаційного простору» і прийнято для розробки на основі робіт наукової
школи д.т.н. професора Герасимова Б.М. за підтримки інших українських вчених-кібернетиків.
Вперше організмічний
підхід до ергатичних систем розроблено у 1975 р. радянськими українськими кібернетиками
Павловим В.В. за участю Баранова В.Л., Вороніна А.М. ін. які почали цю роботу в Інституті кібернетики України під керівництвом В.М. Глушкова[41].
Провідні
бізнес-корпорації, які акумулюють світові фінансові ресурси, вже реалізують по
суті мережеві ергатичні організми з управлінням, що засноване на нетривіальних знаннях. Насамперед,
це Microsoft, а також Google, адже їх KMS/Business Intelligence/GIS системи, до яких
включені бажаючі користувачі, розвиваються по суті як ефективні глобальні мережеві
ергатичні організми в Інтернеті.
Є системи, які можна розглядати як окремі
ергатичні організми в Інтернеті, адже багато їх функцій виконують програмні
агенти. Для прикладу, найбільш авторитетний в області Knowledge Discovery and
Data Mining сайт KDnuggest.com («Відкриття самородків знань»), який створив засновник
цього наукового напрямку Г. Пятецький-Шапіро (G. Piatetski-Shapiro) –
у 1989 р., у США. Він народився у сім‘ї відомого радянського математика, чиї
батьки до переїзду до м. Москви жили у м. Бердичеві на Україні. У
1970-х роках емігрував з батьком до Ізраїлю, який у 1989 р. отримав премію
Вольфа для видатних світових математиків. Втрата для держави таких науковців є
наслідком грубого порушення принципів Knowledge Management на загальносистемному рівні.
У повсякденній інформаційно-аналітичній роботі потрібні не тільки
складні експертні системи, але й прості – з невеликою кількістю правил
логічного виведення. Адже людина допускає помилки навіть при однокритерійній експертизі.
З ростом напруженості роботи й ускладненням експертних правил, помилки ростуть
експоненційно [7]. Запропонована ES/BI 2.0 забезпечує
гармонійний розділ функцій між програмно-технічними засобами і людьми, залишаючи
їм творчі функції, які проблематично реалізувати за допомогою обчислювальних
методів та Artificial Intelligence.
Для розробки й експлуатації ES/BI 2.0 та DSS/BI 2.0 потребують удосконалення
рекомендації до фахівців: DSS/BI Analyst (аналітик); Business Intelligence
Engineer (інженер); Business Intelligence Project Manager (менеджер проекту); DSS/BI Designer (конструктор); DSS/BI Project Lead (керівник
проекту), ін. Ці спеціальності вивели програмні агенти indeed.com та ін. 07.07.2011 р.
у перших 10‑ти записах Google з українським інтерфейсом після запиту DSS BI 2.0
(DSS/BI 2.0).
Після настання ери Business Intelligence та ери
Zettabyte (Big Data) [10, 21] зростає роль структур керівників: CEO –
Chief Executive Officer (загальне керівництво); CSO – Chief Science Officer
(наукові дослідження); CKO – Chief Knowledge Officer (управління знаннями –
Knowledge Management); CDO – Chief Data Officer (обробка інформації з
використанням Knowledge Discovery and Data Mining); CLO – Chief Learning
Officer (навчання); CIO – Chief
Information Officer (інформаційні технології); CISO – Chief Information
Security Officer (інформаційна безпека), ін.
Це особливо важливо для
корпорацій, які створюють знання як основний вид вихідної продукції.
Для
прикладу, першим CDO й одночасно старшим віце-президентом компанії Yahoo!, яка
стала однією з найбільш потужних з пошуку у Web та у галузі е-комерції, був
співзасновник ACM SIG KDD Усама Файяд (Usama Fayyad). Він у різний час
був керівником спеціальної дослідницької групи з Data Mining у Microsoft
Research, державним експертом у області Government Data Mining (державні
програми США), є головуючим останніх конференцій ACM SIG KDD та засновником і
CEO компанії Open Insights, яка спеціалізується з Business Intelligence і
зв‘язаних технологій.
Дослідна
експлуатація прототипів ES/BI 2.0 та DSS/BI 2.0 показує, що їх користувачів узгоджено
із запропонованими у [22] за рівнем
підготовки можна розділити на 4 групи.
1. Читач
звітів (Report Reader) – може вводити елементи опису фактів для експертизи та
користуватися ФОДК, Dashboard і Scorecard без навиків їх редагування.
2. Читач
та розробник простих звітів (Information Browsers) має додаткові навики: використання
клієнтських засобів OLAP для евристичного аналізу результатів експертиз
(інтерактивні зведені таблиці, діаграми схеми); створення за допомогою
вбудованої мови рівня 4 GL процедур логічного
виведення ФОДК у внутрішній підсистемі; створення і розповсюдження відеороликів
у KMS. Доцільне загальне розуміння BI 2.0 згідно
корпоративного тлумачного словника, адже, для прикладу, метафоричне визначення Data Mining у [20] привело до
уточнень у підзвітних документах.
3. Досвідчений
користувач (Advanced User) має додаткові навики: використання клієнтських засобів Data Mining;
створення процедур логічного виведення ФОДК з елементами у зовнішній мережевій KMS.
Необхідні знання BI 2.0,
участь в організації розбудови темпоральної частин групової KMS узгоджено з корпоративною.
4. Потужний
користувач (Power User) має додаткові навики: використання серверних засобів
OLAP і Data Mining; редагування Dashboard і Scorecards для
управління й оповіщення; використання Private Cloud Computing, якщо це дозволено CISO. Необхідні загальні знання стану і тенденцій розвитку BI 2.0 згідно щорічних звітів провідних
консалтингових компаній Gartner, IDC, Forrester та інших, участь в
організації розбудови групової і корпоративної KMS згідно адаптованих принципів Knowledge Management для часткової
проблемної області роботи.
Отже, узгоджено з
BI 2.0, користуватися засобами можуть як офісні працівники (рівні 1‑3) так
і професіонали BI 2.0
високого мультидисциплінарного рівня
підготовки (рівні 3-4).
Розробку ES/BI 2.0 необхідно
здійснювати подібно до експертних систем [6] та
DSS [22]. Проте, група розробників повинна мати
більш мультидисциплінарну підготовку, а їх співпраця потребує більшої
узгодженості для отримання стійкого ефекту синергії знань, умінь і зусиль, адже
частина цих професіоналів не є ієрархічно підпорядкованими.
Організація такої групи є найбільш складним частковим
завданням, яке визначає успішність розробки
системи, тому її особливості планується розглянути у окремій публікації на
основі [39, 42], ін.
Висновки
1. Розроблена архітектура ES/BI 2.0 відрізняється від традиційної узгодженістю з BI 2.0, що полягає, насамперед, в її інтеграції з OLAP, Data Mining, Visual Mining, Dashboard, Scorecard, елементами мережевої KMS та забезпечує:
- розширення функцій логічного виведення експертної системи шляхом його продовження у мережевій KMS, яка також включає об’єкти управління, ін.;
- нетривіальне добування дійсних, нових, корисних і зрозумілих знань [16, 17] у результатах експертиз за допомогою OLAP, Data Mining та інших засобів Business Intelligence;
- безшовну синергетичну інтеграцію складових корпоративної ергатичної системи Business Intelligence/KMS/GIS на модульно-уніфікованих моделях, які мають статичну частину (загальну для всіх) і темпоральні частини (часткові для окремих користувачів і їх груп).
2. Архітектура ES/BI 2.0 може мати різні варіанти реалізації, використовуватися окремо чи у складі DSS/BI 2.0, GIS/BI 2.0, аналітичних додатків. Визначення цих систем передбачає розвиток відповідної класифікації узгоджено із запропонованими у [33, 10-13]. Дефініція «Експертна система» може розглядатися окремо лише у навчальних цілях, тому що у результаті розвитку Business Intelligence й KMS стала функціонально неповною для практики.
3. Запропонована удосконалена гібридна трикомпонентна модель подання знань FPS/BI 2.0 (Frame, Production system, Semantic network/Business Intelligence 2.0) є подальшим розвитком відомої гібридної двохкомпонентної фреймово-продукційної моделі [39]. Вона відрізняється використанням гіпермедійних семантичних мереж, що забезпечує розширення логічного виведення експертної системи у мережевій KMS узгоджено з BI 2.0, безшовну синергетичну інтеграцію складових Expert system/Business Intelligence/KMS/GIS.
4. Запропонована удосконалена модель метазнань Six W's/BI 2.0 є подальшим розвитком відомої моделі Six W's [40]. Вона відрізняється більшою узгодженістю елементів з BI 2.0, що забезпечує більшу відповідність проблемній області роботи [39], безшовну інтеграцію складових Expert system/Business Intelligence/KMS/GIS, ін.
5. Розроблена ES/BI 2.0 має розширювану користувачами мультимедійну навчально-аналітичну підсистему з базою відеороликів і базою програмних агентів, що забезпечує більш глибоке й оперативне освоєння та розширення користувачами робочих функцій системи згідно часткових потреб, а також розбудову групової й корпоративної KMS.
6. У корпораціях, які створюють знання, вони стали високотехнологічним (hi-tech) видом продукції, яку виробляють відповідні працівники (Knowledge Worker) [37, 11-13, 22, 43]. Запропоновані ES/BI 2.0, DSS/BI 2.0, GIS/BI 2.0 забезпечують підвищення ефективності засобів для добування нетривіальних знань і перетворення їх у більш ефективні рішення. Вирішальне значення для їх реалізації у державних структурах має склад, підготовка та бажання співпрацювати учасників груп розробників і користувачів без фінансової вигоди. Зростає відповідальність структур CEO, CDO, CKO, CLO, CIO, CISO за організацію удосконалення корпоративної культури аналізу. Доцільно ввести кваліфікаційну вимогу до всіх аналітиків щодо уміння використовувати засоби OLAP, Data Mining та інші для вирішення типових аналітичних задач у своїй проблемній області роботи.
7. «Інформаційні суспільства» за останні 10 років переходять на новий рівень розвитку, де вирішальною силою у конкурентній боротьбі для задоволення своїх потреб стає заснована на нетривіальних hi-tech знаннях діяльність – на основі і для добування достатніх ресурсів (людських, інформаційних, фінансових, енергетичних, матеріальних), з використанням інформаційних мереж. Для цього державні підсистеми повинні мати узгоджені стратегії «Big Data» [21], основою яких є стратегії (концепції) реалізації Business Intelligence та відповідних аналітичних додатків у розширеному тлумаченні. У частковій проблемній області роботи окремі питання досліджені, прототип узагальненої концепції запропоновано у середині 2009 р. [27], її актуальність і вірність основних положень підтверджено пропозиціями, що викладені у кінці 2010 р. у [21], ін. Перспективою подальших досліджень є продовження розробки цих проблемних питань для державних підсистем, Збройних Сил України.
Висновки
1. Розроблена архітектура ES/BI 2.0 відрізняється від традиційної узгодженістю з BI 2.0, що полягає, насамперед, в її інтеграції з OLAP, Data Mining, Visual Mining, Dashboard, Scorecard, елементами мережевої KMS та забезпечує:
- розширення функцій логічного виведення експертної системи шляхом його продовження у мережевій KMS, яка також включає об’єкти управління, ін.;
- нетривіальне добування дійсних, нових, корисних і зрозумілих знань [16, 17] у результатах експертиз за допомогою OLAP, Data Mining та інших засобів Business Intelligence;
- безшовну синергетичну інтеграцію складових корпоративної ергатичної системи Business Intelligence/KMS/GIS на модульно-уніфікованих моделях, які мають статичну частину (загальну для всіх) і темпоральні частини (часткові для окремих користувачів і їх груп).
2. Архітектура ES/BI 2.0 може мати різні варіанти реалізації, використовуватися окремо чи у складі DSS/BI 2.0, GIS/BI 2.0, аналітичних додатків. Визначення цих систем передбачає розвиток відповідної класифікації узгоджено із запропонованими у [33, 10-13]. Дефініція «Експертна система» може розглядатися окремо лише у навчальних цілях, тому що у результаті розвитку Business Intelligence й KMS стала функціонально неповною для практики.
3. Запропонована удосконалена гібридна трикомпонентна модель подання знань FPS/BI 2.0 (Frame, Production system, Semantic network/Business Intelligence 2.0) є подальшим розвитком відомої гібридної двохкомпонентної фреймово-продукційної моделі [39]. Вона відрізняється використанням гіпермедійних семантичних мереж, що забезпечує розширення логічного виведення експертної системи у мережевій KMS узгоджено з BI 2.0, безшовну синергетичну інтеграцію складових Expert system/Business Intelligence/KMS/GIS.
4. Запропонована удосконалена модель метазнань Six W's/BI 2.0 є подальшим розвитком відомої моделі Six W's [40]. Вона відрізняється більшою узгодженістю елементів з BI 2.0, що забезпечує більшу відповідність проблемній області роботи [39], безшовну інтеграцію складових Expert system/Business Intelligence/KMS/GIS, ін.
5. Розроблена ES/BI 2.0 має розширювану користувачами мультимедійну навчально-аналітичну підсистему з базою відеороликів і базою програмних агентів, що забезпечує більш глибоке й оперативне освоєння та розширення користувачами робочих функцій системи згідно часткових потреб, а також розбудову групової й корпоративної KMS.
6. У корпораціях, які створюють знання, вони стали високотехнологічним (hi-tech) видом продукції, яку виробляють відповідні працівники (Knowledge Worker) [37, 11-13, 22, 43]. Запропоновані ES/BI 2.0, DSS/BI 2.0, GIS/BI 2.0 забезпечують підвищення ефективності засобів для добування нетривіальних знань і перетворення їх у більш ефективні рішення. Вирішальне значення для їх реалізації у державних структурах має склад, підготовка та бажання співпрацювати учасників груп розробників і користувачів без фінансової вигоди. Зростає відповідальність структур CEO, CDO, CKO, CLO, CIO, CISO за організацію удосконалення корпоративної культури аналізу. Доцільно ввести кваліфікаційну вимогу до всіх аналітиків щодо уміння використовувати засоби OLAP, Data Mining та інші для вирішення типових аналітичних задач у своїй проблемній області роботи.
7. «Інформаційні суспільства» за останні 10 років переходять на новий рівень розвитку, де вирішальною силою у конкурентній боротьбі для задоволення своїх потреб стає заснована на нетривіальних hi-tech знаннях діяльність – на основі і для добування достатніх ресурсів (людських, інформаційних, фінансових, енергетичних, матеріальних), з використанням інформаційних мереж. Для цього державні підсистеми повинні мати узгоджені стратегії «Big Data» [21], основою яких є стратегії (концепції) реалізації Business Intelligence та відповідних аналітичних додатків у розширеному тлумаченні. У частковій проблемній області роботи окремі питання досліджені, прототип узагальненої концепції запропоновано у середині 2009 р. [27], її актуальність і вірність основних положень підтверджено пропозиціями, що викладені у кінці 2010 р. у [21], ін. Перспективою подальших досліджень є продовження розробки цих проблемних питань для державних підсистем, Збройних Сил України.
ДЖЕРЕЛА:
1.Джексон П. Введение в экспертные системы: пер. с англ. // – М. : Изд. дом «Вильямс», 2001. – 624 с.2.Рассел Ст., Норвиг П. Искусственный интеллект: современный подход (Artificial Intelligence. A Modern Approach. Second edition) : пер. с англ. // – 2-е изд. – М. : Вильямс, 2006. – 1408 с.
3.Люгер Дж. Ф. Искусственный интеллект : стратегии и методы решения сложных проблем : пер. с англ. // – 4-е изд. – М. : Вильямс, 2005. – 864 с.
4.Поспелов Г. С., Поспелов Д. А. . Исследование по искусственному интеллекту в СССР. Кибернетику – на службу коммунизму : сб. ст. / под ред. акад. А. И. Берга. //– М. : Энергия, 1978. – Т.9 : Управление и информатизация. – С. 212-236.
5.Алиев Р. А. Абдикеев Н. М., Шахназаров М. М. Производственные системы с искусственным интеллектом // – М. : Радио и связь, 1990. – 264 с.
6.Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. // – СПб.:Питер, 2001. – 384с.
7.Герасимов Б. М., Оксіюк О.Г., Шворов С.А. Проектування та застосування експертно-навчальних систем: Монографія. //– К.: Вид-во Європ. Ун-ту, 2008. – 263 с.
8.Ротштейн О. І. Інтелектуальні технології ідентифікації: нечіткі множини, генетичні алгоритми, нейронні мережі // – Вінниця : Універсум, 1999. – 320 с.
9.Deborah Quarles van Ufford. Business Intelligence. The Umbrella Term (2002). –www.few.vu.nl/en/Images/werkstuk-quarles_tcm39-91416.doc.
10.US Army ESCC (The U.S. Army Enterprise Solutions Competency Center, Army Business Intelligence Competency Center). Business Intelligence Reference Guide. – http://escc.army.mil .
11.Gartner. Magic Quadrant for Business Intelligence Platforms. 27 January 2011. Rita L. Sallam, James Richardson, John Hagerty, Bill Hostmann. – http://www.gartner.com .
12.IDC. Competitive Analysis. Worldwide Business Intelligence Tools 2010 Vendor Share. Dan Vesset. June 2011. – http://www.idc.com .
13.Forrester. The Forrester Wave™: Enterprise Business Intelligence Platforms, Q4 2010 by Boris Evelson for Business Process Professional. October 20, 2010. – http://www.forrester.com .
14.Luhn H.P. «A Business Intelligence System». IBM Journal of Research and Development. Volume 2, Issue 4, October 1958, p.p. 314-319.
15.Codd E. F., Codd S. B., Salley C. T. «Providing OLAP : On-Line Analytical Processing to User-Analysts : An IT Mandate» // E. F. Codd & Associates. – 1993. – 18 p.
16.Gregory Piatetsky-Shapiro. Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop // AI Magazine (© AAAI), 11 (5): Fall 1990, p.p. 68-70.
17.Usama M. Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth. From Data Mining to Knowledge Discovery in Databases. (Chapter 1) // AI Magazine (© AAAI), 17(3): Fall 1996, p.p. 37-53.
18.Bill Inmon. Data Mart Does Not Equal Data Warehouse. InfoManagement Direct, November 1999. – http://www.information-management.com/infodirect/19991120/1675-1.html .
19.Bill Inmon. When Are Star Schemas Okay in a Data Warehouse?.– http://www.b-eye-network.com/view/5626 .
20.A Bill To require reports to Congress on Federal agency use of data mining. 110th CONGRESS, 1st session, S.236. June 4, 2007. – http://www.gpo.gov/ .
21.PCAST (President’s Council of Advisors on Science and Technology). Report to the President And Congress «Designing a Digital Future: Federally Funded Research and Development in Networking and Information Technology». December 16, 2010. – http://www.whitehouse.gov/administration/eop/ostp/pcast .
22.Спирли Э. Корпоративные хранилища данных : планирование, разработка, реализация. Т. 1 : пер. с англ. // – К. ; М. ; СПб. : Вильямс, 2001. – 400 с.
23.Барсегян А.А., Куприянов М.С., Холод И.И., Тесс М., Елизаров С.А. Анализ данных и процессов: учеб. пособие // – 3-е изд., перераб. и доп. – СПб.: БХВ-Петербург, 2009. – 512 с.
24.Круковський І.А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи: військ.-техн. зб. // Академія сухопутних військ. – 2010. – Вип. 3. – С. 26–32.
25.Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111.
26.Neil Raden. Business Intelligence 2.0: Simpler, More Accessible, Inevitable. InformationWeek. February 01, 2007. – http://www.informationweek.com/news/software/bi/197002610.
27.Сімаков В.Л., Круковський І.А. Проблемні питання реалізації Business Intelligence 2.0 у некомерційних сферах роботи // Проблеми створення, розвитку та застосування інформаційних систем спеціального призначення : 18-а наук.-практ. конф., Житомир, 15 кв. 2011 р. Тези доповідей. Ч.1. – Житомир : ЖВІ НАУ, 2011. – С. 194.
28.Круковський І.А. Архітектура експертної системи з розширеним виведенням на трьохкомпонентній гібридній моделі подання знань // Зб. наук. пр. ВІТІ НТУ України «КПІ». – 2009. – Вип. 3. – С. 20–24.
29.Круковський І.А. Проблемні питання розробки і реалізації Geospatial Business Intelligence // Геоінформаційні системи у військових задачах. Другий науково-технічний семінар 21‑22 січня 2011 року. – Львів: Академія Сухопутних військ, 2011. – С. 117-125.
30.AAAI (Association for the Advancement of Artificial Intelligence, formerly the American Association for Artificial Intelligence), AAAI DIGITAL LIBRARY. – http://www.aaai.org/Library/library.php .
31.ACM SIGART (Association for Computing Machinery, Special Interest Group on Artificial Intelligence). ACM Digital Library, SIGART. – http://dl.acm.org/sig.cfm?id=SP918 .
32.ACM SIGKDD (Association for Computing Machinery, Special Interest Group on Knowledge Discovery in Data), ACM Digital Library, SIGKDD. – http://portal.acm.org/sig.cfm?id=SP936 .
33.D.J. Power. Ask Dan! about DSS, Brief History of Decision Support Systems (version 4.1). Editor, DSSResources.COM. – http://dssresources.com/history/dsshistory.html .
34.AKO (U.S. Army Knowledge On-Line). Army Knowledge Management Principles (on Army Knowledge On-Line). – https://www.us.army.mil/ .
35.Dr. Ramon Barquin. The U.S. Army Knowledge Management Principles and their Relevance to Other Organizations. January 4, 2011. – http://www.b-eye-network.com/view/14826 .
36.Polanyi, M. Personal Knowledge. Towards a Post-Critical Philosophy. Chicago: University of Chicago Press, 1958. – 442 p.
37.Nonaka, I. & Takeuchi, H. The knowledge creating company: how Japanese companies create the dynasties of innovation. Oxford: Oxford University Press, 1995. – 304 p.
38.Wilson, T.D. The nonsense of 'knowledge management'. Information Research, Vol. 8 No. 1, October 2002. – http://informationr.net/ir/8-1/paper144.html?referer=www.clickfind.com.au .
39.Герасимов Б.М., Круковський І.А. Методика вибору раціональної моделі подання знань для автоматизованої системи підтримки інформаційно-аналітичної роботи корпоративного інформаційно-аналітичного центру // – Зб. наук. пр. ЖВІ НАУ «Проблеми створення, випробовування, застосування та експлуатації складних інформаційних систем». Технічні науки, 2008. – Вип. 1. – С. 178-187.
40.Wikipedia, Six Honest Serving Men (Five Ws.) From Wikipedia, the free encyclopedia.
– http://en.wikipedia.org/wiki/Five_Ws .
41.Павлов В. В. Начала теории эргатических систем. // – К. : Наук. думка, 1975.
42.Герасимов Б. М., Круковський І. А., Перегуда О. М. Методика оцінювання якості програмного забезпечення систем, заснованих на знаннях // Проблеми створення, випробовування, застосування та експлуатації складних інформаційних систем. Технічні науки : зб. наук. праць / Житомир. військ. ін-т Нац. авіац. ун-ту. – Житомир, 2009. – Вип. 2. – С. 97‑101.
43. Bill Ackerly, Battle Command Knowledge Center. 2nd knowledge management course graduates. Feb 18, 2010. ARMY.MIL, The Official Homepage of the United States Army. – http://www.army.mil/ .
Коментарі