DSS BI 2.0 - система підтримки прийняття рішень на основі Business intelligence 2-го покоління

Раджу прочитати тут статтю про DSS BI 2.0 (Desicion Support System / Business Intelligence 2.0). Стаття зберегла повну актуальністьхоча опублікована  у 2010 році (Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні / І.А. Круковський // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111.) 

Проте, матеріал виданої у 2010 році статті потрібно доповнити. Адже за 8 років після публікації статті  введені такі важливі поняття як Business Intelligence 3.0 (на мою думку це BI Cloud Computing), Network Ergatic Organizm (NEO), Opinion Mining, Sentiment Analysis та інші, що розкриті або тезисно описані у авторських публікаціях, насамперед під час служби і роботи у ЖВІ.

За два роки до  вказаної тут статті, у 2007 році, колега експерт-аналітик вищої кваліфікації,  запитував мене перед доповіддю керівництву: "Business Intelligence 2.0 - це загальноприйнятий термін, чи ти сам його придумав?" Адже у той час поняття BI 2.0 тільки починали формувати, а ми вже пропонували ескіз корпоративної архітектури на основі мережево-острівної концепції, яка  передбачала можливість роботи системи реплік DSS BI 2.0 в ізольованих режимах від мережі, як окремі "острови". Такі модульно-уніфіковані "острови" у разі потреби могли об`єднуватися в інформаційно-аналітичні активні матриці, з яких утворювалися багатовимірні інформаційні аналітичні куби згідно вимог FASMI+ (OLAP+), з підвищеним рівнем захисту інформації, з можливістю автоматизованого управління віддаленими пристроями на основі концепції Network Ergatic organizm (NEO, BI NEO, NEO BI) 

Щодо BI 2.0 ми використовували чудову, зрілу ідею зі статті в InformationWeek: Business Intelligence 2.0: Simpler, More Accessible, Inevitable (Neil RadenBusiness Intelligence 2.0: Simpler, More Accessible, Inevitable (Neil Raden, 02.01.2007).  


Особливості програмної реалізації DSS/BI 2.0 з 2008 р.


Програмною основою DSS/BI 2.0 з 2008 року була запропонована: ієрархічно-синергетична система SQL Server 2008/R2 з OLAP & Data Mining додатками для MSO  Excel (зведені таблиці і діаграми з додатками для Data Mining), MSO Visio (зведені схеми  з додатками для Data Mining); MSO Access (з недокументованими додатками для категоризованих графіків); вбудовані до операційної системи Microsoft елементи Text Mining, додаток Text Mining до SQL Server; додаткові прості ефективні автономні повнотекстові системи з елементами Text Mining. Забезпечена сумісність із популярними корпоративними складними програмними засобами SAP -  на основі MSO Excel згідно рекомендацій Magic Quadrant for Business Intelligence Platforms. 

Також у складі програмного забезпечення для DSS BI 2.0 надані програмні засоби побудови елементів KMS (Knowledge Management System) з елементами  управління віддаленими пристроями за допомогою OLE й гіперпосилань  від засобів і операцій OLAP (консолідація, деталізація, обертання, зрізи, ін.), а не тільки від простих подій у Data Warehouse & Data Marts. Приклад такої алгоритмічно-програмної процедури: ЯКЩО кількість подій (об`єктів, джерел, процесів, ін.) ЗА ЧАС Y (хвилину, годину, добу, день тижня, тиждень, місяць, квартал, рік, ін.) перевищує значення Z, ТО  виконати дію J з оповіщенням користувача і з його підтвердженням чи без нього; після виконання і реєстрації цієї процедури може бути автоматично чи у "ручному" режимі виконаний BI-аналіз результатів зареєстрованих процедур та знову виконане оповіщення чи дія. Ця процедура є прикладом реалізації концепції інтегрованої з Business Inelligece експертної системи на моделі FPS - див.  відповідну статтю. 

Також у програмне забезпечення DSS BI 2.0 були включені засоби створення навчальних відеороликів для користувачів DSS BI 2.0 та наданий комплект навчальних відеороликів початкового рівня.

Урахування особливостей розвитку Artificial Intelligence і баз даних з 1956 року та рекомендацій провідних світових консалтингових компаній Garter, IDC, Forrester забезпечують життєвий цикл програмних засобів і аналітичних моделей DSS BI 2.0 на десятки років. 

У комплект поставки були включені всі програмні засоби, інструкції по їх встановленню, створенню часткових реплік DSS BI 2.0, ES BI 2.0, Spatial DSS BI 2.0, KMS на основі мережево-острівної архітектури. 

Необхідно зазначити, що згідно рекомендацій до  засобів Business Intelligence 2.0, надані програмні засоби забезпечують їх встановлення і розвиток фахівцями-аналітиками всіх рівнів при мінімальній допомозі ІТ-працівників, і при періодичних консультаціях наукових працівників-розробників DSS ВІ 2.0/3.0, ES BI 2.0/3.0, Spatial DSS BI 2.0/3.0, Social Media Spatial DSS BI 2.0/3.0. З певних причин не закінчена розробка й реалізація у 2009/2010 році Концепції дослідної реалізації і використання корпоративної системи BI+KMS на основі системи реплік DSS BI (DSS ВІ 2.0/3.0, ES BI 2.0/3.0, Spatial DSS BI 2.0/3.0, Social Media Spatial DSS BI 2.0/3.0) у мережево-острівній аналітичній системі. Цю роботу життєво необхідно продовжувати.

Деяким стороннім особам з 2008 року демонструвалися засоби тільки на основі MSO Access, тому вони можуть помилково асоціювати DSS BI 2.0 p базою даних на MSO Access.

Визначені у 2008 році ескізи концепції Business Intelligence+KMS (після 2010 року - Big Data Strategy ) та архітектури DSS BI 2.0 дозволяють поступово розбудовувати практично корисні елементи системи систем Network Ergatic Organizm (NEO)яка розвиває концепцію Network-centric System (Network-centric warfare). 

Очевидно, що таку складну, але реалістичну і корисну систему систем важко  уявити і побудувати навіть у теперішній час, тому це потребує значної консалтингової і навчальної роботи, підготовки додаткового класу аналітиків та IT-працівників і вироблення додаткових BI-компетенцій у наявних  спеціалістів. 

Реалізацію ідеї мережевого ергатичного організму з  2008 року офіційно підтримали д.т.н., проф. Герасимов Б.М. (науковий керівник), д.т.н., проф. Баранов В.Л., д.т.н, проф. Коваленко М.В., д.т.н., проф. Воронін О.А. (член Американського товариства математиків), д.т.н., проф. Манойлов В.П., д.т.н., проф. Грабар І.Г., д.т.н., проф. Субач І.Ю. (опонент), к.т.н., доц. П`ясковський Д.В.(науковий керівник), к.т.н., доц. Колос Ю.О., к.т.н., с.н.с. Перегуда О.М., к.т.н., доц. Кондратенко С.О.; Сімаков В.Л., Нестерук В.Г., Валюх А.І.,  Гаврилюк В.Л. (SemanticForce, CEO), Хомів Б.А. та багато інших досвідчених наукових і науково-педагогічних та практичних працівників високого експертного рівня різних ієрархічних рівнів. 

У теперішній час видно, що концепція мережевого ергатичного організму по суті реалізована у web системах Google і Microsoft, у інших веб-системах. Специфічні елементи мережевих  ергатичних організмів реалізовані у багатьох корпоративних системах (стільниковий зв`язок, банківські мережі,  військові розвідувально-ударні системи на базі БПЛА, ін.)

З часу публікації статті з архітектурою DSS BI 2.0 також додатково визначене нове покоління - Business Intelligence 3.0 (BI 3.0). Цей термін вперше введений мною у 2010-2011 роках як BI 3.0/Cloud Computing, тобто Business Intelligence "у хмарі" . Приблизно одночасно поняття BI 3.0 введено у компанії Panorama Software з  підтримкою підрозділу BI Microsoft - для позначення їх революційної BI-платформи Panorama Necto, яка тоді не не мала реалізації на Cloud Computing. Див. студентську статтю на сайті Система+:  "Microsoft та Panorama – краще разом для Business Intelligence".  

Особливості BI 3.0 ми конструктивно обговорювали з авторами альтернативного визначення - у листуванні з директором по маркетингу Panorama Software Kseniya Savelyeva. На мій погляд, революційність BI Panorama Necto полягає насамперед у найкращій реалізації інтегрованої системи BI+KMS (Knowledge Management System). 

У 2013 році студенти ННП Житомирського військового інституту на лабораторній роботі по СППР/DSS використовували  люб`язно надану мені для оцінки  нову методику BI Decision Matrix (BI Comparison Matrix) компанії Panorama Software – для оцінки ефективності платформ Business Intelligenece. Результатом лабораторної роботи стала також публікація студентської статті на сайті Система+ "Методика BI Decision Matrix (BI Comparison Matrix) компанії Panorama Software – для оцінки ефективності платформ Business Intelligence у навчальному процесі". Найбільш активний учасник перекладу на українську мову методики BI Decision Matrix  студентка групи БІКС (спеціальність "Безпека інформаційно-комукаційних систем") Катерина Сержанська, яка у результаті отримала особисте запрошення для подальшого спілкування з представником відділу маркетингу Panorama Software. 
Круковський Ігор Анатолійович, сайт Система+, сайт Business Intelligence+KMS? блог BI & DSS



Також з використанням системи показників  методики BI Decision Matrix Panorama Software мною сформовані внутрішні пропозиції для удосконалення методики оцінки ефективності BI платформ, яка розроблена нами у співаторстві з Герасимовим Б.М. та Перегудою О.Ю. на основі використання  методу аналізу ієрархій Сааті (МАІ) з OLAP i Data Mining для оцінки ефективності АСПІАР КІАЦ (Автоматизованої системи підтримки інформаційно-аналітичної роботи корпоративного інформаційно-аналітичного центру),  див: Герасимов Б.М., Перегуда О.М., Круковський І.А. Методика оцінки ефективності автоматизованої системи підтримки інформаційно-аналітичної роботи (Київ – 2008, ВІТІ НТТУ КПІ). 

На відміну від вказаної вище назви опублікованої статті у 2010 році про DSS BI 2.0, початкова назва статті та її зміст були ближчими до оборонної тематики, тому подаються тут у "демілітаризованій" формі:


Питання РеалізаціЇ Business Intelligence у підсистемах національної безпеки і оборони

На основі ретроспективного аналізу розвитку і застосування Business Intelligence (BI) розроблено пропозиції з реалізації  у підсистемах національної безпеки і оборони концепції дослідної експлуатації системи Business Intelligence + KMS (Knowledge Management System). Її програмно-аналітичною основою може стати узагальнена архітектура системи підтримки прийняття рішень на основі BI другого покоління, позначена як DSS ВІ 2.0 (Decision Support System, BI 2.0). Вона відрізняється: виокремленням підсистем комплексної візуалізації; включенням засобів створення відеороликів; можливістю адаптації модульної архітектури відповідно до проблемної області роботи; включенням програмних агентів з функціями експертної мінісистеми і елементів Text Mining, ін.

© І.А. Круковський, 2010
   

Вступ. Постановка проблеми. За останні два десятиліття у сфері аналізу інформації все частіше вживають термін «Business Intelligence» (BI) [1–8]. Області застосування цієї узагальненої концепції і технології найбільш строго можна визначити відповідно до застосування її найбільш «інтелектуальної» складової Data Mining, що більш широко тлумачать як Knowledge Discovery and Data Mining (KD&DM): управління бізнес-відносинами з клієнтами, виявлення фактів фінансового шахрайства, прямий маркетинг, оцінка кредитних ризиків, біотехгеноміка, мережевий аналіз і пошук, телекомунікації, використання Інтернету, наука, страхування, роздрібна торгівля, інвестування, медицина й фармацевтика, виробництво, державне управління й оборона, електронна комерція, туристичні послуги, безпека й антитерор, охорона здоров’я, антиспам, дозвілля й музика, банки та ін. [9]. Провідні консалтингові компанії Гартнер (Gartner, Inc), Форрестер (Forrester Research, Inc), IDС (International Data Corporation) і незалежні аналітики відзначають ріст використання та розширення ВІ, з урахуванням критичних зауважень [2–6]. За останні 5 років на основі ВІ 1-го покоління (ВІ 1.0) визначають оновлену концепцію і технологію 2-го покоління (ВІ 2.0). В умовах фінансової рецесії ВІ-інструменти розглядають як життєво важливі для забезпечення більш осмислених, гнучких і ефективних рішень. Згідно з щорічними оцінками компанії Гартнер у 2006–2010 роках, ВІ знаходиться на перших місцях у рейтингу 10-ти найактуальніших інформаційних технологій [2].
Огляд останніх досліджень і публікацій. Пошукові системи Інтернету після запиту за фразою «Business Intelligence» повертають приблизно таку кількість записів: Yahoo – 433∙106; Nigma 2 – 73∙106; Bing (Microsoft) – 60∙106; Google – 36∙106; Яндекс – 8∙106
Проте аналіз перших десятків відібраних публікацій, а також друкованих видань показує, що складно сформувати однозначне тлумачення ВІ: у Вікіпедії відсутня відповідна українська сторінка; є суперечливі тлумачення й переклади терміну («ділова аналітика»; «бізнес-аналітика»; «бізнес-аналіз»; «бізнес-інтелект»; «бізнес-розвідка», яку асоціюють з конкурентною розвідкою (Competitive Intelligence, CI), її частковою формою або доповненням); складові технології ВІ окремо розглядають на авторитетних конференціях і семінарах спорідненої спрямованості (DSS, KDD&DM, бази даних, штучний інтелект, нейромережі й генетичні алгоритми та ін.), тому у деяких виданнях їх розглядають без узагальнюючого позначення терміном ВІ; в Інтернеті розміщені публікації до 2005 р., де використовується позначення ВІ, хоча вони стосуються ВІ 1.0, а деякі реплікуються у теперішній час, наприклад, щодо архітектури СППР та ін.
Особливо ускладнюється визначення змісту ВІ 2.0 у зв’язку з доповненням визначеннями «Business Analytics Software» («Програмне забезпечення бізнес-аналітики») і «Business Performance Management» («Управління ефективністю бізнесу») [4, 7], а також розширенням і комплексуванням додаткових часткових технологій ВІ. 
Так, до ВІ 2.0 інтегрують технології програмних агентів і Mining технології добування знань: з текстів (Text Mining); з Інтернету (Web Mining), у тому числі із соціальних мереж (Social Networks Mining); з мультимедійної інформації (Multimedia Data Mining), у тому числі із зображень (Image Mining), з відео (Video Mining), з аудіо (Audio Mining); з процесів (Process Mining), у тому числі в режимі реального часу (Real-Time Data Mining). Використовується удосконалена візуалізація результатів аналізу: Visual Mining; нові індикаторні панелі (Dashboards) і графіки (spark lines, micro and bullet charts та ін.); системи збалансованих показників (Scorecards) [7, 10, 11]. Розробляються ВІ-інструменти на основі: «стовпчикових» баз даних (Column-oriented databases); обробки всіх даних в оперативній пам’яті (In-memory); обчислень «у хмарах» (Software as a Service, SaaS); багатопроцесорних систем і багатоядерних процесорів [2–11]. Найбільшу увагу приділяють аналізу надвеликих (терабайтних) баз даних в Інтернеті й у деяких комерційних і наукових базах даних, але значна увага приділяється й розробці настільних (desktop) ВІ-інструментів для аналізу звичайних масивів інформації на кожному робочому місці з обробки інформації [2, 5]. Аналіз публікацій минулих років [12–14] показує, що основи часткових ВІ-технологій розроблені ще в 1960-х роках - у роботах зі статистичної теорії розпізнавання та пізніше в роботах зі штучного інтелекту (Artificial Intelligence, АІ) і в роботах, що розвивали теорію баз даних та ін. Схожість раніше відомих технологій із сучасними є не недоліком, а підтвердженням розвитку «спіралі знань» відповідно до діалектики Гегеля. 
Не дивлячись на те, що конкуренція, суперечливість і взаємопроникнення ВІ-технологій є у цілому позитивним процесом, який забезпечує розвиток, проте він ускладнює їх розуміння можливими користувачами, підвищує вартість консалтингу й тому стримує впровадження, насамперед у проблемних областях некомерційної роботи.
Метою статті є представлення узагальненої архітектури системи підтримки прийняття рішень, яка умовно позначена як DSS ВІ 2.0 (Decision Support System, Business Intelligence 2.0) і розроблена для визначених проблемних областей аналітичної роботи на основі ретроспективного аналізу розвитку узагальненої технології від ВІ 1.0 до ВІ 2.0.
Викладення основного матеріалу. Дослідження стосується, насамперед, тих часткових проблемних областей роботи, де проводять аналіз структурованої число-лінгвістичної інформації для формування вихідної аналітичної продукції у текстово-графічних файлах. Не розглядаються особливості Web Mining і Multimedia Mining, ін.
У зв’язку зі значними суперечностями у тлумаченні й перекладі терміну ВІ, далі викладені узагальнені результати аналізу його лінгвістичних, семантичних і прагматичних особливостей.
1. Згідно з [15], перше визначення «Business Intelligence», яке не набуло широкого розповсюдження, зафіксоване у 1958 р., у журналі «IBM Journal», у статті «A Business Intelligence System», у якій науковий співробітник компанії Ганс Петер Лун (Hans Peter Luhn) запропонував однойменну з назвою статті структуру автоматизованої системи для реєстрації, реферування, кодування вхідних і внутрішніх документів організації, їх зберігання та вибіркового розповсюдження серед користувачів (окремих фахівців і груп) відповідно до їх профілів у системі [16]. У статті визначено термін «business» – діяльність для досягнення цілей у сферах науки, технології, торгівлі, промисловості, правочинства, уряду, оборони та ін. Також визначено, з посиланням на тодішню редакцію словника Вебстера (Webster’s New Collegiate Dictionary), термін «intelligence» – здатність розуміти взаємні зв’язки представлених фактів таким чином, щоб діяти в напрямку до бажаної мети. Неврахування цих маловідомих визначень у теперішній час викликає суперечливе розуміння ВІ і звужує області застосування. Краще з’ясувати зміст статті дозволяє також аналіз частоти вживання значущих слів: «…system…» – 69; «document…» – 67; «information» – 61, у т. ч. «information retrieval» (пошук інформації) – 9; «action point» («активні точки», робочі місця користувачів системи) – 60; «…pattern…» (шаблон (документа, запиту тощо)) – 35; «…dissemination…» (поширення (інформації, документів)) – 16; «a business intelligence system» – 9; «intelligence system» – 2; «analysis» – 2; «business intelligence problems» – 1; «intelligence» – 1.
Отже, у статті визначено термін «A Business Intelligence System» та представлена структура системи, яка тепер асоціюється із системами управління електронними документами (Electronic Document Management, EDM), системами управління контентом підприємства (Enterprise Content Management, ECM) та ін. Компанія ІВМ, яка ввела термін, є одним із провідних розробників цих систем [2–4]. Такі системи часто асоціюють з більш загальним класом систем управління знаннями (Knowledge Management System, KMS).
2. Термін «Business Intelligence», у його теперішньому тлумаченні, запропонував у 1989 р. Говард Дрезнер (Hovard Dresner) [1, 15], який після цього більше 10‑ти років працював у компанії Гартнер науковим співробітником, віце-президентом і був провідним аналітиком за напрямком ВІ. Компанія активно поширювала термін для позначення комплексу «концепцій і методів покращання розробки ділових рішень з використанням систем підтримки, заснованих на фактах» [1, 15]. До цих систем («fact-based support systems») можна віднести, насамперед, DSS на основі баз даних і електронних таблиць, а також експертні системи, бази знань яких містять бази фактів і бази правил і тому належать безпосередньо до AI, до заснованих на знаннях систем (KnowledgeBased System, KBS). Провідні Web‑сайти за цією тематикою і виробники ВІ‑інструментів також наводять подібні визначення, які підкреслюють різні особливості терміну або рекламованих інструментів, для прикладу представлені у [1, 8].
У 1990-х роках сформовані окремі концепції, технології та програмні інструменти, які стали основою синергетичного комплексу ВІ: 



  • сховища даних (Date Warehouses, DWH) та вітрини й кіоски даних (Data Marts, DMarts); 
  • засоби оперативної аналітичної обробки (On-line Analytical Processing, OLAP), які також називають засобами швидкого аналізу розділеної багатовимірної інформації; 
  • засоби «розкопки даних» або «добування знань із даних» (DM, KDD), для яких використовують більш широку й компромісну назву («Knowledge Discovery and Data Mining») і називають також засобами інтелектуального (глибинного) аналізу даних; 
  • засоби вилучення, перетворення, завантаження (Extraction, Transformation, Loading, ETL) даних [11, 17]. 


Тому ВІ називають «терміном-парасолею» («umbrella term»), у якому «полотнище» (узагальнену концепцію) підтримують «спиці» (часткові концепції) [1, 7, 15]. 
У зв’язку зі складністю розробки й підтримки в актуальному стані вузькоспеціалізованих баз знань великих експертних систем вони практично не використовуються у ВІ [6], а їх функції виродилися у спрощені оповіщення про вихід значень контрольованих показників за визначені межі (реалізують за допомогою програмних тригерів), а також у Mining алгоритми класифікації та ін. 
Переваги й недоліки метафор розглядаються у філософії, мистецтві, маркетингу, АІ тощо, наприклад, особливості терміну-метафори Аrtificial Intelligence розглянуто в [14]. 
Формуванню ВІ передували публікації, у яких використані такі дискурси, як «Artificial Intelligence Business», «Commercial uses of Artificial Intelligence», «Artificial Intelligence applications for Business» та ін., що відображали пошук науковцями шляхів виведення Artificial Intelligence за рамки «науки для науки» на рівень практичної, а отже, бізнесової (ділової) значущості. Навіть по заголовках тем публікацій видно, що вони не могли не вплинути на формування BI.Технологія ВІ стала настільки розповсюдженою, що компанія Гартнер щорічно публікує звіти з порівнянням ВІ-платформ різних постачальників, які містять діаграми з метафоричною назвою «Magic Quadrant for Business Intelligence Platforms», останні зображено на рисунку 1.  


Magic Quadrant for Business Itelligence 2009-2010


«Magic quadrant» – зареєстрована торговельна марка (trade mark) консалтингової компанії Gartner (Гартнер), яка, ймовірно, є композицією інших термінів. Так, у математиці квадрантами (Quadrants) називають чверті розділеного двома перпендикулярами простору, а термін-метафору «Магічний квадрат» («Magic square») використовують також як засіб передбачення у магії, нумерології. 
У «Magic quadrant» місця постачальників (вендорів) визначають за критеріями «ability to execute» («здатність виконання», ЗВ) й «completeness of vision» («повнота бачення», ПБ) та відносять їх до таких груп вендорів: «leaders» («лідери») – високий рівень ЗВ і ПБ; «challengers» («претенденти») – високий рівень ЗВ і нижчий рівень ПБ; «visionaries» («провидці») – нижчий рівень ЗВ і високий рівень ПБ; «niche players» («гравці ніші») – нижчі рівні за обома критеріями, проте увійшли до рейтингу. 
Оцінки Гартнер визнають усі провідні постачальники ВІ-платформ (Microsoft, IBM (приєднала Cognos)), Oracle (приєднала Hyperion) та ін., проте деякі не згодні з низькими оцінками. 
Ще одна провідна консалтингова компанія Forrester (Форрестер) теж зробила вагомий внесок у підтримку ВІ, публікує «Forrester Wave™: Enterprise BI Platforms» – діаграми у формі квадрата з оцінками ВІ-платформ підприємств (Enterprise), де групи постачальників розмежовуються стилізованими хвилями (Wave) [3].
Отже, консалтингові компанії активно розробляють і використовують терміни-метафори для маркетингового позначення своїх інноваційних технологій, а «Business Intelligence» є загальновизнаним терміном-метафорою у сфері інформаційних hitech, що розмежовує конкурентне середовище постачальників. Термін створює привабливо‑таємничий імідж для користувачів комерційної сфери і тому підтримує високий рівень збуту комплексів ВІ‑інструментів, проте відіграє негативну роль для можливих користувачів у проблемних областях, що виходять за рамки прагматики його дослівного тлумачення й перекладу. Адже business на пострадянському просторі тлумачать неточно і однозначно прив`язують до комерції. 
Компанія IDC вводить більш широку таксономію, у якій найвищою ієрархічною категорією є «Business Analytics Software», куди включає «Performance Management and Analitic Software» («Управління ефективністю й аналітичні додатки») і «Business Intelligence Tools» (BI-інстру­менти), які розміщені над «Data Warehouse Platform» [4]. Не вдаючись у певні суперечності й недоліки цієї таксономії, зазначимо, що використання авторитетною компанією терміну «Business Analytics» («бізнес-аналітика», «ділова аналітика») свідчить про неадекватність такого ж перекладу і тлумачення терміну «Business Intelligence» («бізнес-аналітика», «ділова аналітика», «бізнес-аналіз»). 
Переклад ВІ як «бізнес-інтелект» є більш адекватним, проте неблагозвучним. 
Необхідно визнати, що переклад ВІ як «бізнес-розвідка» звужує поняття «business» й «intelligence», які визначені у [16], тому що використання технології ВІ у СІ (розвідці легальними методами в бізнесі) є лише одним з її багатьох застосувань [9–11, 19].

У зв’язку з тим, що ВІ використовується для підтримки прийняття рішень, то синергетичний комплекс ВІ-інструментів часто зображають у формі СППР, яку позначають як Decision Support System (DSS) [11]. Проте, існують й інші типи DSS (СППР), класифікації яких показані для прикладу в [15, 18].
 Згідно з [15], даний тип DSS віднесено до орієнтованих на дані (Data-driven DSS). Проте комплекси засобів BI можуть мати також функції DSS, що орієнтовані: на моделі (Model-driven DSS); на знання (Knowledge-driven DSS); на Web (Web-based DSS); на документи (Document-driven DSS); на групову роботу (Group DSS) та ін. Тому для відрізнення від інших типів архітектуру DSS [11], яка розроблена на основі ВІ 1.0 і зображена на рисунку 2, у статті пропонується позначати як DSS BI 1.0. Подібні архітектури відомі з середини 1990-х років, часто їх зображали як «піраміду ВІ» (ВІ 1.0) [1].



BI DSS, DSS BI 1.0, Decision Support System, Business Intelligence 1.0


3. Хоча об’єднання ВІ‑інструментів у спеціалізовані корпоративні набори (Enterprise BI suites, EBIS) та комплекси загального призначення (ВІ-платформи) дає потужний синергетичний ефект, проте спочатку їх розробляли та використовували як окремі засоби. Тому часто не використовують узагальнюючий термін ВІ, а досліджують окремі (часткові) технології. Краще зрозуміти сутність і перспективи ВІ дозволяє розгляд наукового шляху одного із засновників KDD DM Gregory Piatetsky-Shapiro (Григорія Пятецького‑Шапіро) [9, 19]. Він народився у сім’ї видатного вченого-математика Іллі Пятецького‑Шапіро, закінчив радянську математичну спецшколу, під час подальшого навчання в Ізраїлі захопився програмуванням і Аrtificial Іntelligence, у США захистив дисертацію по застосуванню АІ у базах даних – це визначило напрямки подальших досліджень. У 1988 р., після семінару з DM на конференції Американської асоціації зі штучного інтелекту (American Association for Artificial Intelligence, АААІ), він висунув ідею щодо доцільності більшого фокусування досліджень з DM. У 1990 р. його батьку як видатному математику сучасності присвоїли премію Вольфа. У 1989–1993 рр. Г. Пятецький-Шапіро ініціював перші три семінари за тематикою «Knowledge Discovery in Databases» («Відкриття знань у базах даних»), тому що вважав цей термін привабливішим за «Data Mining». Пізніше «Databases» («бази даних») у KDD замінено на термін з більш широким тлумаченням «Data» («дані»), що не змінило скорочене позначення (KDD vs KD). У 1994 р. створив один з перших сайтів з KDD, тепер відомий як сайт KDnuggets.com (метафорична назва-скорочення означає «Відкриття самородків знань»). У 1996 р. уточнено термін «Knowledge Discovery in Databases», як процес виявлення корисних знань у даних, а «Data Mining» – як його окремий етап, який потребує додаткової візуалізації інтерпретації аналітиком [9]. Це метафорично схоже на те, як "чаклун" (у даному випадку аналітик KDD DM) інтерпретує результати "чаклування" за допомогою певних засобів (у даному випадку - як аналітик KDD DM інтерпретує часто не зрозумілі непосвяченим результати візуалізації Data Mining). У 1998 р. разом з Усамою Файядом (Usama Fayyad), який став керівником з обробки даних в Yahoo і з 1989 року також зробив вагомий внесок у становлення KDD&DM, а також з іншими колегами організував в Association for Computing Machinery (Асоціації з обчислювальних машин) групу особливих інтересів - ACM SIGKDD (ACM KDD Special Interest Group on Knowledge Discovery in Data). У назвах конференцій з KDD з 1995 року додатково вживають більш широкий і компромісний термін «Knowledge Discovery and Data Mining». Термін «Knowledge Discovery» (KD) більш широкий за KDD і ширший за більш розповсюджений термін Data Mining. Використання терміна KD забезпечує семантично правильне включення Тext Мining  та інших Mining технологій, які розглядаються в ACM SIGKDD. У 2009 р. відбулася вже 15-та конференція ACM SIGKDD, де у традиційному змаганні (KDD CUP) взяли участь біля 1300 команд із 46-ти країн [10]. Участь у спонсорстві конференцій брали АААІ (Association for the Advancement of Artificial Intelligence, раніше American Association for Artificial Intelligence) та ACM SIGMOD (ASM SIG Management of data). Аналіз анотацій публікацій в архіві ACM SIGKDD показує, що до KD&DM активно інтегрують Text Mining та інші Mining технології добування знань зі слабо структурованої інформації [19]. Додатково до KD&DM , в "інтелектуальному аналізі"  іноді виокремлюють нейронні мережі й генетичні алгоритми, machine learning ("машинне навчання") та інше,  що, ймовірно, пов’язано з існуванням відповідних наукових шкіл і ACM SIG. Проте ці методи виникли у біонічному напрямку кібернетики [13], потім увійшли до Аrtificial Intelligence [14], тому їх можливо віднести до KD&DM.
В ACM SIGKDD майже не вживається термін Вusiness Іntelligence, що свідчить, ймовірно, про конкуренцію термінів. Тому в деяких підручниках, для прикладу, в [11], у наступному виданні та в 1-му виданні з рецензією Г.Пятецького-Шапіро, розглядаються Datawarehouse, Data Mart, OLAP, Text Minng й інші Mining й агентні технології послідовно - від ВІ 1.0 до ВІ 2.0 без їх узагальнення терміном Вusiness Іntelligence. Це дезорієнтує великі маси вчених, науково-педагогічних і наукових працівників, програмістів та інших аналітиків й інформатизаторів, які приходять у цю сферу з традиційних сфер автоматизації й інформатизації 
Доцільність використання терміну Вusiness Іntelligence підтверджує такий факт. Один з провідних незалежних консультантів з інформаційних hi-tech Найджел Пендc (Nigel Pendse), який є автором тесту FASMI (альтернативних вимог до OLAP), у теперішній час став редактором Internet-видання The BI Verdict (раніше – знамените видання The OLAP Report) та автором оглядів The BI Survey (раніше – The OLAP Survey), при цьому у 2009 році вийшов The BI Survey 8 [5, 17].
Отже, представлені у п.п. 1–3 результати узагальненого аналізу, дозволяють зробити уточнення, що «Business Intelligence 1.0» – це маркетинговий термін-метафора (не має дослівного тлумачення, перекладу чи синоніма), який використовується для позначення синергетичного комплексу концепцій і технологій аналізу будь-якої структурованої інформації з метою підтримки прийняття рішень з гарантовано більшим корисним ефектом (вигодою у широкому сенсі), порівняно з використанням традиційних баз даних і електронних таблиць. Відокремлений розгляд часткових ВІ‑технологій знижує синергетичний ефект від їх спільного використання та ускладнює розуміння змісту ВІ широкими колами можливих користувачів-аналітиків. DSS є формою побудови комплексу ВІ-інструментів. Проте, кінцеву ціль KD&DM («добування знань» і «розкопка даних») доцільно розуміти не метафорично по назві, а фактично - з урахуванням мети DSS і ВІ – підтримка прийняття рішень у широкому сенсі. Це підтверджують і конкурсні креативні задачі KDD CUP, які спрямовані на забезпечення підтримки прийняття рішень.
Накопичений досвід використання аналітичних додатків на основі першого покоління BI (ВІ 1.0) виявив і недоліки. З урахуванням особливостей визначених проблемних областей роботи до найбільш суттєвих недоліків архітектури DSS BI 1.0 доцільно віднести: 


  • відсутність повнотекстових пошуково-аналітичних засобів з ТМ;
  • не передбачені засоби самостійного створення навчальних відеороликів для конкретних проблемних областей роботи додатково до відео загального призначення на Web‑сайтах розробників;
  • не використані можливості реалізації елементів експертних систем на програмних агентах;
  • відсутні засоби об’єднаної візуалізації результатів аналізу (в т. ч. з Visual Mining) різного рівня узагальнення для різних груп користувачів;
  • не передбачена можливість аналізу й візуалізації у режимі реального часу шляхом підключення засобів OLAP і KD&DM безпосередньо до джерел первинної інформації без використання Data Warehouse;
  • не передбачені додаткові програмні засоби, у тому числі інші Mining засоби;
  • не показані можливості спрощення архітектури DSS шляхом її побудови на єдиних моделях даних і знань на основі схеми «зірка» («star schema»)
  • ін.

Проведений аналіз, з урахуванням тенденцій формування ВІ 2.0, дозволив сформувати на основі архітектури DSS ВІ 1.0 узагальнену модульно-уніфіковану архітектуру СППР, яка позначена як DSS ВІ 2.0 і зображена на рисунку 3.

BI DSS, DSS BI, DSSBI 2.0, Decision Support System, Business Intelligence 2.0


Додатково до вказаного в рамках статті можливо зазначити наступне.
Модульна архітектура забезпечує її реплікацію відповідно до часткових проблемних областей роботи, обраних ВІ‑платформ і фінансового забезпечення. На її основі можна створити автономну систему, клієнт‑серверну або Web-орієнтовану. Для прикладу, настільна (desktop) DSS BI 2.0 може мати підсистеми 1, 2, 5 (5.1–5.4, 5.7), 7, при цьому підсистеми 3 і 4 можуть зливатися з підсистемою 5, яка може бути інтегрованою з підсистемою 2.
Виділення підсистеми 1 пов’язане з доцільністю уніфікованого розміщення інформаційних файлів на всіх ПЕОМ з мережею реплік DSS BI 2.0. Прикладом такого рішення є уніфіковані назви й розміщення каталогів користувачів в операційних системах Microsoft.
У підсистемі 2 можуть використовуватися настільні засоби з ТМ, які спроможні забезпечувати миттєвий повнотекстовий пошук у файлах більше 500 типів з формуванням анотацій і синхронізованим переглядом тексту файлів за пошуковими словами та ін. Деякі з них можуть інтегруватися з базами даних і мають функції контролю за обміном інформацією із зовнішнім середовищем. Можуть використовуватися більш потужні та універсальні засоби, в т. ч. з функціями Multimedia Mining. Розгляд цих засобів виходить за межі статті.
Основу підсистем 3–5 можна розробляти на єдиних моделях даних на основі схеми «зірка», що значно зменшує кількість операцій ETL і тому здешевлює й спрощує створення DSS BI (BI DSS).
Підсистема 5, крім вбудованих засобів візуалізації до OLAP і Mining, містить підсистему комплексної (узагальненої) візуалізації найбільш важливих показників з використанням індикаторних панелей і графіків різних типів (Scorecards, Dashboards, spark lines та ін.) [5, 7]. Одночасне виведення засобами OLAP значної кількості категоризованих графіків (до 30‑ти і більше) потребує використання не менше 2-х моніторів та кольорових друкованих звітів, адже 90 % інформації людина сприймає візуально [12]. Для часткових потреб можна ввести до підсистеми 5.6 додаткові інструменти (оптимізаційні, геоінформаційні та ін.).
Підсистема 6 може забезпечувати пряме (без посередників) оповіщення керівників про критичні зміни рівнів найбільш важливих показників. Оповіщення можуть забезпечити програмні агенти в базах даних первинної інформації, які реалізують функції експертної мінісистеми. Наприклад, трьохкомпонентна гібридна фреймово-продукційна із семантичними мережами модель надання знань FPS (Frame, Production system, Semantic networks) при реалізації на моделі даних за схемою «зірка» дозволяє підготовленим користувачам самостійно розробляти гіпермедійні оповіщення про виявлення визначених наборів значень, позначати їх для аналізу засобами OLAP і DM&KDD, а також автоматично або автоматизовано (після підтвердження користувачем) здійснювати управлінські дії, у т. ч. запускати виконавчі пристрої, відправляти оповіщення на мобільні термінали та ін. [20].
 Важливою умовою успішного впровадження DSS ВІ є простота її використання в умовах завантаженості аналітиків багатовидовою роботою, яка визначає ефективність прийняття безперервного потоку різноманітних рішень. 
Це особливо актуально на початковому етапі, коли переваги системи для користувачів не очевидні, проте очевидна необхідність освоєння складних аналітичних засобів і деякого реінжинірингу процесів накопичення, структуризації й обробки інформації та ін. 
Тому підсистема 7 містить засіб створення навчальних і аналітичних відеороликів для даної проблемної області роботи. Цей засіб підвищує ефективність вилучення найбільш цінних «неявних знань» («Tacit Knowledge») експертів, забезпечує їх авторизацію у доступному визначеним фахівцям банку «явних знань» («Explicit Knowledge»). Цінність таких знань для Knowledge Based Organization ("Організація, заснована на знаннях - термін-метафора) може перевищувати вартість матеріальних активів [18].
DSS BI (BI DSS) є людино-машинною системою, проте широка реклама алгоритмічно-програмних і апаратних можливостей ВІ-інструментів часто перебільшує їх можливості та замовчує аналітичні можливості людини. 
Проте, навіть оператори‑реєстратори DSS ВІ, особливо у разі спеціальної підготовки, можуть суттєво доповнювати та виправляти умовиводи «бізнес-інтелекту». 
Крім цього, DSS BI не розв’язує всі різноманітні задачі аналітиків і управлінців, особливо системних, і не може замінити їх досвід, знання, інтуїцію, аналітичне й управлінське мистецтво. 
DSS BI (BI DSS) є лише одним з комплексів науково-прикладних інструментів для підтримки прийняття рішень -  проте безальтернативним і дуже ефективним у разі умілого використання. 
Досвід беззаперечно підтверджує, що без інструментів DSS BI 2.0 деякі важливі аналітичні можливості (швидкий пошук і аналіз текстової інформації, нерегламентований оперативний багатовимірний аналіз даних, а також їх класифікація, кластеризація, пошук асоціацій і часових послідовностей та ін.) недоступні аналітичним групам будь-якого розміру і досвіду.
Висновки та перспективи подальших досліджень. «Business Intelligence» – це узагальнюючий маркетинговий термін‑метафора, який не має адекватного дослівного тлумачення чи перекладу. Він позначає синергетичний комплекс інформаційних високих технологій (hitech), які забезпечують вилучення, трансформацію й завантаження (ETL) інформації з різних джерел до сховища й кіосків даних (DWH, DMarts) для її приведення до єдиного структурованого формату й подальшого аналізу за допомогою регламентованих запитів і звітів, нерегламентованої багатовимірної оперативної аналітичної обробки (OLAP), інтелектуального аналізу (KD&DM) – з метою підтримки прийняття рішень з гарантовано більшим корисним ефектом, порівняно з використанням традиційних баз даних і електронних таблиць. Визначення терміну ВІ у 1989 р. та формування окремих ВІ-технологій у першій половині 1990-х років (насамперед OLAP і KD&DM) доцільно вважати початком нового витка у спіральній моделі розвитку інформаційних  технологій. За останні 5 років на основі ВІ 1.0 формується удосконалена й розширена технологія ВІ 2.0, яка передбачає: активне використання ВІ для добування знань в Інтернеті (соціальні медіа); використання технологій Інтернету для реалізації ВІ у корпоративних системах; включення технологій добування знань зі слабо структурованої інформації (насамперед з текстової); використання програмних агентів різних типів; удосконалення засобів візуалізації результатів аналізу; підтримку випереджального реагування на можливі проблеми на основі добування знань у режимі реального часу з джерел первинної інформації без використання Data Warehouse; адаптацію до можливостей користувачів різних рівнів підготовки та ін. ВІ-інструменти можна використовувати окремо, проте їх комплексування на єдиних моделях даних і знань дає потужний синергетичний ефект. Засоби ВІ 2.0 доцільно використовувати на всіх робочих місцях з обробки інформації у сферах: науки; освіти; торгівлі; промисловості; правочинства; державних органів управління та ін.
За результатами ретроспективного аналізу особливостей ВІ, відповідно до тенденцій формування ВІ 2.0 і обмежень даної проблемної області роботи, запропонована удосконалена узагальнена архітектура СППР, яка позначена як DSS ВІ 2.0. Вона відрізняється від архітектури DSS на основі BI 1.0 (DSS BI1.0), насамперед: 
включенням пошуково-аналітичних засобів з ТМ; 
наявністю навчально‑аналітичної підсистеми із засобами запису відеороликів, з розширюваними базами навчальних відеороликів і програмних агентів для даної проблемної області роботи; 
використанням інтегрованих з OLAP і DM програмних агентів для режиму реального часу з функціями експертної мінісистеми на моделі знань FPS
виокремленням підсистем об’єднаної візуалізації для аналітиків-користувачів і окремо для керівного складу з можливістю використання мобільних терміналів;
передбаченням можливості спрощення процедур ETL і архітектури за рахунок використання єдиних для всіх підсистем комплексних моделей даних (на основі схеми «зірка») і знань; 
модульно-уніфікована архітектура передбачає реплікацію для часткових проблемних областей роботи, обраних ВІ-платформ та ін. 
Залежно від потреб і можливостей користувачів DSS ВІ 2.0 чи мережа їх реплік може використовуватися для автоматизації роботи: 
окремих аналітиків («крапкова» автоматизація); 
окремих аналітичних груп («клаптикова» автоматизація); 
всіх аналітиків, які обслуговують корпоративні інформаційні процеси та їх комплекси.
Основа цього подібна до взаємодоповнюючих технологій управління бізнес-процесами (Business Process Management) і управління ефективністю бізнесу (Business Perfomance Management) [2, 7]. 
Реалізація DSS ВІ 2.0 забезпечує гарантовані аналітичні переваги, порівняно з використанням DSS ВІ 1.0.
Передбачено опублікувати опис варіанта програмної реалізації прототипу DSS BI 2.0 та удосконаленої методики оцінки ефективності DSS ВІ, напрацювання щодо перетворення системи Business Intelligence+KMS у  мережеві  системи, які наближені за своїми функціями до Network Ergatic Organizm (NEO). Дана концепція пропонується під керівництвом Герасимова Б.М. на основі концепції ергатичного організму, яка запропонована у роботах українського вченого-кібернетика Павлова В.В. при підтримці вчених-кібернетиків Баранова В.Л., Вороніна А.М. та інших українських радянських кібернетиків  в інстуті кібернетики України під керівництвом Глушкова В.М.  у першій половині 1970-х років [21]. Також передбачаються дослідження по інтеграції Business Intelligence з різноманітними традиційними системами і новими спорідненими автоматизованими системами, розробка класифікації DSS BI (BI DSS), розробка дослідної Концепції дослідження і використання Business Intelligence&KMS (Концепції Big Data)  у державних структурах.

ЛІТЕРАТУРА:

1.    Deborah Quarles van Ufford. Business Intelligence. The Umbrella Term (2002) [Електронний ресурс]. – 2007. Режим доступу : www.few.vu.nl/en/Images/werkstuk-quarles_tcm39-91416.doc.
2.    Gartner Research site [Електронний ресурс]. – 2010. – Режим доступу : http://www.gartner.com.
3.    The State Of Business Intelligence Software And Emerging Trends: 2010 by Holger Kisker, Ph.D. [Електронний ресурс]. – 2010. Режим доступу : http://www.forrester.com.
4.    Business Analytics Solutions. An IDC continuous intelligence service [Електронний ресурс]. – 2010. – Режим доступу : http://www.idc.com.
5.        Mark Rittman. News on The BI Verdict, and an Interview with Nigel Pendse. 19.01.2010  [Електронний ресурс]. – 2010. – Режим доступу : http://www.bi-verdict.com.
6.        Business Intelligence 2.0: Simpler, More Accessible, Inevitable. By Neil Raden  [Електронний ресурс]. – 2010. – Режим доступу : http://www.intelligententerprise.com.
7.        Эккерсон У.У. Панели индикаторов как инструмент управления: ключевые показатели эффективности, мониторинг деятельности, оценка результатов : пер. с англ. – М. : Альпина Бизнес Букс, 2007. – 396 с.
8.        В.Артемьев. Что такое Business Intelligence? 24.04.2003. Открытые системы, #04/2003 [Електронний ресурс] – 2009. – Режим доступу : http://www.osp.ru.
9.        KDnuggets (Gregory Piatetsky-Shapiro website) [Електронний ресурс]. – 2009. – Режим доступу : www.kdnuggets.com.
10.     Давыдов А.А. Системная социология: анализ мультимедийной информации в Интернете [Електронний ресурс] – 2010. – Режим доступу : http://www.isras.ru.
11.     Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. – СПб. : БХВ‑Петербург, 2008. – 384 с.
12.     Вопросы статистической теории распознавания / Ю.Л. Барабаш, Б.В. Варский, В.Т. Зиновьев и др. –  М. : Сов. Радио, 1967. – 400 с.
13.     Кибернетику – на службу коммунизму. Управление и информатизация : cб. статей / под ред. А.И. Берга. – Т. 9. – М. : Энергия, 1978. – 292 с.
14.     Левитин К.Е. Будущее искусственного интеллекта : сб. / АН СССР; ред.-сост. : К.Е. Левитин, Д.А. Поспелов. – М. : Наука, 1991. – 302 с.
15.     Brief History of Decision Support Systems (version 4.1). By D. J. Power. Editor, DSSResources.COM [Електронний ресурс]. – 2010. – Режим доступу : http://dssresources.com/history/dsshistory.html.
16.     Luhn H.P. A Business Intelligence System (PDF) / Н.Р. Luhn. –   IBM Journal. – 2009. [Електронний ресурс]. – Режим доступу : http://www.research.ibm.com.
17.     Круковський І.А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи : військ.-техн. зб. / І.А. Круковський // Академія сухопутних військ. – 2010. – Вип. 3. – С. 2632.
18.     Герасимов Б.М. Системы поддержки принятия решений: проектирование, применение, оценка эффективности / Б.М. Герасимов, М.М. Дивизинюк, И.Ю. Субач. – Севастополь : СНИЯЭ и П, 2004. – 320 с.
19.     International Conference on Knowledge Discovery and Data Mining archive. – 2009. [Електронний ресурс]. – Режим доступу : http://portal.acm.org.
20.     Круковський І.А. Архітектура експертної системи з розширеним виведенням на трьохкомпонентній гібридній моделі подання знань // Зб. наук. пр. ВІТІ НТУ України «КПІ». – 2009. – Вип. 3. – С. 20–24.
21. Павлов В.В. Начала теории эргатических систем / В.В. Павлов. – К. : Наук. думка, 1975

КРУКОВСЬКИЙ Ігор Анатолійович – кандидат технічних наук, провідний науковий співробітник наукового центру Житомирського військового інституту ім. С.П. Корольова Національного авіаційного університету.
Наукові інтереси:
– дослідження шляхів підвищення ефективності інформаційно-аналітичних систем на основі Business Intelligence;
– оцінка ефективності складних систем.
Подано 18.05.2010




Коментарі