Business Intelligence і Географічні Інформаційні Системи, GEO BI

 Ця стаття про Business Intelligence & Geographic Information System (GEO BI) або Geospatial BI зберегла актуальність у багатьох випадках до цього часу, хоча була опублікована 7 років назад з такими атрибутами:

Круковський І.А. Проблемні питання розробки і реалізації Geospatial BusinessIntelligence // Геоінформаційні системи у військових задачах. Другий науково-технічний семінар 21‑22 січня 2011 року. – Львів: Академія Сухопутних військ, 2011. – С. 117-125.

Вказана стаття з 2011 року розміщена у великому pdf-файлі збірки доповідей з ускладненим доступом, тому тут вона подана у текстовому форматі з модифікованим форматуванням і двома доповненнями 2018 року, які вказані у статті.



Концепція, технологія і засоби Geospatial Business Intelligence (Geo BI) засновані на комплексуванні hi-tech функцій: a) Geographic Information System  (GIS) b) Business Intelligence (BI)  [1, 2]. 

У кінці першого десятиліття 21-го століття  процес цього комплексування знаходиться на етапі становлення, концентруючись на нетривіальній обробці й 
візуалізації інформації, яка міститься в GIS. Існують також конкуруючі терміни, а також часто з різних причин оновлені GIS з BI (Geo BI) традиційно називають GIS. 
Відомі випадки, коли навіть на виставках менеджери з продажу Geo BI називають їх GIS, хоча фактично GIS і BI у загальному випадку - це дві незалежні системи. 

Будь-яка сучасна система BI (DSS BI, BI DSS) має у своєму складі функції спрощеної GIS на основі поштових індексів, назв населенних пунктів, областей, країн - є відповідні спрощені карти.

Провідні світові консалтингові компанії Gartner, Forrester, IDС та незалежні аналітики [3–6] розглядають Business Intelligence як життєво важливу технологію забезпечення  більш осмислених, гнучких й ефективних рішень і впродовж останніх п’яти років ставлять у першу п’ятірку 10-ти  найактуальніших інформаційних технологій [3]. 

На сторінках National Geospatial-Intelligence Agency (Національного агентства геопросторової розвідки) США в Інтернеті 
встановлені гіперпосилання на сторінки з Geospatial Business Intelligence [7]. 

У 2010 р. керівником агентства вперше в історії 
співтовариства розвідувальних органів США призначена  жінка  (цивільний фахівець), що, ймовірно, свідчить про перехід до активнішого використання технологій подвійного призначення. (Зауваження 2018 р.: з 2014 р. директором NGA став Robert Cardillo.)


У Армії США у 2005 р. створено U.S. Army Enterprise Solutions Competency Center (Центр компетенції корпоративних рішень). Центр випустив довідкове керівництво з Army Business Intelligence та інші [7]. У документі показано, що у 21-му столітті у сфері обробки інформації наступив третій етап – ера Business Intelligence. 

Зазначимо, що термін Business Intelligence у його теперішньому тлумаченні запропонував у 1989 р. H. Dresner, який з цього часу почала підтримувати компанія Gartner; у цьому ж році Г. Пятецький-Шапіро провів перший семінар з Knowledge Discovery in Databases (відкриття знань у базах даних), складовою частиною чого є Data Mining, які є важливою складовою Business Intelligence.


Отже, актуальним завданням є аналіз шляхів використання в інтересах ЗС України Geospatial Business Intelligence (має подвійне призначення). 


Business Intelligence – термін-метафора, який не має дослівного перекладу й однозначного тлумачення і використовується як узагальнене позначення синергетичного комплексу концепцій, технологій і засобів глибинної обробки первинної інформації для підтримки прийняття рішень. Основними складовими у найпростішому випадку є сховище даних (Data Warehouse) з кіосками й вітринами даних (Data Marts), засоби формування регламентованих запитів і звітів, OLAP, Data Ming, засоби статистичного аналізу та спеціальні засоби візуалізації добутих знань із даних. 


За останні 5 років формується нова генерація Business Intelligence, яку часто відзначають індексом «2.0». У [9] розглянуті особливості цього процесу та запропонована удосконалена узагальнена архітектура системи підтримки прийняття рішень (Desicion Support System Business Intelligence 2.0, DSS BI 2.0). 


Засоби OLAP у DSS BI 2.0 запропоновано реалізувати на основі розширеного тесту FASMI+, до якого інтегровані вимоги до знань [10]. Це визначає необхідність реалізації в OLAP базових функцій експертних систем. 

Нижче розглянуті деякі проблемні науково-прикладні питання, що потребують розв’язання при створенні програмних комплексів Geospatial Business Intelligence та запропоновані шляхи їх вирішення. 


1. Багато складнощів створюють неточні переклади і тлумачення базових термінів у даній сфері, для прикладу, Business та Intelligence. 


Неврахування особливостей їх визначень у некомерційних сферах викликає неточне розуміння Business Intelligence та помилково обмежує застосування лише сферами бізнесу у традиційному розумінні цього терміну українською і російською мовами. 

Зміст базових термінів для сфери автоматизації інформаційної роботи визначив у 1958 р. у статті журналу IBM науковий співробітник компанії H.P. Luhn. Термін «business» він визначив як  діяльність для досягнення цілей у сферах науки, технології, торгівлі, промисловості, правочинства, уряду, оборони та ін. [11]. З посиланням на тодішню редакцію словника Вебстера (Webster’s New Collegiate Dictionary), у статті визначено, що «intelligence» є здатністю розуміти взаємні зв’язки представлених фактів таким чином, щоб діяти у напрямку до бажаної мети. Підкреслено, що запропонована A Business Intelligence system може використовуватися у будь-якій із вказаних сфер діяльності. 
Неврахування цих маловідомих визначень та метафоричного характеру терміну Business Intelligence приводить до таких перекладів як: «бізнес-аналіз», «бізнес-інтелект», «ділова аналітика», «бізнес аналітика», тощо. 


Неточність такого перекладу стала очевидною після додатково введеного компанією IDC терміну Business Analytics software (програмне забезпечення ділової аналітики). 


Термін Data Mining неточно або розширено перекладають як «інтелектуальний» (глибинний) аналіз даних», «розкопка даних», ін.; термін OLAP – спрощено перекладають як «багатовимірний аналіз даних», «оперативний аналіз», ін. 


Інша важлива група подібних складнощів для вивчення і реалізації Business Intelligence відображає конкуренцію у глобальному англомовному просторі. 


Для прикладу, навіть провідні консалтингові компанії дотримуються різних підходів до співвідношення загального і часткового при тлумаченні Business Intelligence, Performance Management (управління ефективністю, результативністю), Business Analytics (ділова аналітика) та інших базових термінів [3-6].


Велика кількість різних перекладів і тлумачень базових термінів значно ускладнює розуміння термінів широкими колами можливих користувачів. 


Уточнити співвідношення між базовими термінами доцільно на основі аналізу їх складових у різних проблемних областях діяльності.


В обох тематичних групах публікацій аналіз змісту терміну проводиться, як правило, без урахування його тлумачення в іншій галузі, навіть у разі посилання на тлумачні словники Вебстера, для прикладу, в [11] і [12].

 
Їх аналіз показує, що порівняно з Performance Management і Business Analytics, термін Intelligence (Business Intelligence) є більш загальним. Проте, у прагматичному відношенні Intelligence є складовою частиною ділової аналітики і ділової діяльності у цілому, яка включає  прийняття рішень, їх реалізацію й оцінку їх ефективності. 


Зазначимо, що Intelligence вживається у багатьох країнах для позначення розвідувальних служб і їх діяльності та відноситься не тільки до збору й аналізу інформації, але й до інших видів діяльності; також часто Intelligence відноситься насамперед до аналітичної розвідки-досліджень. 

Наступним етапом розвитку автоматизованих інформаційно-управляючих систем доцільно вважати мережеві ергатичні (людино-машинні) організми, засновані на Artificial Intelligenсе і Business Intelligence у розширеному тлумаченні, включаючи інтелектуальні програмні агенти, тощо. Окремі ергатичні організми, їх елементи та мережі вже почали створювати і застосовувати в Інтернеті та за його межами.


Організмічний (від слова «організм») підхід до створення автоматизованих інформаційно-аналітичних і управляючих систем у найбільшій мірі узгоджений із сутністю організмів, які існують у природі у різних часткових та найбільш загальній формах.

Усунення неоднозначностей у тлумаченні термінів, які впливають на реалізацію Business Intelligence, Geospatial Business Intelligence та інших зв’язаних термінів, доцільно здійснити шляхом їх визначення у концепції дослідного застосування Business Intelligence. 


При цьому доцільно широко використовувати англомовне (міжнародне) позначення термінів, що практикується навіть у публікаціях на ієрогліфічних мовах. Проте, уточнення термінів можна здійснити лише після вибору програмних платформ для Geospatial Business Intelligence, адже різні розробники мають деякі відмінності у термінології. 

3. Не можливо реалізувати ефективну систему Geospatial Business Intelligence шляхом неузгоджених «точкової», «клаптикової» або «процесної» автоматизації у рамках різних підсистем.


 Це особливо актуально в умовах обмежених фінансових та кадрових ресурсів. Можливим шляхом вирішення цього проблемного питання може бути розробка всіх компонентів «зверху до низу» на основі модульної уніфікованості зі статичними (загальними для всіх) частинами і темпоральними (змінними). Такий підхід передбачає наступне. 

1) Створення розширюваних модульно-уніфікованих моделей метаданих. 


Статична частина моделей може містити однакові для всіх горизонтальних і вертикальних підсистем елементи в однаковому форматі: просторові координати, позначення країн, об’єктів, джерел, зареєстровані елементи для часткових евристичних потреб, ін. 

Темпоральна частина може містити додаткові змінні елементи, які специфічні для часткових проблемних областей роботи. Подібний підхід реалізовано, для прикладу, в моделі метаданих Провідника Windows (налічує понад 50 елементів), яка є спільною для всіх ПЕОМ з цією ОС і використовується у всьому світі, хоча значна частина елементів Провідника не використовується та має інші недоліки. 


Найбільш доцільною основою моделі даних може бути модифікована схема «зірка» («star chema»), інтегрована з гібридною трьохкомпонентною моделлю подання знань FPS (Frame, Production system, Semantic networks) – фреймово-продукційною, з мультимедійними семантичними мережами [9]. 

У відкритих публікаціях можливість і умови побудови сховищ даних на основі схеми даних «зірка» визначив у 2007 р. «батько» концепції сховищ даних B. Inmon. Такий підхід зменшує до мінімуму кількість операцій вилучення, перетворення і завантаження (Extraction, Transformation, Loading, ETL) даних між підсистемами. Адже розробка ETL процедур потребує значну кількість ресурсів та у багатьох випадках перевищує їх ліміт. 

Неврахування цього положення може звести нанівець всі зусилля щодо створення системи Geospatial Business Intelligence, залишаючи її на рівні несумісних між собою малоефективних «клаптикових» або «процесних» підсистем. 

2) Вказане для моделей метаданих та даних у повній мірі стосується і програмних комплексів. 


Необхідно зазначити, що створені силами окремих фахівців та маловідомих фірм засоби Business Intelligence та ГІС не можуть конкурувати зі створеними такими компаніями як Microsoft, IBM, Oracle та іншими, які займають найвищі місця у світових рейтингах, для прикладу, у діаграмах Magic Quadrants («Магічні квадранти») Gartner. Адже всі комплекси розроблених ними засобів мають модульно-уніфіковану структуру, у багатьох випадках сумісні між собою і передбачають можливості адаптації та удосконалення фахівцями різних рівнів підготовки. 


Керівники IT-підрозділів під час конференції IDC Business Intelligence Roadshow 2010 у м. Києві зазначали, що навіть у потужних фінансових корпораціях виникають суттєві проблеми зі значною кількістю так званих «самописних» програм, особливо після звільнення з роботи їх розробників. 


Необхідно зазначити, що засоби Business Intelligence не мають закритої архітектури. Вони мають модульну архітектуру із закритим ядром, яке забезпечує стійкість виконання основних функцій і сумісність окремих екземплярів та різних версій, а також кілька повністю чи частково відкритих рівнів, які дозволяють підготовленим користувачам модифікувати їх для своїх потреб, у тому числі не програмуючим фахівцям за допомогою мов рівня 4GL.

 
3) Всі консалтингові компанії в оцінках платформ Business Intelligence оцінюють їх сумісність з Microsoft Office та відзначають особливу роль Microsoft Office Excel як універсального кіоску даних. 


Його остання версія спроможна опрацьовувати більше ніж 100 мільйонів записів, має деякі функції системи управління базами даних, а починаючи з 2007 року може інтегрувати надбудови інтелектуального аналізу, які дозволяють вирішувати достатньо складні задачі Data Mining - при  підключенні до MS SQL Server, або переносити дані на MS SQL Server для більш складного аналізу.

Отже, будь-яка Geospatial Business Intelligence система повинна забезпечувати перенесення даних до Microsoft Office Excel з мінімальною кількістю операцій ETL. З цієї електронної таблиці дані можна перенести до будь-якого іншого аналітичного комплексу та ефективно накопичувати і обробляти у разі однакових моделей метаданих різних інформаційних масивів. 

4) Підсумовуючи вказане в даному пункті, зазначимо, що розширювана модульна уніфікованість з використанням статичних і темпоральних частин гібридних моделей даних і знань та програмного забезпечення забезпечує реалізацію мережецентричної острівної побудови системи Geospatial Business Intelligence. 


У ній будь-яка кількість окремих модульно-уніфікованих «островів» (підсистем) може функціонувати в автономному режимі або з’єднуватися з головним центром чи між собою у будь-якій комбінації. Це забезпечує умови для спільного аналізу первинних даних і підтримки прийняття рішень на системному рівні. 

Адже головною проблемою є не надмірна кількість первинної інформації, а її неузгоджена структура. Сучасні засоби OLAP, Data Mining, Visual Mining, Text Mining дозволяють обробляти терабайтні і більші масиви даних. 


Необхідно підкреслити, що для засобів Geospatial Business Intelligence велика кількість однаково структурованих з різних джерел первинних даних є не недоліком, а сприятливою умовою для побудови обґрунтованих моделей і автоматичного чи  високоавтоматизованого виявлення: переважних груп і аномальних виключень; багатовимірного аналізу у режимі online; класів і кластерів, одночасних подій і їх послідовностей, ланцюгів залежностей, ін., - для формування з різною деталізацією описів, висновків, прогнозів, пропозицій, рішень, оцінок ефективності рішень за результатами реалізації. 


4. Функціональні можливості Geospatial Business Intelligence тісно зв’язані з парадигмою побудови Knowledge Managment System (систем управління знаннями), яка визначає необхідність зв’язування у режимі On-line тих, «кому необхідні знання» з тими, «хто знає». 

У ЗС США створена найбільша у світі система управління знаннями. Її найбільшою складовою є Army Knowledge On-line (AKO) [14]. 


Розроблені та затверджені нові 12 принципів управління знаннями, які роблять наголос на інформації і знаннях на відміну від наголосу на ІТ-системах у версії 2001 р. Структура необхідних мета - знань метафорично позначена як know-why, know-what, know-who, know-how [14]. 

Зазначимо, що структуру знань доцільно більш повно визначити з використанням метафор Р. Кіплінга якяка відома у журналістиці як модель Five Ws (Five Ws and H) і також використовується як модель Захмана онтології підприємства і створення Data WareHouse (сховища даних): know-who (знати про кого), know-what (знати, що або з чим сталося), know-when (знати коли сталося), know-where (знати де сталося), know-why (знати чому сталося), know-how (знати як сталося) [15], а також додати до неї know foresight (знати передбачення) або know forecast (знати прогноз). 

Додане відповідає одній із основних функцій засобів Business Intelligence – Forecast (прогноз). 

Деякі знання можуть бути виражені в Geospatial Business Intelligence у явній формі (Explicit Knowledge). 

Проте, значну частину знань, насамперед, Tacit Knowledge («мовчазних» знань висококваліфікованих фахівців), неможливо формалізувати у зв’язку зі складністю цього процесу і неможливістю охоплення всіх елементів часткових проблемних областей роботи. 

Тому у Knowledge Management System (системі управління знаннями) необхідно зберігати також метазнання про носіїв знань, насамперед, носіїв Tacit Knowledge, у тому числі мати засоби зв’язку з ними, щоб використовувати всі види наявних знань для вирішення нових задач. 


Виходячи з вказаного, можна запропонувати розширений перелік видів знань для Knowledge Managment, Business Intelligence, Geospatial Businеss Intelligence та інформаційних документів, позначивши його у спрощеній метафоричній формі як KNOW: WHO; WHAT; WHEN; WHERE; WHY; HOW; FORECAST, X (W5HFX), яка повинна бути уточнена для часткових проблемних областей роботи. У цій моделі X - множина часткових, темпоральних елементів знань для часткової проблемної області роботи.

 
Як видно, не менше ніж одна складова знань (know-where) відноситься безпосередньо до геопросторової інформації.

 

Висновки



У рамках цієї публікації можливо розглянути тільки частину проблемних питань, що постають при розробці Geospatial Business Intelligence.


Розробка такої системи є складною мультидисциплінарною задачею. Результатом її вирішення повинно бути об’єднання ГІС, Business Intelligence, Knowledge Management System на єдиних модульно-уніфікованих моделях зі статичними (загальними для всіх) і темпоральними (змінними, спеціалізованими для окремих проблемних областей роботи) частинами. 


Це стосується набору концепцій, технологій розробки і використання системи обробки інформації, комплексних моделей даних і знань, комплексів програмних засобів.


Проте, найскладнішою задачею є об’єднання для розробки фахівців різної наукової і прикладної спеціалізації в умовах обмежень на фінансові і кадрові ресурси, ін. 


Таке об’єднання можливе на основі запропонованої ієрархічно-синергетичної інтеграції, яка передбачає не тільки ієрархічне управління, але й елементи самоорганізації. 


Перспективою подальших публікацій є подання варіанту удосконаленої архітектури Geospatial Business Intelligence з використанням DSS BI 2.0. 

Джерела: 

1. Assessing The Maturity Level of Geospatial Business Intelligence. 2011/01/06. By Ritesh Gupta //http://slashgeo.org/;
2. Spot On, Geospatial Business Intelligence (Integration IBM Cognos 8 BI and ESRI ArcGIS) // http://www.spotonsystems.com/;
3. Gartner, Gartner Business Intelligence Summit 2010 //http://www.gartner.com;
4. Forrester, The State Of Business Intelligence Software And Emerging Trends: 2010 by Holger Kisker, Ph.D // http://www.forrester.com;
5. IDC, Dan Vesset. Worldwide Business Intelligence Tools 2009 Vendor Shares. June 2010 //http://www.idc.com;
6. .Bi Verdict, Mark Rittman. News on The BI Verdict, and an Interview with Nigel Pendse. 19.01.2010 //http://www.bi-verdict.com;
7. NGA, National Geospatial-Intelligence Agency – official website //http:// nga.mil;
8. ESCC, Business Intelligence Reference Guide (Army Business Intelligence) //http://escc.army.mil;
9. Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні / І.А. Круковський // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111;
10. Круковський І.А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи: військ.-техн. зб. / І.А. Круковський // Академія сухопутних військ. – 2010. – Вип. 3. – С. 26–32;
11. IBM, Luhn H.P. A Business Intelligence System (PDF) / Н.Р. Luhn // IBM Journal. (November 1958) //http://www.research.ibm.com;
12. CIA, Michael Warner. Wanted: A Definition of "Intelligence" — Central Intelligence Agency //https://www.cia.gov/library/center-for-thestudy-of-intelligence;
13. Левитин К.Е. Будущее искусственного интеллекта : сб. / АН СССР; ред.-сост. : К.Е. Левитин, Д.А. Поспелов. – М. : Наука, 1991. – 302 с.;
14. AKO, Army Knowledge Management Principles //https://www.us.army.mil;
15. Wikipedia, Six Honest Serving Men (Five Ws.) From Wikipedia, the free encyclopedia http://en.wikipedia.org/. 

Коментарі