OLAP (англ. online analytical processing, аналітична обробка у реальному часі) — це концепція, технологія і засоби віртуально багатовимірного аналізу[en] (англ. Multidimensional analysis), що полягає у отримуванні аналітиком відповідей на свої евристичні запити у online режимі у формі різноманітних 1) зведених таблиць, 2) зведених діаграм (карт), 3)зведених схем на основі інформації зі сховища даних (Data Warehouse) чи з кіоску або вітрини даних (Data Mart). У теперішній час інформація (Big Data, великі дані) зберігається також у Data Lakes (Озерах даних). Майкрософт призупинив все нові продажі продуктів та послуг у Білорусі та Росії.
OLAP є автономною частиноюBusiness intelligence та Business Analytics Software [3]. Активно використовується у будь-яких областях аналізу числової та короткої лінгвістичної інформації, приведеної до табличної форми (підготовка бізнес-звітів з продажів, маркетингу, аналізу телекомунікаційної інформації, веб-аналізу, для потреб управління, фінансової звітності, ін.). OLAP також корисна для аналізу оцінок багатьох експертів по багатьом показникам, які можуть бути рознесеними у просторі і часі [4] [5].
Вимоги Едгара Кодда до OLAP (12+6 правил) - переклад на українську мову та зображення у вигляді схеми
Основоположником OLAP є автор реляційної моделі даних Едгар Кодд, який запропонував у 1993 році «12 правил аналітичної обробки в реальному часі» (за аналогією з раніше сформульованими ним «12 правилами для реляційних БД»). Насправді, правил було 13 (нумерація від 0 до 12) [1] [2]. У 1995 році Едгар Кодд додав ще 6 правил та переформатував їх . Пізніше для визначення OLAP був запропонований більш простий тест FASMI (4 вимоги); є більш корисна для практики версія цього тесту FASMI+ (OLAP+, 7 вимог) [2]. Вказані вимоги необхідно виконувати при створені платформ OLAP і на їх основі прикладних систем для часткових предметних областей аналітичної роботи.
Схема вимог тесту FASMI та його удосконалення FASMI+ (OLAP+)
Як зазначив Є. Кодд, головною причиною виникнення OLAP стала невідповідність класичної реляційної моделі даних потребам аналітиків щодо швидкого формування різноманітних евристичних аналітичних запитів і отримання відповідей на них у режимі online [1] [2]. Реляційні БД зберігають сутності в окремих таблицях, які зазвичай добре нормалізовані - ця структура зручна для операційних БД (системи OLTP), але складні багатотабличні запити в ній виконуються відносно повільно. Зручнішою моделлю для виконання запитів (але не для внесення змін) є просторова БД. OLAP робить миттєвий знімок реляційної БД і структурує її в просторову модель для запитів. Заявлений час обробки запитів в OLAP становить близько 0,1 % від аналогічних запитів до реляційної БД.
У зв`язку зі значним збільшенням швидкодії та пам`яті комп`ютерів стають популярними OLAP на основі реляційних баз даних (ROLAP, Relation OLAP), які використовують спеціальні схеми даних Star Schema (схема "зірка"), а також Snowlake Schema (схема "сніжинка") і у деяких випадках їх можна використовувати для сховища даних (Data Warehouse) - це значно спрощує і здешевлює аналітичну систему [3] [2] [4].
Джерела:
- Codd E.F., Codd S.B., and Salley C.T. (1993). "Providing OLAP (On-line Analytical Processing) to UserAnalysts: An IT Mandate". Codd & Date, Inc. Date of Entry: 09/23/93. [Електронний ресурс] -20
- Круковський І. А. Удосконалені вимоги до реалізації OLAP у DSS для часткових проблемних областей інформаційно-аналітичної роботи / І. А. Круковський // Військово-технічний збірник. - 2010. - Вип. 3. - С. 26-33. - Режим доступу: http://nbuv.gov.ua/UJRN/vtzb_2010_3_8.
- Bill Inmon. When Are Star Schemas Okay in a Data Warehouse?
- Круковський І.А. Узагальнена архітектура системи підтримки прийняття рішень на основі Business Intelligence у розширеному тлумаченні / І.А. Круковський // Вісник ЖДТУ. – 2010. – Вип. 2 (53). – С. 103-111.
Коментарі