Перейти до основного вмісту

Розпізнавання названого об'єкту (Named-entity recognition) та Business Intelligence

Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це  підзадача вилучення інформації, для знаходження і класифікції названих об'єктів у тексті до заздалегідь визначених категорій, для прикладу такі як імена осіб, назви організацій, місцезнаходження, час, кількість, грошові значення, відсотки, тощо.

Більшість досліджень, присвячених системам NER, мають ціллю прийняття не анотованого блоку тексту, і наступне виведення анотованого тексту. Для прикладу, неанотований текст на вході NER:

Джим купив 300 акцій Acme Corp. у 2006 році.

І вироблений анотований блок тексту на виході NER, який виділяє імена суб'єктів:

[Джим] Особа купила 300 акцій [Acme Corp.] Організації в [2006] Time.

У цьому прикладі було виявлено і класифіковано ім'я особи, що складається з одного токену, двох назв компанії та тимчасового виразу.

Найсучасніші системи NER для англійської мови дають практично такі ж результати, як і люди, які складають подібні анотації. Наприклад, найкраща система, що вводить MUC-7, набрала 93,39% F-міри, а люди-анотатори набрали 97,60% і 96,95% 

Джерело: Named-entity recognition. From Wikipedia, the free encyclopedia https://en.wikipedia.org/wiki/Named-entity_recognition.


Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це  підзадача вилучення інформації


NER plus BI

На мій погляд, після накопичення результатів розпізнавання названих об'єктів, з правильно створеного масиву розпізнаних атрибутів названих об`єктів можна отримати різноманітні додаткові корисні знання - за допомогою нового дослідження  засобами Business Intelligence (OLAP (OnLine Analytical Processing), Visual Mining, Data Mining, KPI (Key Performance Indicator), Dachboards, Scorecard, а також вторинного застосування засобів Text Mining (Opinion Mining & Sentiment Analysis),  а також можливого трансформування системи вилучених розпізнаних атрибутів названих об`єктів у систему управління знаннями (Knowledge Management System, KMS). 

Коментарі

Популярні дописи з цього блогу

OSINT (Розвідка відкритих джерел) в екосистемі зв`язаних термінів

OSINT - Open Sourse Intelligence Цей ескіз статті, за винятком інформації про "російсько-українську війну" (гібридну воєнну агресію РФ проти України з 2013 року) початково написаний як фрагмент повної статті про OSINT у січні 2019 року у зв`язку із тим, що раніше створена сторінка про OSINT у Вікіпедії базувалася на джерелах російського походження, хоча сам термін і технологія мають англомовне походження. Ймовірно, даний текст і  джерела у Вікіпедії буде змінено і викривлено,  як і по багатьом іншим інформаційним hi-tech.  Далі визначення OSINT, синтезоване на основі англомовних джерел і власних досліджень:  Розвідка відкритих джерел (англ. Open source intelligence, OSINT) — концепція,  методологія і  технологія   добування з відкритих джерел  військової, політичної, економічної та іншої безпекової інформації  і використання її  для підтримки прийняття рішень у сфері національної оборони і безпеки. Добування інформації здійсню...

Принципи ведення мережево-центричної війни (network-centric warfare)

У 2012...2013 роках на сайті студентських навчально-наукових публікацій  "Система+" були викладені одні з піонерських в Україні статей про особливості концепції Network Centric Warfare ("Мережево-центричні бойові дії" або неточно "Мережево-центрична війна") -    на основі  Joint Vision 2020 ("Спільне Бачення 2020"  та інших англомовних (в основному США) публікацій, які були опрацьовані раніше автором цієї статті. У Системі+  також активно обговорювалися на навчально-наукових семінарах особливості застосування цивільних додатків концепції Network Centric System (Мережево-центричних систем управління) у цивільних системах управління, для прикладу: мережецентричні операційні системи; мережецентричні міжнародні торговельні,  фінансові і виробничі мережі; мережецентрична система  управління залізничним рухом в РФ; ін. Не дивлячись на вказане, аналіз українських публікацій у цей час показує, що тема  Network Centric Wa...

Виключна економічна зона України - використання безпілотників згідно міжнародного права

Карта напрямків російської агресії у Чорному морі і у Азовському морі на фоні виключних (морських) економічних зон Виключна економічна зона (Exlusive Economic Zone) це морська зона (maritime zones), до 200 морських миль, де прибережна держава має суверенне право на використання природних ресурсів і ведення економічної діяльності - з гідно з Конвенцією ООН з морського права [1-6] .  Визначені також Територіальне море ( Territorial sea ), Прилегла зона ( Contiguous zone ), Міжнародні води ( International waters ), континентальний шельф ( Continental shelf ), ін. - див. схему нижче. Schematic map of maritime zones, Wiki. Якщо між узбережжями держав менше 400 морських миль, то межі ВЕЗ встановлюються як «серединна  лінія» -  у Чорному морі це  приблизно 84 морських милі (~140 км) від узбережжя України до Туреччини. Чорноморський флот ЗС РФ нахабно влаштовує військові морські навчання у ВЕЗ Туреччини, не кажучи про окуповані морські зони України і Грузії. Між Росією і Тур...