Розпізнавання названого об'єкту (Named-entity recognition) та Business Intelligence

Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це  підзадача вилучення інформації, для знаходження і класифікції названих об'єктів у тексті до заздалегідь визначених категорій, для прикладу такі як імена осіб, назви організацій, місцезнаходження, час, кількість, грошові значення, відсотки, тощо.

Більшість досліджень, присвячених системам NER, мають ціллю прийняття не анотованого блоку тексту, і наступне виведення анотованого тексту. Для прикладу, неанотований текст на вході NER:

Джим купив 300 акцій Acme Corp. у 2006 році.

І вироблений анотований блок тексту на виході NER, який виділяє імена суб'єктів:

[Джим] Особа купила 300 акцій [Acme Corp.] Організації в [2006] Time.

У цьому прикладі було виявлено і класифіковано ім'я особи, що складається з одного токену, двох назв компанії та тимчасового виразу.

Найсучасніші системи NER для англійської мови дають практично такі ж результати, як і люди, які складають подібні анотації. Наприклад, найкраща система, що вводить MUC-7, набрала 93,39% F-міри, а люди-анотатори набрали 97,60% і 96,95% 

Джерело: Named-entity recognition. From Wikipedia, the free encyclopedia https://en.wikipedia.org/wiki/Named-entity_recognition.


Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це  підзадача вилучення інформації


NER plus BI

На мій погляд, після накопичення результатів розпізнавання названих об'єктів, з правильно створеного масиву розпізнаних атрибутів названих об`єктів можна отримати різноманітні додаткові корисні знання - за допомогою нового дослідження  засобами Business Intelligence (OLAP (OnLine Analytical Processing), Visual Mining, Data Mining, KPI (Key Performance Indicator), Dachboards, Scorecard, а також вторинного застосування засобів Text Mining (Opinion Mining & Sentiment Analysis),  а також можливого трансформування системи вилучених розпізнаних атрибутів названих об`єктів у систему управління знаннями (Knowledge Management System, KMS). 

Коментарі