Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це підзадача вилучення інформації, для знаходження і класифікції названих об'єктів у тексті до заздалегідь визначених категорій, для прикладу такі як імена осіб, назви організацій, місцезнаходження, час, кількість, грошові значення, відсотки, тощо.
Більшість досліджень, присвячених системам NER, мають ціллю прийняття не анотованого блоку тексту, і наступне виведення анотованого тексту. Для прикладу, неанотований текст на вході NER:
Джим купив 300 акцій Acme Corp. у 2006 році.
І вироблений анотований блок тексту на виході NER, який виділяє імена суб'єктів:
[Джим] Особа купила 300 акцій [Acme Corp.] Організації в [2006] Time.
У цьому прикладі було виявлено і класифіковано ім'я особи, що складається з одного токену, двох назв компанії та тимчасового виразу.
Найсучасніші системи NER для англійської мови дають практично такі ж результати, як і люди, які складають подібні анотації. Наприклад, найкраща система, що вводить MUC-7, набрала 93,39% F-міри, а люди-анотатори набрали 97,60% і 96,95%
Джерело: Named-entity recognition. From Wikipedia, the free encyclopedia https://en.wikipedia.org/wiki/Named-entity_recognition.
![]() |
Named-entity recognition (NER, Розпізнавання названого об'єкту), також відоме як entity identification (ідентифікація юридичної особи), entity chunking and entity extraction (вилучення, екстрагування суб`єкта господарювання) - це підзадача вилучення інформації |
Коментарі