Такой анализ позволяет программному обеспечению "осознать", что "Билл Гейтс", "он" и "глава Microsoft" в одном и том же документе, скорее всего, - это ссылки на одного человека. В самой Xerox технологией решили воспользоваться в подразделении Xerox Litigation Services, где инструментарий собираются интегрировать в пакет ПО для юристов. На этапе поиска информации при подготовке судебного иска, когда юристам приходится анализировать массу сообщений электронной почты и других документов, технологию можно будет применять для автоматического извлечения из них информации о событиях и датах. Авторы FactSpotter разработали специальный метаязык для описания грамматик, что позволит "локализовать" систему для поиска информации не только в англоязычных текстах.

Поделитесь материалом с коллегами и друзьями