Системе достаточно лишь несколько примеров для «усвоения» алгоритма классификации документов по предложенным категориям, она способна к самообучению — механизм категоризации самостоятельно идентифицирует новые тематические разделы и предлагает их на рассмотрение пользователю. Система способна обрабатывать документы на 20 иностранных языках. Программа создана на платформе Java и совместима с рядом ОС, включая Unix, Linux и Windows.

Поделитесь материалом с коллегами и друзьями