Понимание документов

В конце июня на пресс-конференции, проведенной компанией Cognitive Technologies, ее генеральный директор, член-корреспондент РАН Владимир Львович Арлазаров (см. фото), представил компонент системы электронного документооборота (СЭД) «Евфрат — Документооборот v. 14.5», отвечающий за понимание документов.

Этот программный комплекс реализует важный практический шаг по повышению эффективности СЭД — он определяет действия пользователя в ходе лингвистического анализа структуры документа, а также, что существеннее, участвует в процессе автоматизированной технологической обработки его элементов. Это ускоряет ввод документов в систему и их последующий поиск по запросам.

В принципе интеллектуальная обработка документов требует участия оператора. Однако комплекс «Понимание документа» способен без помощи человека разобраться в содержании текстовых данных и выделить смысловые части. Последние заносятся в регистрационную карточку документа, чтобы в дальнейшем работать с ними в СЭД. Это стало возможным благодаря научным исследованиям, проведенным компанией Cognitive Technologies и ИСА РАН в области анализа информации, а именно — синтаксическому разбору текста, созданию структурных моделей представления знаний о языке и описаний структурных связей, а также опыту, полученному в ходе разработки проектов ИС для Пенсионного фонда РФ и ОАО ММК.

Программный комплекс «Понимание документов» сейчас доступен в решениях на базе «Евфрат — Документооборот». Работы по их внедрению включают изучение структуры текста, определение информации для понимания, создание XML-модели документа и обучение подсистемы «Евфрат — Документооборот» операции понимания текста. По заявлению разработчиков, время, необходимое для того, чтобы обучить комплекс «Понимание документов» в рамках проекта СЭД для одного вида документов составляет около недели.

Реализованные возможности понимания документов в СЭД пока касаются сокращения времени ввода — вручную такая операция выполняется в 5—10 раз дольше. Компания Cognitive Technologies планирует дальнейшую интеграцию технологий понимания для того, чтобы организовать автоматизацию процессов в СЭД и контроль за их исполнением, а также использовать самообучающиеся алгоритмы понимания, морфологический разбор текста и анализировать его структурные связи.

По мнению Н. Никольского, вице-президента Cognitive Technologies, потенциальными потребителями подобных решений для СЭД могут стать организации, придерживающиеся ГОСТов в своем документообороте или имеющие внутренние регламенты по виду и типу используемых документов, что сокращает участие пользователя на различных этапах внедрения такой системы и повышает эффективность автоматизации процесса работы.

Персональный компьютер в 2020 г.

Компания Adobe провела клуб на тему «Инновации: персональный компьютер в 2020 г.». По ней высказались П. Черкашин, глава российского представительства Adobe Systems, А. Пахчиян, вице-президент ABBYY Software House, В. Габриэль, руководитель группы экспертов по архитектуре ИТ корпорации Microsoft, Ф. Вирин, директор по исследованиям холдинга Mail.Ru, и К. Зеленский, менеджер по развитию бизнеса компании Nokia.

В докладе «СМИ и компьютерные технологии будущего; как мы будем получать информацию; влияние развития технологий на процесс обучения и массовые коммуникации» П. Черкашин дал свой прогноз. Начав с очень далекой перспективы, когда информация, по его мнению, приведет к возникновению следующей человеческой расы, он остановил внимание слушателей на том, что предвидится невероятный рост объемов информации, причем уже в ближайшее десятилетие. Он придерживается хорошо известного мнения о том, что с такой проблемой хоть как-то удастся справиться, лишь благодаря ИТ. Из задач, решенных в той или иной степени к 2020 г., выступающий предвидит визуализацию информации, новые эффективные программные методы поиска данных, расположенных как в отдельных, так и в глобально интегрированных ресурсах. Кроме того, он считает, что поддержка принятия решений с помощью автоматизированных ИС достигнет приемлемого для управления уровня. Также, по его мнению, с опорой на ПК произойдет переосмысление таких понятий, как «частная жизнь» и «СМИ», прежде всего, с точки зрения их интеграции в глобальное пространство, учитывая потребление людьми значительного количества информации. Вместе с тем П. Черкашин полагает, что в связи со значительным прогрессом в развитии компьютеров появятся и негативные факторы, например, человек, долгое время просиживающий за компьютером, будет остро ощущать дефицит общения.

Маршрутизатор Cisco CRS-1 теперь оптимизирован для работы с ЦОД

Выступление А. Пахчияна было посвящено реализации искусственного интеллекта (ИИ) с помощью ПК. Он отметил, что концепция ИИ, основанная на полной замене человеческого интеллекта таким, который будет программироваться компьютером, еще очень долго останется открытой — даже тогда, когда, по представлениям П. Черкашина, на Земле вступит в свои права новая компьютеризованная раса. А. Пахчиян полагает, что к 2020 г. задачи распознавания текстовой информации по скорости, качеству и удобству претерпят в основном технологические изменения. Что же касается автоматического перевода, то здесь значительного прогресса он не ожидает.

Ф. Вирин в своем докладе обратил внимание на то, что проблемы доступа и хранения информации в значительной мере будут приближены к персональному потреблению, в частности, пользователь получит возможность эффективно управлять информацией с учетом неизбежных ограничений на объемы данных и скорость их доставки.

Демонстрации В. Габриэля, связанные с медицинскими ИС, напоминали просмотр «Особого мнения» из-за обилия прозрачных экранов и сенсорных технологий. Управление обработкой информации в такой системе можно реализовать и современным ПО, но система в целом весьма дорого обошлась бы медицинским учреждениям и пользователям-пенсионерам.

К. Зеленский в основном обсудил инновации, представив, к примеру, нанотехнологическую платформу Morph. Потенциально она позволит реализовать в виде пленок различные устройства, включая мобильный телефон и всевозможные компьютеры, от персональных до специализированных.

Автор статьи, высказавшийся на этой встрече как представитель СМИ, обратил внимание, что в прогнозах важно учитывать взгляд на ПК со стороны пользователя. Так, при проектировании вычислительных средств следовало бы в гораздо большей мере считаться с удобством управления ими пользователем. Основанные на персональных компьютерах ИС должны позволять реализовывать принимаемые решения максимально приближенно к режиму реального времени. Одним из следствий этого станет тенденция к тому, что ПК будут все в большей степени специализироваться с учетом требований пользователя и оснащаться дополнительными компонентами для его проактивной деятельности.

Сетевое облако

Вслед за понятием «облачные вычисления» появилось и понятие «сетевое облако», что вполне в порядке вещей, поскольку информационные технологии обычно покоятся на двух китах: коммуникациях и вычислениях.

Следуя такой логике, корпорация Cisco предложила операторам унифицировать доставку услуг. Точнее, оптимизировать этот процесс в рамках модели сетевого облака, сочетая технологию Cisco для центров обработки данных (ЦОД), архитектуру унифицированных вычислений (Unified Computing) и сети нового поколения IP NGN.

Такое решение Cisco позволяет передавать голос, данные и видео из операторского ЦОД, оптимизированного для взаимодействия с IP-сетями нового поколения. Благодаря его внедрению операторы смогут эффективнее расходовать ресурсы, обеспечивать высокое качество и безопасность сервиса, сократить эксплуатационные затраты и предоставлять ассортимент виртуальных услуг. Таким образом, компания Cisco сделала важный шаг в реализации своей стратегии Data Center 3.0, помогающей построить платформу для доставки сервиса через сетевое облако. В условиях быстрого роста сетевого трафика и спроса на облачные вычисления было естественно предложить решение, сочетающее функции операторского ЦОД с архитектурой Cisco IP NGN.

 В состав решения Cisco Unified Service Delivery входят продукты как для ЦОД (среда унифицированных вычислений Cisco Unified Computing System, коммутаторы Cisco Nexus, основной маршрутизатор Cisco CRS-1 Carrier Routing System с новой конфигурацией, оптимизированной для ЦОД), так и для сетей IP NGN. Добавленные в CRS-1 модули помогают поддерживать функции виртуализации на всем участке сети от ЦОД до магистрали IP NGN, а также удовлетворять требования P2P и связи между приложениями в операторских ЦОД. Последнее позволит операторам виртуализировать трафик и сетевые операции на уровне услуг и абонентов на более компактном оборудовании. Это не только ускорит доставку сервисов, но и даст возможность эффективнее использовать имеющиеся ресурсы и сократить сроки возврата инвестиций операторов.

По мнению аналитической компании Senergy Research, унифицированная доставка услуг по сравнению с прежними ЦОД дает следующие преимущества: приблизительно в 2 раза сокращается энергопотребление, за четыре года в 5—7 раз увеличивается экономия при виртуализации видеоинфраструктуры, а затраты на капитальные расходы сокращаются в 5,3 —5,8 раз. Кроме того, за тот же период вдвое снижаются эксплуатационные расходы в области инфраструктуры виртуальных унифицированных голосовых коммуникаций.