Network World, США

Центры обработки вызовов очень часто записывают телефонные переговоры между клиентами и агентами. Обычно такие записи служат для контроля над качеством обслуживания и анализа спорных ситуаций. Но зачастую большая часть аудиозаписей попросту игнорируется, поскольку изучение тысяч клиентских запросов «вручную» слишком накладно и занимает много времени.

Где искать «леденец»

Специализированные фирмы (такие как CallMiner и Nexidia) и поставщики систем распознавания речи (например, ScanSoft и Witness Systems) стремятся изменить положение дел. Они уповают на технологии, которые призваны выявлять статистические закономерности в аудиомассивах информации, — такие как приложения бизнес-анализа (Bussines Intelegent, BI), используемые для обработки структурированных данных. Технология интеллектуальной обработки звонков объединит средства распознавания речи (перевода аудиофайлов в текстовый формат), анализа записей и выявления корреляции данных. Компаниям станет легче находить в аудиоархивах специфическую информацию, обнаруживать недостатки в обслуживании абонентов и определять тенденции потребительского спроса.

ПО речевого анализа обеспечивает поиск аудиозаписей по ключевым словам. Это, например, позволяет выявлять те случаи, когда звонившие клиенты интересовались определенными продуктами или выражали неудовлетворенность обслуживанием. Тот же инструментарий устанавливает соответствие звонков заданным атрибутам, в том числе для заблаговременного выявления «тревожных сигналов».

Одна из тюрем США применяет технологию компании CallMiner для поиска кодовых слов, относящихся к контрабанде запрещенных изделий. ПО CallMiner накапливает во внутренней базе статистику употребления различных слов и может выявлять случаи явного отклонения «профиля» разговора от нормы.

В прошлом служащие федеральной тюрьмы могли догадываться, скажем, что слово «леденец» обозначает наркотик. Но лишь только об этом узнавали заключенные, они тут же меняли «секретный ключ». Методы интеллектуального анализа речи CallMiner позволяют за пару часов выявить нетипичное для тюремного лексикона слово, которое с большой вероятностью может оказаться искомым кодом.

Авиакомпания Continental Airlines одной из первых внедряет ПО интеллектуального анализа речевой информации. Она остановила выбор на платформе eQuality CallMiner. Система обеспечивает автоматическую классификацию и обработку клиентских запросов в Центре резервирования Continental Airlines, рассчитанном на 900 агентских мест.

Теперь компания классифицирует звонки клиентов по 50 категориям в зависимости от их назначения — для заказа билета, подтверждения информации о полете, изменения места вылета, получения бонусов и т.п. С помощью eQuality CallMiner авиаперевозчик автоматизирует процесс генерации отчетов о запросах клиентов. В прошлом специалисты Continental составляли отчеты раз в месяц, а сейчас в состоянии просматривать данные практически ежедневно.

Изучение текстов или анализ фонем?

Что же касается технологий интеллектуальной обработки звонков, производители реализуют один из двух общих подходов — превращение речи в текст или фонетический анализ аудиофайлов.

ПО CallMiner превращает речь в текст, к которому применимы методы BI, позволяющие получать статистику о звонках и контексте разговоров. Эти данные накапливаются в поисковых базах данных для последующего анализа.

ПО Nexidia основано на фонетическом анализе аудиосообщений. Исходный файл разбивается на последовательность фонем — отдельных звуков. Когда клиент операторского центра делает запрос, используя какое-то слово или фразу, ПО Nexidia идентифицирует фонемы, а затем индексирует их и накапливает в базе данных для просмотра.

Анализ звонков на основе фонетического разбора речи осуществляется быстрее, чем в случае превращения голоса в текст. К тому же обеспечивается поддержка мультиязычности (фонетический разбор происходит вне зависимости от языка, на котором ведется разговор). Сторонники превращения речи в текст признают, что первоначальный этап обработки звонков с помощью этой технологии занимает больше времени и ресурсов центрального процессора. Однако последующий поиск по ключевым словам в данном случае оказывается намного более эффективным.

Аналикики отмечают, что финансовые учреждения, авиакомпании, телефонные и кабельные операторы, правительственные агентства стимулируют интерес разработчиков к технологиям интеллектуальной обработки звонков.

В прошлом анализ аудиофайлов требовал значительного времени работы центрального процессора. «Когда-то для обработки одного часа аудиозаписи требовался час функционирования мощного сервера. Возьмите типичный ЦОВ со 100 агентами, работающими полторы смены в день, и вы получите, что для обработки суточного массива аудиоинформации необходимы 1200 часов», — рассказывает старший аналитик Yankee Group Арнольд Шоллер. Современные серверы позволяют обрабатывать 40 часов телефонных переговоров за один час работы центрального процессора.

Да и стоимость продуктов стала более приемлемой. По оценкам Nexidia, инсталляция ее системы в большинстве случаев «уложится» в 100-300 тыс. долл. Представители CallMiner утверждают, что ЦОВ на 200 операторских мест должен затратить примерно 450 тыс. долл. на предлагаемые этой компанией механизмы преобразования голоса в текст и входящее в комплект поставки ПО многомерного анализа структурированных данных.

Приложения для поиска аудио- и видеофрагментов будут появляться не только в силу потребностей ЦОВ. Например, компании могут хранить свои мультимедийные библиотеки с учебными презентациями, которые должны быть корректно проиндексированы для поиска.

Поделитесь материалом с коллегами и друзьями