Реклама

В послужном списке Дженнифер Трелевич, директора отдела риска и рыночных данных Технологического центра Deutsche Bank, за последние десять лет числятся исключительно организации, работающие в России, – Фонд «Сколково», Mail.Ru, Google Russia, Лаборатория систем и технологий IBM EE/A. Трелевич призналась, что это сознательный выбор. Выросшая в США в семье белорусских и шведских эмигрантов, она мечтала переехать в Россию, осуществила мечту, работая в IBM, когда корпорация приняла решение открыть в Москве подразделение исследований и разработок, и не собирается изменять своему выбору.

Трелевич руководит направлениями риска и рыночных данных в Технологическом центре и в отделении глобальных рынков Deutsche Bank. Технологический центр в России имеет два офиса, в Москве и Санкт-Петербурге, где около тысячи специалистов разрабатывают приложения для поддержки операций банка по всему миру.

Дженнифер Трелевич
Дженнифер Трелевич: «Эффект от применения Больших Данных проявляется в разработке новых бизнес-моделей, повышении эффективности работы сотрудников и продуктивности взаимоотношений с клиентами, оптимизации операционной деятельности, новых возможностях управления рисками и финансами»

23 марта Трелевич выступит на форуме BIG DATA 2016 издательства «Открытые системы», поэтому основной темой беседы стали проекты Больших Данных в банковском бизнесе.

- В чем актуальность Больших Данных для банковской деятельности?

Как показывают международные исследования, эффект от применения Больших Данных проявляется в разработке новых бизнес-моделей, повышении эффективности работы сотрудников и продуктивности взаимоотношений с клиентами, оптимизации операционной деятельности, новых возможностях управления рисками и финансами. Все перечисленное касается и банковской деятельности. Например, если говорить о новых бизнес-моделях и операционной оптимизации, то можно привести в пример так называемый алгоритмический трейдинг. Он известен с 1987 года, но именно сейчас технология достигла высокого уровня развития, опираясь на алгоритмы обработки Больших Данных. За микросекунды принимаются решения, что продать и что купить, исходя из анализа сделок на фондовых рынках, которых происходит за день миллионы. Это настоящие Большие Данные.

Что касается отношений с клиентами, то в банках Большие Данные используются для целевого маркетинга и удержания клиентов. Целевой маркетинг важен скорее для потребительского банка, чем для инвестиционного. Потребительский банк с помощью алгоритмов обработки Больших Данных повышает точность определения целевых групп клиентов для тех или иных продуктов, например образовательных кредитов. Но удержать клиентов важно и для инвестиционного банка – Большие Данные дают возможность лучше понимать специфику работы корпоративных клиентов, их отношение к различным банковским сервисам и т. д.

В области управления рисками и финансами для инвестиционного банка важны алгоритмы вычисления риска дефолта контрагента. Когда банк делает хеджирование или принимает решение о предоставлении кредита корпоративному клиенту, необходимо четко понимать риск дефолта и осмысленно определять размер кредита и процент по кредиту. В нашем отделе, кроме прочего, разрабатываются приложения для анализа таких рисков.

И еще одна область применения Больших Данных в банковском бизнесе – прогнозы движения рынка. Предсказать будущее на 100% мы вряд ли сможем, но Большие Данные помогают лучше понимать тенденции и принимать наиболее подходящие меры.

- Какие еще есть примеры разработок центра в области Больших Данных?

В центре разрабатываются различные сложные отчеты для регуляторов, для трейдеров и других сотрудников банка, например отчет о выкупной стоимости (cash surrender value) – сумме, которую получит владелец ценной бумаги в случае, если он вернет ее досрочно. Такие отчеты требуют обработки очень больших объемов данных с высокой скоростью. Представление о том, что отчеты готовятся раз в месяц, уже не соответствует действительности. Современной глобальной финансовой организации нужна отчетность, генерируемая в реальном времени либо в короткий промежуток между закрытиями и открытиями разных рынков. Для реализации таких отчетов используются технологии типа Hadoop и платформы высокопроизводительных вычислений (High Performance Computing, HPC) — мы работаем с мощными кластерами лезвийных серверов. Мы также разрабатываем средства визуализации отчетов.

- Какие источники данных используются в таких задачах?

Прежде всего внутренние источники – данные всех операций, которые банк совершает. Но внешние данные тоже важны. Это не информация о клиентах из социальных сетей. В качестве внешних источников используются регулярно публикуемые финансовые отчеты компаний, стандартные фиды рыночных данных или, например, сообщения агентства Reuters.

- Если говорить о Больших Данных как источнике изменения бизнес-модели, как вы смотрите на перспективы цифровой трансформации банковского бизнеса, что в этом направлении делает Deutsche Bank?

Банк планирует инвестировать до 1 млрд евро в развитие цифровых технологий в ближайшие годы. Департамент GTO (Group Technology & Operations), к которому относится Технологический центр, ведет очень большую работу по реализации современных решений, помогающих повысить эффективность бизнес-процессов.

По сути, в инвестиционном банкинге цифровая трансформация происходит в течение многих лет. Не зря вы даже в кино видите трейдеров исключительно за экранами компьютеров. Уже упомянутый алгоритмический трейдинг в свое время кардинально изменил инвестиционный банкинг. Но сегодня благодаря мобильным технологиям и Большим Данным появляются совершенно новые возможности. В прошлом нашим клиентам приходилось долго ждать отчетов, чтобы принять меры в той или иной финансовой ситуации, сейчас они могут действовать быстро, получив нужную информацию в удобном виде на своих мобильных устройствах. Например, в рамках банковской инициативы под названием Next мы разрабатываем приложения для Apple Watch, которыми активно пользуются и трейдеры банка, и топ-менеджеры компаний – наших клиентов.

- Сталкиваетесь ли вы с дефицитом кадров для работы с Большими Данными?

Не думаю, что найти людей с необходимыми навыками трудно. Data scientist – это специалист одного из двух типов. Первый тип – специалист по математическому моделированию, который понимает отношения между данными разных видов, знает алгоритмы для извлечения из данных нужной информации, способен оценить количество измерений в математической системе и необходимость дополнительных данных для ее эффективной работы. Возможно, он не знаком с Hadoop, но этот пробел легко восполнить с помощью тренингов.

Второй тип – архитектор по данным, понимающий «передвижения» данных в системе и способный ее качественно спроектировать. В таких компетенциях, как и в знаниях по математическому моделированию, нет ничего нового, только теперь приходится иметь дело с большими объемами данных и более высокими скоростями их обработки.

Еще одна важная область знаний – информационная безопасность, но ее можно не выделять в отдельную категорию, поскольку ею должны владеть архитекторы по данным. Им необходимо понимать уровень конфиденциальности данных в любой точке системы и предлагать соответствующие средства защиты.

Новизна, пожалуй, в том, что при работе с Большими Данными нужно сочетать эти компетенции со знанием соответствующих алгоритмов и умением работать с высоконагруженными системами. Это междисциплинарная задача, но ее вполне можно решить, если собрать команду из сотрудников, обладающих по отдельности нужными навыками – моделирования, проектирования систем, программирования для НРС, работы с алгоритмами Больших Данных. И руководители организаций должны это понимать и не ссылаться на невозможность нанять суперспециалистов, обладающих всеми этими знаниями в комплексе.

- Сегодня начинают говорить об этических проблемах, которые способно породить обращение к Большим Данным. Что вы об этом думаете?

На мой взгляд, чтобы не возникало подобных проблем, надо соблюдать правила информационной безопасности. Любая информация, которая включает те или иные данные о человеке, может считаться конфиденциальной, и проблемы появляются из-за неправильной оценки уровня конфиденциальности при проектировании системы. Даже если система просто собирает данные, касающиеся поведения клиента на сайте, необходимо рассматривать их как конфиденциальную информацию и задать необходимые меры защиты. Если, например, клиент вводит номер своего счета и эти данные затем больше не потребуются системе, их надо сразу стереть, а если они нужны, чтобы в дальнейшем идентифицировать этого клиента, надо обеспечить защиту таких данных.

Все это правила архитектуры, хорошо известные специалистам по криптографии, и их необходимо соблюдать в проектировании систем Больших Данных.