Похоже, анонс службы импорта Microsoft для Office 365 породил новую волну интереса к избавлению от файлов PST. Поиск файлов PST сам по себе уже серьезный вызов, поскольку этот вид пользовательского «личного имущества» может скрываться в самых неожиданных местах. Упорядочение найденных PST-файлов и их подготовка к «перевариванию» локальным сервером Exchange или Office 365 — тоже отдельная история. Повреждение данных, взлом паролей, избавление от дубликатов — со всем этим непременно придется столкнуться в процессе упорядочения. На самом деле это даже скорее упражнение из области управления проектами, нежели чисто техническая процедура.

После публикации статьи о новой службе импорта Office 365 от Microsoft у меня появилась возможность подискутировать с некоторыми компаниями, основная деятельность которых связана с поиском файлов PST. Этими компаниями разработан ряд инструментов, которые предназначены для поиска мест расположения файлов PST, притаившихся в темных уголках дисковых хранилищ, разбросанных по всей организации, чтобы затем привести эти файлы в состояние, пригодное для дальнейшего «переваривания» Office 365 или локальным сервером Exchange.

Ни для кого не секрет, что Microsoft предоставляет пользователям инструмент для импорта файлов PST под названием PST Capture. Однако мне еще не встречались специалисты, которые возлагали бы на этот бесплатный инструмент хоть какие-то надежды, связанные с успешным поиском и преобразованием данных. Компания Microsoft обновила данный инструмент лишь единожды с тех пор, как он был выпущен. И я, если честно, полагаю, что он по большому счету нужен лишь самой Microsoft, да и то только для галочки, чтобы можно было с чистой совестью сказать пользователям, что инструмент для импорта файлов PST им предоставлен. На самом деле инструменту PST Capture никогда не уделялось хоть сколько-нибудь значительное внимание с тех пор, как он был выпущен. А создан он был прежде всего для того, чтобы поддержать представление архивных почтовых ящиков в сервере Exchange 2010. И этот инструмент никогда не соответствовал ярлыку «революционный», который навесили на него в 2011 году.

Нет, вы, конечно же, можете воспользоваться PST Capture для поиска PST. На волне энтузиазма об этом инструменте даже было написано множество статей, когда он только был выпущен. Но я полагаю, что в конечном итоге вы придете к выводу, что данный инструмент требует слишком много внимания и операций, выполняемых вручную, чтобы быть по-настоящему востребованным.

Сторонние же разработчики программного обеспечения сконцентрировали свои усилия на создании инструментов, обеспечивающих работу с граничными условиями, скоростную детекцию и автоматизацию потока операций, что в конечном итоге позволяет производить поиск, копирование и обработку файлов PST при минимальном участии администратора и пользователей.

Граничные условия включают, например, способность обрабатывать файлы PST, защищенные паролем, и не только те, что защищены использующимся сегодня и легко поддающимся взлому сжимаемым шифрованием. Всегда существует вероятность столкнуться с некоторым количеством файлов PST, сгенерированных Outlook 2003, который использует метод так называемого «высокого шифрования», иметь с которым дело уже гораздо сложнее.

Обнаружение же подразумевает способность найти файлы PST вне зависимости от того, насколько глубоко пользователи их запрятали. Это означает, что вам необходимо предварительно развернуть соответствующий агент на всех пользовательских рабочих станциях, чтобы быть уверенным в том, что каждый диск будет подробно исследован и все файлы PST будут извлечены. Рассказывая об этом, я не могу не упомянуть, сколь впечатляют порой данные о коллекциях файлов PST, которыми делятся со мной некоторые поставщики. Взгляните, например, на данные, которые были получены при сборе файлов PST в одной хорошо известной крупной компании (см. экран).

 

Информация о файлах личных архивов
Экран. Информация о файлах личных архивов

Здесь обращают на себя внимание два элемента — 922 файла PST, обнаруженные у одного пользователя, и 343,4 Гбайт данных, найденные в 314 файлах PST у другого. Вы, конечно, меня спросите, как подобные ситуации вообще могли возникнуть, поскольку любой здравомыслящий человек вряд ли сможет понять, как кто-либо в состоянии управлять 922 файлами PST. Ответ заключается использовании персональных методов работы с почтой и недоверии к ИТ, возможно, по причине строгих квот почтовых ящиков или низкой надежности серверов. Одни пользователи создают файлы PST, чтобы заархивировать элементы для выделенных проектов, другие — чтобы архивировать элементы на регулярной основе, в то время как у третьих есть своя фантастическая и по-своему оригинальная логика создания нового файла PST. Дело в том, что все это происходит «в поле», и компании, по всей вероятности, просто не понимают, какое большое количество корпоративных данных в реальности хранится в файлах PST, которые расположены на дисках, полностью контролируемых пользователями. Сканирование десятков тысяч рабочих станций в крупной компании может раскрыть сотни терабайтов файлов PST. И все эти данные невидимы и недоступны для корпоративного поиска и проверки на соответствие требованиям.

Поиск такого большого количества файлов PST и попытка выяснить, что с ними делать, может в итоге потребовать огромного количества времени системного администратора. Инструменты, которые смогут выполнить сканирование дисков на предмет поиска файлов PST, скопировать их в центральную область хранения, а затем подготовить к последующей обработке (производя, например, сканирование для исправления повреждений на уровне элементов посредством многократного выполнения утилиты SCANPST или другого программного кода) могут в итоге значительно сэкономить время. Особенно если есть возможность автоматизировать поток операций поиска, сбора и исправления. Прибавьте сюда дополнительную функциональность, например избавление от дубликатов во всем наборе файлов PST, и вы увидите, что стороннее программное обеспечение вполне оправдывает свою лицензионную стоимость.

В приведенном выше примере с компанией, обнаружившей сотни терабайтов данных в локальных файлах PST, также весьма вероятно, что в обнаруженной информации присутствует значительное количество продублированных данных. Напомню, что PST — это персональный файл, и если изначальное сообщение было отправлено ста адресатам, то в итоге сто его отдельных копий может находиться в ста различных файлах PST. Если вы планируете импортировать файлы PST в Office 365 или локальный сервер Exchange, то избавиться от дубликатов исключительно важно, поскольку последнее, что вы захотите делать в этом случае, — это обработка объемных блоков дублированной информации. Особенно если передачу данных планируется производить посредством интернет-соединения.

Общаясь с разработчиками программного обеспечения, я понял, насколько важны накопленные ими знания о том, какими именно способами сотрудники используют файлы PST, в деле обработки этих самых файлов. И весь этот опыт находит свое воплощение в выпускаемых продуктах. Поэтому те советы, которые могут дать нам сторонние разработчики относительно импорта файлов PST, в конечном итоге помогут сэкономить время и деньги и, как правило, получить превосходные результаты импорта.

Если вы заинтересованы в использовании новой службы импорта Office 365 и намереваетесь собрать воедино пользовательские файлы PST в рамках всей вашей организации, то не поленитесь и найдите время пообщаться с настоящими экспертами, прежде чем приступить к процессу импорта. Я уверен, что специалисты из QuadroTech (PST FlightDeck), Nuix (Intelligent Migration), TransVault (Migrator), Sherpa Software и Archive360 (это лишь небольшой список разработчиков в данной предметной области) будут рады с вами пообщаться.

И прежде чем сосредоточить все усилия на службе импорта Office 365 как на единственном средстве перемещения данных из файлов PST в почтовые ящики Office 365, рассмотрите и другие варианты, которые в этой области могут предложить разработчики программного обеспечения. Например, мое внимание привлекли разработки QuadtroTech, после этого были опубликованы результаты тестов, которые наглядно показали, что инструмент Advanced Ingestion Protocol (AIP) способен обрабатывать данные из файлов PST в шесть раз быстрее, чем служба Office 365 Import. Кроме того, технология ArchiveShuttle позволяет гораздо эффективнее выполнять задачу по перемещению данных в Office 365, поскольку при этом отбрасывается гораздо меньше элементов.

По информации от QuadtroTech, служба импорта Office 365 полагается на команду New-MailboxImportRequest при импорте данных из файлов PST, а эта команда доступна только для локальных серверов Exchange 2010 и Exchange 2013 (как и для отдельных экземпляров Office 365, я полагаю). Данная команда, в свою очередь, управляется службой репликации почтовых ящиков Mailbox Replication Service (MRS). Однако журналы MRS, в которых отображается подробная информация о любых проблемах, обнаруженных при обработке элементов файлов PST, не видны администраторам Office 365 и, соответственно, они не могут понять, с какими именно элементами возникли проблемы при импорте, без сопоставления данных до и после импорта. Я попросил специалистов Microsoft прокомментировать это утверждение, однако ответа пока так и не получил.

В любом случае, озвученные на данный момент недостатки службы импорта Office 365 во многом напоминают те, что имеют место и у службы получения PST (PST Capture Service), которая, в свою очередь, является полностью бесплатной. Если же вы готовы платить за программное обеспечение сторонних производителей, специализирующихся в данной области, то в результате получите гораздо больше возможностей, соответственно вложенным инвестициям.

Мое общение с независимыми разработчиками еще раз показало, что эти компании играют очень важную роль в данной «экосистеме»: они заполняют своими продуктами пробелы, которые оставила компания Microsoft. И когда вы определяетесь с подходом, который будете использовать при избавлении от файлов PST, не торопитесь и внимательно изучите все имеющиеся возможности, прежде чем принять окончательное решение.