При серьезном целенаправленном сборе информации в Интернете часто возникает необходимость сохранения полезных веб-страниц для дальнейшей работы. Мы уже обращались к онлайновым инструментам архивирования веб-страниц («Мир ПК», №4/07, с. 88). Самое время познакомиться с аналогичными локальными программами, которые обладают рядом весьма привлекательных свойств. Во-первых, они не требуют постоянного подключения к Сети и позволяют вдумчиво работать с крупными архивами сохраненных файлов и веб-страниц. Вы не зависите от скорости соединения и неполадок на линиях связи, нет причин для сомнений по поводу обеспечения приватности информации — все архивы хранятся только на вашем ПК. Во-вторых, локальные приложения могут похвастаться богатым набором различных дополнительных инструментов, которого не могут себе позволить онлайновые сервисы.

Macropool Web Research

Пакет Web Research (www.macropool.de, ранее он назывался ContentSaver) способен сохранять как обычные веб-страницы, так и любые «не-HTML»-документы — лишь бы они были пригодны для отображения браузером. В фоновом режиме можно загрузить и сохранить веб-страницы, ссылки на которые содержатся на открытой странице. При желании в соответствующем диалоге можно отметить только нужные для сохранения ссылки. Предлагаются Personal- и Professional-версии  — Web Research. Последняя отличается некоторыми дополнительными функциями, например возможностью захвата снимков целого экрана, его выделенной области или активного окна. В нее также включен собственный HTML-редактор, с помощью которого можно создавать и редактировать не слишком сложные страницы, а также добавлять небольшие заметки к сохраненным в архиве файлам.

Основной режим функционирования Web Research — в связке с браузером Internet Explorer, однако возможна совместная работа с Opera и Firefox. Для последнего даже предлагается соответствующий модуль, который был немедленно мной установлен и опробован. К сожалению, он функционально беден и не очень хорошо взаимодействует с кэшем браузера, что существенно замедляет работу. В результате под Firefox можно только сохранять веб-страницы, их отдельные элементы, а также присваивать сохраняемым элементам краткие аннотации.

Панель для IE более разнообразна и состоит из двух частей — Web Research Toolbar и Web Editing Toolbar. Первая повторяет набор функций для Firefox, а вторая позволяет переключиться в режим редактирования сохраняемой веб-страницы. В данном режиме можно изменять шрифты, помечать важные места цветным маркером, менять форматирование текста, удалять со страницы ненужные элементы. Такой редактор удобен, если вы планируете использовать содержимое сохраненных страниц в своих документах, и серьезно экономит время при написании текстов на основе сетевых источников.

Диалог сохранения веб-страницы здесь довольно подробный. Вы можете указать конкретный каталог для сохранения документа, а также присвоить ему одну или несколько тематических категорий. Кроме обычных для таких программ имени сохраняемого файла и комментария можно пометить его как «Важный». Допустимо как сохранение страницы в ее исходном и нетронутом виде, так и выборочное удаление картинок, рекламы, флэш-роликов или скриптов.

Основная программа — менеджер архива  — позволяет просматривать сохраненные объекты, а также управлять коллекцией. При просмотре архива окно Web Research делится на три части: иерархический список каталогов архива, перечень объектов в активной папке и область просмотра собственно сохраненной веб-страницы. Возможно и переключение в полноэкранный режим чтения веб-страницы (Read).

Для сортировки архива используется система тематических каталогов, стартовый набор которых по умолчанию создается самой программой. Само собой, возможно создание и собственных каталогов. Есть система присвоения рейтинга сохраненным документам, сильно напоминающая аналогичную функцию известной программы ACDSee.

Система поиска по архиву работает в нескольких режимах: простом, расширенном и особо «быстром». Наибольший интерес представляет расширенный поиск, который ведется по именам категорий, дате сохранения, типу файла, а также полным текстам документов. Режим QuickFind предлагает набор готовых шаблонов часто используемых запросов, кроме того, ничто не мешает сконструировать собственные шаблоны. Подборку результатов поиска можно сохранять для дальнейшей работы как самостоятельный список.

Web Research способна импортировать в свой архив уже сохраненные на диске файлы и веб-страницы. Для этого следует воспользоваться либо диалогом, вызываемым в самой программе, либо кнопками специальной панели для Windows Explorer, которая устанавливается вместе с Web Research. По умолчанию импортируемые документы складываются в корневой каталог архива, однако эту настройку можно изменять.

Документы архива доступны из внешних приложений, в частности, заявлена совместимость с пакетом Windows Desktop Search. Кроме того, можно обращаться к функциям Web Research из командной строки Windows. При этом вызывается приложение WRGet. exe с различными параметрами, подробно расписанными в справке к программе.

Если говорить об экспорте архива, то здесь все на высоте. Документы сохраняются как в обычном HTML-фaйле, так и в форматах MHT и CHM. В CHM-файл экспортируется даже набор веб-страниц, что весьма удобно при пересылке целых сайтов или тематических подборок. Кроме того, документы из архива можно быст-ро отправить другим пользователям Web Research. Интересна функция создания презентаций, состоящих из слайдов, созданных на основе сохраненных веб-страниц.

Разработчики Web Research предлагают для своей программы некоторые дополнительные модули, например предназначенные для совместной работы с Outlook или реализующие совместную сетевую работу нескольких пользователей над одним архивом. Эти модули можно найти на сайте Macropool.

Web Research успешно сохраняет даже сложные страницы со скриптами и анимацией

Страница архива Web Research в полноэкранном режиме просмотра

Панели Web Research работают как в браузере, так и в Windows Explorer

MetaProducts Inquiry

Большим плюсом MetaProducts Inquiry (www.metaproducts.com) является наличие русской версии этой программы, в которой полностью и довольно качественно переведен не только интерфейс менеджера, но и справочная система. Как и Web Research, данный пакет состоит из программы-менеджера и дополнений для популярных браузеров, предназначенных для быстрого сохранения страниц в ходе серфинга. Internet Explorer снова обладает более полной поддержкой. Если интеграция Inquiry с Firefox и Opera ограничивается добавлением парочки новых пунктов в контекстное меню, то IE получает полноценную дополнительную панель инструментов. При работе с Inquiry в связке с браузером Firefox выявился неприятный момент. По всей видимости, сохраняемые веб-страницы не берутся из кэша браузера, как при работе с IE, а загружаются заново, что вдвое увеличивает трафик и заметно замедляет работу.

Сохраняется веб-страница нажатием соответст-вующей кнопки на панели браузера или же простым перетаскиванием ссылок на панель Inquiry. При этом их можно сразу помещать в нужную тематическую папку архива, что несколько удобней, чем принятый в Web Research подход с быстрым сохранением ссылок в корневом каталоге. Любопытная и полезная функция Inquiry — сохранение всех страниц и файлов, на которые ведут ссылки из фрагмента текста, выделенного курсором на открытой веб-странице. Отдельно можно сохранять картинки и флэш-анимацию с открытых в браузере веб-страниц. Еще один интересный режим работы Inquiry — автоматическое фоновое сохранение абсолютно всех открываемых в браузере веб-страниц. Они автоматически помещаются в папки, отсортированные по дате посещения. Теперь вы уж точно не потеряете ни одной нужной веб-страницы, правда, и ориентация в стремительно разрастающемся архиве значительно усложняется. Но это хороший повод подробнее познакомиться со средствами поиска программы. Встроенный инструмент Inquiry позволяет искать как по отдельным элементам сохраненных документов, так и по их полному тексту. Кроме того, иногда имеет смысл ограничить поиск определенной папкой архива. Результаты выводятся в виде миниатюрных изображений страниц с некоторой вспомогательной текстовой информацией.

Интерфейс архива выдержан в традиционном стиле: слева список каталогов, справа область просмотра. Для просмотра страниц используется движок Internet Explorer. При желании можно переключиться в полноэкранный режим «киоска», включать и отключать отображение определенных элементов сохраненных веб-страниц, например флэш-роликов или скриптов. Под областью просмотра находятся вкладки, содержащие сведения о просматриваемой странице, заметки, которые вы можете к ней добавить, а также библиографическое описание источника сохраненной страницы. На последнем пункте стоит остановиться отдельно, поскольку при подготовке многих учебных или рабочих текстов грамотное оформление списка источников играет важную роль. По умолчанию Inquiry предлагает несколько западных форматов библиографической записи, не имеющих практически ничего общего с нашими ГОСТами. Здесь на помощь приходит редактор форматов, позволяющий самостоятельно указать шаблон такой записи. В результате, потратив несколько минут на настройку, вы получите вполне приличное описание, которое не стыдно будет поставить даже в официальный документ.

Как и Web Research, Inquiry содержит встроенный редактор сохраненных страниц, с помощью которого выполняются базовые операции над текстом и другими объектами документов архива.

Импорт уже сохраненных на диске веб-страниц в архив Inquiry сделан достаточно удобно. Можно указать одну конкретную страницу или выбрать каталог с их подборкой. В последнем случае будут сохранены и страницы, находящиеся в подкаталогах выбранной папки. При таком импорте в архиве Inquiry полностью сохраняется структура каталогов, в которых были найдены веб-страницы, что радикально сокращает время на их дальнейшую сортировку.

При просмотре архива Inquiry показывает не только имена сохраненных страниц, но и их графические миниатюры

В Inquiry работает удобная система сохранения отдельных элементов веб-страниц

Inquiry располагает достаточно мощной и комфортной системой поиска

Редактор формата библиографической записи Inquiry очень полезен при подготовке официальных и учебных документов на основе архива веб-страниц

ScrapBook

Рассмотренные выше пакеты отдают явное предпочтение работе с браузером Internet Explorer. Это в принципе понятно, но не совсем удобно, если вы используете альтернативные решения. Особенно повезло приверженцам браузера Firefox, для которого разработан собственный отличный менеджер архива веб-страниц — ScrapBook (amb.vis.ne.jp/mozilla/scrapbook/). Как и все дополнения к Firefox, он распространяется бесплатно. Отрадно наличие на сайте проекта русской локализации этого инструмента.

Интерфейс ScrapBook выдержан в стиле стандартного менеджера закладок Firefox, очень прост в освоении и работе. Открывается архив ScrapBook в боковой панели и содержит список сохраненных страниц и ссылок, которые можно сортировать по различным признакам, а также минимум инструментов — кнопки создания каталогов, поле поиска по архиву и меню с дополнительными опциями. За этой внешней простотой и лаконичностью скрыты немалые возможности, например полнотекстовый поиск не только по всему архиву, но и по отдельным признакам веб-страниц (имени, дате сохранения и др.). Кроме того, допускается поиск по регулярно встречающимся выражениям. Поскольку для просмотра документов архива используется основной браузер, данный режим ничем не отличается от обычной онлайновой работы с Firefox.

Добавление страниц в архив производится или через стандартное контекстное меню браузера, или с помощью комбинации «горячих» клавиш. Можно сохранять как страницы целиком, так и простые закладки на них. С помощью инструмента «Сохранение нескольких URL» вы быстро сохраните все ссылки, содержащиеся на открытой в браузере веб-странице. Можно также выделить на странице фрагмент текста и сохранить только попавшие в него ссылки.

ScrapBook обладает вполне конкурентоспособным набором дополнительных инструментов. Среди них средства проверки и аварийного восстановления архива, а также встроенный редактор веб-страниц, по возможностям не уступающий аналогам из коммерческих пакетов. У ScrapBook также есть функция объединения нескольких сохраненных веб-страниц в один файл. Она весьма удобна при сохранении обсуждений с форумов или «склейке» крупных статей, разбитых на несколько частей. При этом доступен предварительный просмотр нового файла и опция автоматического удаления исходных страниц из архива. Возможен экспорт документов из архива в формат HTML, при этом каждая страница и все относящиеся к ней файлы складываются в отдельный каталог. Такую подборку затем можно импортировать в ScrapBook на другой компьютер.

Если вам не хватает изначально заложенной в ScrapBook функциональности, установите к нему дополнительные подключаемые модули. Галерея таких дополнений находится на сайте проекта. Стоит обратить внимание на ScrapBook AutoSave, который реализует режим постоянного фонового сохранения просматриваемых страниц, на CHM Exporter, добавляющий функцию экспорта в формат CHM, а также на CopyPage Info, генерирующий библиографическое описание открытой веб-страницы. Радует то, что формат такой записи можно настраивать, так что привести его в соответствие с нашими правилами оформления не составит большого труда.

Таким образом, у разработчиков ScrapBook получилась настоящая «рабочая лошадка», по праву считающаяся одним из лучших дополнений к Firefox.

Интерфейс ScrapBook прост и понятен: список материалов архива в боковой панели и инструменты редактирования сохраняемой страницы в нижней части окна Firefox

ScrapBook умеет объединять несколько страниц в один файл

Диалог сохранения страницы ScrapBook

Настройка описания веб-страницы в ScrapBook

* * *

Если у вас нет необходимости обмениваться ссылками и документами по сети, а также если вы работаете преимущественно на одном компьютере, то локальные менеджеры архивов веб-страниц выглядят явно предпочтительней аналогичных онлайновых решений.

Из коммерческих программ наиболее сбалансированной на сегодняшний день, пожалуй, можно признать Inquiry. Пакет Web Research интересен тесной интеграцией с Windows Explorer, а также наличием полезных дополнительных опций в «профессиональной» версии.

Активным пользователям Firefox прямая дорога к менеджеру ScrapBook, который хоть немного и уступает коммерческим пакетам в богатстве функциональных возможностей, однако располагает всеми основными инструментами для работы с архивом, прост в работе, поддерживает установку дополнений и, кроме того, абсолютно бесплатен.


Web Research Professional 2.7

Оценка ****
Системные требования Internet Explorer 6/7.
Поддерживаемые ОС Windows 2000/XP/Vista.
Размер дистрибутива 11,6 Мбайт.
Язык интерфейса английский, немецкий.
ЦЕНА 41 долл.
Разработчик Macropool, www.macropool.de

Inquiry Professional Edition 1.5

Оценка *****
Системные требования Internet Explorer, Firefox, Opera.
Поддерживаемые ОС Windows 98/Me/NT 4/2000/2003/XP/Vista.
Размер дистрибутива 4,5 Мбайт.
Язык интерфейса русский, английский.
ЦЕНА 60 долл.
Разработчик MetaProducts, www.metaproducts.com

ScrapBook 1.2.0.8

Оценка *****
Системные требования Firefox 1.5/2.0.
Поддерживаемые ОС Windows/Linux/Mac OS.
Размер дистрибутива 0,2 Мбайт.
Язык интерфейса русский, английский, всего доступно 20 локализаций.
Условия распространения бесплатно, свободно распространяемое ПО.
Разработчик Gomita, amb.vis.ne.jp/mozilla/scrapbook/

5377