Microsoft Word 97

Сначала в меню «Сервис?Параметры?Общие» надо включить опцию «Подтверждать преобразование при открытии». Потом при вызове с помощью пункта «Открыть» любых файлов с расширением, отличным от .doc, будет появляться диалоговое окно, где в предложенном списке следует отметить нужный формат.

Когда вы таким образом открываете текст, представленный в кодировке MS-DOS, то лучше выбрать пункт «Текст DOS». Если такой файл отредактировать и сохранить, то его формат не изменится — он останется в кодировке MS-DOS. При работе в Windows-1251 нужно вызвать пункт меню «Файл?Сохранить как...» и, чтобы сохранить в текстовом файле, указать «Только текст».

Если отметить в диалоговом окне пункт «Текст MS-DOS с форматированием», то Word предпримет попытку «отконвертировать» текст в формат Word. При наборе текста в среде MS-DOS конец строки обычно обозначается символом конца абзаца, а табуляция и выравнивание по центру или правому краю — пробелами. Здесь нельзя применить такие методы форматирования, как задание нужных полей и отступов, колонок и выравнивание по ширине, — символы конца абзаца не позволят тексту свободно перетекать из одной строки в другую. Встроенный конвертер Word пытается исправить эту ошибку, но, увы, зачастую делает это неудовлетворительно, и потом текст долго приходится исправлять вручную. В русской версии Microsoft Office 97 Professional есть специальный встроенный конвертер «Лексикон для DOS», который можно установить, выбрав соответствующий пункт при инсталляции Office. Однако его работа все же оставляет желать лучшего.

Существует программа «Конвертор текста MS-DOS», специально предназначенная для обработки и оптимизации текста, набранного в среде MS-DOS. Она представляет собой макрокоманду для Word 97, 2000, которая запускается из редактора. Эта программа не только удаляет лишние символы конца абзаца, но и на основе количества пробелов перед первой буквой в строке устанавливает значение выравнивания (по ширине, по центру, по правому краю), заменяет несколько стоящих подряд пробелов одним («Лексикон» для MS-DOS добавляет лишние пробелы, чтобы выполнить выравнивание текста по ширине), оптимизирует пробелы вокруг знаков препинания. С ее помощью можно быстро обработать и автоматически сохранить большое количество файлов. Программа имеет множество настроек, которые вполне удовлетворят даже очень требовательных пользователей.

Программа «Конвертор текста MS-DOS»

«Конвертор текста MS-DOS» объемом 120 Кбайт входит в пакет программ «ВерсткаТекстаКнижкой» и распространяется вместе с ним. Переписать этот пакет можно по адресам: http://antorlov.chat.ru/verstka.htm и http://www.newtech.ru/~orlov/verstka.htm.

К сожалению, работать с кодировками KOI-8, ISO-8859-5 и Macintosh в среде Microsoft Word невозможно. Для перекодирования из KOI-8 в загруженном в Word тексте существуют макросы, но они крайне медлительны, и потому применять их нецелесообразно. Желающие могут попробовать использовать пакет макросов «Encoding Changer Macro 98» из «Библиотеки Microsoft Office Extensions» http://www.microsoft.com/rus/offext.

WordPad

Если нет Microsoft Office, а также каких-либо других программ для чтения текстов MS-DOS, то можно взять текстовый редактор WordPad, поставляемый вместе с Windows 95. В меню «Открытие файла» в качестве шаблона укажите «Текстовые документы MS-DOS», и тогда открываемый файл отобразится правильно.

Чтобы открыть документ в WordPad, выберите в диалоговом окне «Открыть» опцию «Текстовые документы MS-DOS»

TextViewer

Когда нужно напечатать или отредактировать файл, набранный в среде MS-DOS, то иногда бывает удобно обратиться к помощи Word и WordPad. Однако работать с большим количеством таких файлов весьма затруднительно. Сейчас имеется достаточно много бесплатных программ, написанных русскими специалистами, которые успешно справляются с решением проблемы совместимости различных кодировок. Одна из подобных разработок — программа TextViewer, созданная Георгием Гуляевым.

TextViewer

TextViewer открывает текстовые файлы и файлы в формате RTF. Слева сверху на панели инструментов расположены шесть кнопок: пять из них позволяют просмотреть открытый документ в соответствующей кодировке (Dos-866, Windows-1251, KOI-8, Macintosh, ISO-8859-5), а шестая — текстовое содержимое файла в формате RTF. Выбрав соответствующую опцию в окне «Файл?Сохранить как...», можно сохранить открытый файл в нужной кодировке. Перед печатью документ можно просмотреть, найти и заменить какие-либо фрагменты текста. Можно также выбрать шрифт для текста, а с помощью удобного диалогового окна «связать» TextViewer с различными текстовыми файлами других типов.

Таким образом, можно сказать, что данный редактор превосходно заменит стандартный «Блокнот». Он успешно работает с различными кодировками и открывает файлы любого размера. Все это дает ему неоспоримые преимущества перед Notepad, однако на ПК с процессором ниже, чем Pentium, TextViewer будет очень медленно загружаться. Переписать TextViewer можно с Web-узла: http://www.freespeech.org/georgy или с сервера бесплатных программ: http://www.freeware.ru.

Aditor

Aditor — мощный текстовый редактор, отличающийся множеством разнообразных функций, в числе которых возможность чтения и записи файлов в различных кодировках.

Чтобы перекодировать файл, нужно в меню Action выбрать пункт Convert. В появившемся диалоговом окне необходимо указать параметры перекодирования и запустить конвертацию. Чрезвычайно важно то, что редактор позволяет работать с текстом, написанным латинскими буквами. Следует отметить, что он имеет многооконный интерфейс, функцию удаления из документа всех HTML-тегов и настраиваемые панели инструментов, а также обеспечивает работу с шаблонами.

Aditor

Aditor, скорее всего, очень понравится любителям простых текстовых редакторов с расширенными возможностями, хотя для вызова функции перекодировки и приходится несколько раз нажимать на кнопки мыши. Впрочем, и как замена Notepad он значительно уступает редактору TextViewer. Загрузить Aditor можно по адресу: http://perecod.chat.ru/aditor.rar или http://www.freeware.ru.

Exclude Symbols

Программа Exclude Symbols Александра Вардугина из Кемерова — многофункциональный пакетный обработчик текстовых файлов. Она поддерживает кодировки Windows-1251, KOI-8, DOS-866 и ISO-8859-5, позволяя переводить текстовые файлы из одной в другую. Допустима последовательная обработка до 15 файлов за один раз. Программа имеет несколько весьма интересных функций, например переводит все прописные буквы в строчные и наоборот, удаляет пустые строки из текста, заменяет группы пробелов табуляцией и символы в обрабатываемых файлах.

Exclude Symbols

Кроме того, можно автоматически определять кодировку документа. Делается это по довольно очевидному алгоритму. Например, в русском языке есть союз «и» и предлог «в», но нет ни «Ё» и «?» (символы кодовой страницы Windows-1251, имеющие такие же коды, как «и» и «в» в кодовой странице DOS-866), ни «Й» и «Ч» (символы кодовой страницы Windows-1251, имеющие такие же коды, как «и» и «в» в кодовой странице KOI-8). Поэтому ясно, что текст, открытый с кодировкой Windows-1251, в котором встречаются одиноко стоящие символы «и» и «в», скорее всего, принадлежит кодовой странице Windows-1251. Если же в нем встречаются одиноко стоящие символы «Ё» и «?», то это, скорее всего, текст в кодировке MS-DOS, а если в этом тексте есть одинокие символы «Й» и «Ч», то, наверное, текст написан в кодировке KOI-8. На подобных принципах основан и способ автоматического определения кодировки документа в программе Exclude Symbols. Поэтому, указав в качестве объекта для перекодирования группу файлов, можно не беспокоиться о кодировке каждого из них — достаточно просто указать ту кодировку, которую нужно получить на выходе, а для исходной поставить значение auto. Программа сама определит для каждого обрабатываемого файла его исходную кодовую страницу, решит, нужна ли ему конвертация в другую кодировку, и, если необходимо, выполнит ее.

Обращает на себя внимание оригинальный и удобный интерфейс программы. Переписать Exclude Symbols можно по адресу: http://perecod.chat.ru/exsym.rar.

Утилита «Перекодировка кириллицы»

«Перекодировка кириллицы»

Программа Виктора Степанова «Перекодировка кириллицы» представляет собой простой перекодировщик текстовых файлов. Имеется большой выбор исходных и конечных кодировок. Можно перекодировать файлы в Translit и Unicode.

Утилита способна автоматически перекодировать все текстовые файлы в папке и даже во всех вложенных каталогах. Она сама выбирает файлы с текстовым содержимым и перекодирует их, а также может создавать резервные копии исходных файлов. Однако следует помнить, что программа не определяет автоматически кодировку, так что следует внимательно задавать область ее работы и исходную кодировку. Загрузить «Перекодировку» можно по адресу: http://perecod.chat.ru/recod.rar.

«Штирлиц»

Программа «Штирлиц» наряду с возможностью чтения текстов в различных кодировках, в том числе и в Unicode, имеет очень важную и нужную функцию расшифровки неоднократно перекодированных почтовых сообщений. Бывает так, что электронное письмо, пройдя через несколько перекодирующих серверов, становится совершенно нечитаемым. Чтобы его расшифровать, необходимо определить последовательность проведенных перекодировок и применить к письму обратное преобразование. Именно это и делает «Штирлиц», созданный Всеволодом Лукьяниным. Если в программу загрузить (например, перенеся с помощью буфера обмена или открыв сохраненный на диске текстовый файл) полученный в виде письма нечитаемый текст, то после вызова соответствующей функции начнется перебор возможных вариантов перекодирования. «Штирлиц» анализирует их текст, выбирает тот, где встречаются общеупотребительные слова русского языка, и как наиболее близкий к оригиналу предлагает пользователю.

«Штирлиц»

Программа отличается широким набором режимов работы и функций. Так, можно подбирать схему перекодировок вручную (если для этого есть какие-нибудь предположения), задавать глубину анализа (чтобы выяснить, сколько раз подряд это письмо могло быть неправильно перекодировано), читать тексты, написанные в Unicode-кодировке и на Translit. Имеется также функция преобразования HTML-файлов в текстовые с сохранением элементов форматирования. А подробное Руководство пользователя и очень удобная функция деинсталляции могут служить примером для разработчиков таких программ.

Программа способна вытаскивать из текста письма фрагменты, закодированные в uuencode, base64 и других подобных системах передачи вложенных файлов, если почтовая программа получателя не распознала их. Для этого в «Штирлице» есть специальная функция. Кроме того, можно выполнять пакетное перекодирование файлов — исходная кодировка каждого из них определяется автоматически и в соответствии с ней выбирается алгоритм перекодирования.

«Штирлиц»

Вместе с тем программа «Штирлиц» не лишена некоторых недостатков. K сожалению, несколько некорректно выполняется перекодировка в кодовую таблицу DOS-866 и обратно. Несмотря на то что письмо все же остается в какой-то степени читаемым, выглядит оно весьма непрезентабельно. Так что использование «Штирлица» в качестве программы для чтения файлов в разных кодировках может вызвать некоторые затруднения. Поэтому лучше всего применять, несомненно, превосходное творение Всеволода Лукьянина для «спасения» неправильно перекодированных почтовых сообщений. Загрузить «Штирлиц» можно по адресу: http://perecod.chat.ru/shtirlz.rar.

«Декодер почты в неверной кодировке»

Эта программа А.В. Покровского — простое, но очень хорошо работающее средство для раскодирования писем, прошедших через несколько перекодирующих почтовых серверов. Она анализирует текст и преобразует его в читаемый вид. Несмотря на отсутствие сложных настроек и дополнительных возможностей, «Декодер» превосходно выполняет свои функции.

«Декодер почты в неверной кодировке»

Чтобы раскодировать текст, надо вставить его в окно программы и нажать кнопку «Расшифровать». «Декодер» имеет на редкость удачный интерфейс, который гораздо интереснее, чем у остальных программных продуктов, описанных в статье. Он выполнен с учетом всех требований эргономики и потому удобен и прост в работе. Такое внимание к пользователю, к сожалению, редко встречается, ведь даже у самых хороших программ интерфейс и средства управления программой порой оставляют желать лучшего. Поэтому настоятельно рекомендую всем потенциальным авторам программ ознакомиться с творением А.В. Покровского и, если это возможно, следовать его примеру в области разработки пользовательского интерфейса. Эта маленькая, но мощная программа достойна того, чтобы занять почетное место на жестком диске у всякого, кто работает с электронной почтой и хотя бы изредка сталкивается с проблемой восстановления неправильно перекодированных почтовых сообщений. Загрузить программу можно с Web-узла разработчика: www.postman.ru/~a12/decoder.

* * *

Что касается лично меня, то я отдаю предпочтение TextViewer как заменителю «Блокнота», для восстановления же почтовых сообщений использую программу А.В Покровского, для массовой перекодировки файлов я установил Exclude Symbols, а для конвертации текста, набранного в редакторах для MS-DOS, в формат, допускающий свободное его редактирование, применяю «Конвертор текста MS-DOS». Если же мне нужно написать или расшифровать текст, набранный на латинице, в работу вступает редактор Aditor.

В будущем проблема совместимости различных кодировок, скорее всего, разрешится. Может быть, лучший вариант — принятие всеми одной какой-либо кодировки в качестве стандарта, но тут уж все зависит от производителей ПО.

Орлов Антон Александрович,

antorlov@mail.ru, http://antorlov.chat.ru