«Открытые системы»

Сюрприз, преподнесенный компанией ZeoSync, вызвал шок у математиков

Положение дел в области сжатия данных на редкость стабильно: во всем мире используется всего несколько известных программ, новостей, казалось бы, ждать неоткуда. И вдруг на этом островке стабильности чуть было не разорвалась бомба. Впрочем, тревога оказалась ложной.

№ 17, 2002: Как объявила компания ZeoSync, ей удалось добиться того, что математики и специалисты по информатике в течение полувека считали невозможным.

«Если это действительно так, то ZeoSync создала технологию, которая обеспечивает сжатие в несколько проходов, создавая в результате файлы в 100 раз меньшие, чем они были изначально. При этом не допускается никакой потери данных, что неизбежно при использовании большинства современных схем сжатия. Однако многие сомневаются в правдоподобности характеристик, о которых заявляет ZeoSync».

С момента публикации этого сенсационного сообщения прошло ровно три года; за это время ни одного уточняющего сообщения не появилось. Более того, на Web-сайте компании ZeoSync невозможно найти даже следов широко объявленного прорыва и того знаменитого пресс-релиза, в котором утверждалось: «Технология специальным образом рандомизирует естественно возникающие шаблоны, формируя случайные последовательности энтропического характера, а затем кодирует ими строки в рамках сложных комбинаторных последовательностей, создавая их эквиваленты, значительно меньшие по размеру». Примерно в таких же неопределенных словах генеральный директор и основатель ZeoSync Питер Сент-Джордж объяснял суть сделанного открытия: «Мы понимаем, насколько нам вредит отсутствие опубликованных доказательств. Как только мы покажем нашу технологию, люди, наконец, поймут, что они получили. Через какое-то время скептики сами убедятся в нашей правоте». Хотелось бы услышать Сент-Джорджа сейчас, когда обещанные доказательства так и не были представлены, а компания ZeoSync обанкротилась и выставлена на продажу.

Любому знакомому с теорией передачи данных ясно, что цитированные здесь утверждения так же реальны, как и обещание полета с гиперсветовой скоростью. Как скорость перемещения в пространстве ограничена скоростью света, так возможности сжатия данных ограничены «пределом Шеннона». Согласно доказанной Клодом Шенноном теореме средняя длина кодирующей последовательности не может быть меньше энтропии источника. По этой причине все известные методы сжатия не революционны, они основаны лишь на избавлении от чрезмерной избыточности источника и являются попытками приблизиться к пределу Шеннона.

Следует отметить, что речь идет о сжатии данных, называемом «обратимым», оно сохраняет исходный объем информации. Существует альтернатива — необратимое сжатие данных, но это явление совершенно иного порядка. Такое сжатие призвано уменьшить размеры файлов за счет некоторого ухудшения качества воспроизведения; примерами могут служить MPEG и JPEG. Необратимое уплотнение при передаче данных неприменимо.

Из истории сжатия файлов

Первой попыткой предавать текст в уплотненной форме следует признать азбуку Морзе, которая появилась в 1853 году. В отличие от ASCII, где любой символ представляется байтом, здесь применяются последовательности точек и тире переменной длины, чем чаще используется буква, тем короче соответствующий ей код. Следующий шаг был сделан почти через сто лет; в 1949 году Клод Шеннон и Роберт Фано предложили метод сжатия, использующий вероятность появления блоков данных. Самый заметный теоретический вклад в эту область внесли математики Абрам Лемпель и Яков Зив, которые в 1977 году опубликовали статью, в которой предлагалось присваивать кодовые слова не отдельным символам, аповторяющимся фрагментам текста. С тех пор и поныне этот подход остается основой алгоритмов обратимого сжатия. Он был развит в 1984 году Терри Уэлчем, усовершенствовавшим метод Lempel-Ziv; в итоге появился метод LZW, используемый в таких форматах сжатия, как ZIP, GIF и ряде других.

Особую популярность программы сжатия приобрели в связи с началом использования персональных компьютеров: их появление было стимулировано ограниченностью размеров дискового пространства. Первооткрывателем оказался Том Гендерсон, который в 1985 году написал программу-архиватор ARC. Эта программа и еще несколько утилит, созданных им в соавторстве с братом, позволили основать компанию System Enhancement Associates (SEA). Все продукты SEA были написаны на языке программирования Си и распространялись с открытыми кодами. Это обстоятельство дало возможность Филиппу Кацу в 1987 году переписать ARC на ассемблере, придавшем более высокую скорость работы. Прибавив две буквы от своего имени и фамилии, он стал распространять программу PKARC.

Впоследствии Кацу вследствие разногласий с SEA пришлось переписать программу и создать новый формат; так появились хорошо известный ZIP и программа PKZIP. В одном из немногочленных интервью Кац признался, что на момент создания PKZIP он рассматривал свою деятельность как хобби. Однако это была настоящая удача: сегодня трудно найти компьютер без какой-то вариации на тему ZIP. Разработка PKZIP сделала Каца одним из самых успешных распространителей shareware, а компания PKWare принесла ему состояние.

Формат ZIP пережил своего автора, его унаследовала международная рабочая группа Info-ZIP, состоящая примерно из 20 добровольцев, взаимодействуя через Сеть, они выпускают свободно распространяемые редакции Zip и UnZip, способные работать на десятках самых разных платформ, от суперкомпьютеров Cray и OS/390 до всех версий Windows. Параллельно компанией WinZip Computing выпускается коммерческая версия WinZip. Практически единственной альтернативой ZIP стал формат RAR, предложенный российским программистом Евгением Рошалем.


Из подшивок Computerworld

Internet как коммунальная услуга

Дмитрий Гапотченко, № 16-17, 1996

... Представители компании «Демос» рассказали о текущих делах, а также о созданной компанией уникальной системе доступа к базам данных, расположенных на WWW-серверах.

В настоящий момент компанией заключено 4,5 тысячи договоров, многие из которых коллективные. Большинство абонентов пользуются только услугами электронной почты, иными возможностями заинтересовалось около тысячи пользователей. Однако это соотношение понемногу меняется ....

http://www.osp.ru/cw/1996/16-17/08.htm

После приобретения Apple Эллисон не прочь стать ее руководителем

Роб Гас, № 17-18, 1997

В интервью японской ежедневной газете глава Oracle Ларри Эллисон выражает «глубокую уверенность», что его идея насчет приобретения Apple воплотится в жизнь ... В конце марта Эллисон сообщил об организации группы инвесторов для приобретения Apple. Тогда глава Oracle подчеркнул, что это предложение исходит не от его фирмы ....

http://www.osp.ru/cw/1997/17-18/033.htm

IBM предлагает универсальный транслятор

Шарон Годин, № 16-17, 1998

Корпорация IBM разрабатывает систему Universal Virtual Machine (UVM), позволяющую создавать платформенно-независимые приложения на языках, отличных от Java.

Пользователи и индустриальные наблюдатели считают, что появление средств разработки на базе UVM сыграет свою роль в продолжающемся конфликте, участниками которого с одной стороны выступают IBM и Sun Microsystems, а с другой — Microsoft. Последняя версия пакета средств разработки Visual J++, выпущенная Microsoft, привязывает приложения Java к платформе Windows.

http://www.osp.ru/cw/1998/16-17/26.htm

Compaq готовит к выпуску Alpha-серверы

Майкл Визард, Майкл Леттиг, № 16-17, 1999

В течение ближайшего года Compaq намерена предложить центрам данных целый спектр решений, в основе которых будут стоять Alpha-серверы, в значительной мере опираясь при этом на технологии, доставшиеся ей после приобретения компаний Digital Equipment и Tandem. Уже в следующем квартале Compaq планирует представить первые серверы, известные под кодовым названием Wildfire, которые будут оснащены процессорами Alpha, но при этом основанные на той же компонентной базе и архитектуре управления системой, что и выпускаемые сейчас Compaq ПК-серверы семейства ProLiant с процессорами Intel.

Серверы Wildfire будут выпускаться в конфигурациях с 16, 32, 64, а в конечном итоге и со 120 процессорами Alpha/800 МГц.

http://www.osp.ru/cw/1999/16-17/23.htm

Ноутбук с водяным охлаждением

Дэн Нил, № 16-17, 2000

Новый мобильный компьютер компании Toshiba, Portege 3440CT, имеет две яркие отличительные особенности — микропроцессор с водяным охлаждением и возможность работы в течение девяти часов от особого дополнительного ионно-литиевого аккумулятора.

Система водяного охлаждения прикреплена непосредственно к процессору. Охлаждение производится при помощи находящегося под низким давлением водяного пара, который отводит тепло процессора на шасси компьютера, выполненное из магния.

http://www.osp.ru/cw/2000/16-17/026_2.htm

Какого размера будут российские Internet-рельсы

Валерий Коржов, № 17, 2001

Закон «Об электронно-цифровой подписи», предложенный правительством, уже породил байку. Когда его показали Владимиру Путину, он будто бы спросил: «А не получится у нас с Internet так же, как с железными дорогами? У всей Европы один размер колеи, а у нас другой — несовместимый». С тех пор закон «Об ЭЦП» скрупулезно редактировался, а недавно внесен на рассмотрение в Госдуму.

http://www.osp.ru/cw/2001/17/023_0.htm

Япония возглавила рейтинг Top 500

Мартин Уильямс, № 17, 2002

Earth Simulator, построенный корпорацией NEC для Института наук о земле в городе Иокогама (Япония), стал наиболее быстродействующей машиной в мире, потеснив с пьедестала компьютер, установленный в Ливерморской национальной лаборатории в США.

Японский суперкомпьютер, используемый для анализа климатических изменений, почти впятеро превосходит по производительности машину, работающую в Ливерморе. Такие сведения приводит известный специалист из Университета штата Теннесси Джек Донгарра, составитель признанного рейтинга 500 наиболее мощных компьютеров мира. Производительность Earth Simulator составляет 35,6 TFLOPS.

http://www.osp.ru/cw/2002/17/004_1.htm

Полтораста лет вместе

Дмитрий Волков, № 17, 2003

Бизнес Siemens в России начался с контракта на поставку 75 телефонных аппаратов для линии Москва — Петербург. Это было в 1851 году, а в 1853 году для выполнения заказов российского правительства по прокладке линий телеграфной связи по всей стране было основано представительство. Однако у себя дома, в Пруссии, молодая компания оказалась в опасной кризисной ситуации — у ее создателя, Вернера фон Сименса, возник конфликт с прусским Управлением телеграфа, и заказы прекратились. Молодое предприятие было спасено только благодаря строительству в России линий телеграфной связи протяженностью в десятки тысяч километров.

http://www.osp.ru/cw/2003/17/012_1.htm

«Портализация» всея Руси

Павел Куприянов, №17-18, 2004

В настоящий момент главным направлением деятельности по переходу к электронному правительству, является строительство порталов органов федеральной, региональной и муниципальной власти в Internet. Для начала через этот новый интерфейс должно быть организовано полное информирование граждан о деятельности власти: публикация абсолютно всех постановлений и распоряжений, в том числе их проектов, размещение справочной информации, ответы на вопросы.

http://www.osp.ru/cw/2004/17-18/042_2.htm

Поделитесь материалом с коллегами и друзьями