Сущности MPEG

Сущностей не следует умножать без необходимости.

Уильям Оккам*

Аналоговый сигнал на выходе студии преобразовывался в цифровой, передавался по наземным или спутниковым линиям связи, а на приемном конце его снова превращали в аналоговый и в таком виде передавали пользователю. Затем в эту цепочку влились цифровые комплексы подготовки программ, существенно расширившие возможности режиссера и повысившие качество телевизионного изображения (или, как часто говорят специалисты, картинки). Но наиболее важным шагом к действительно цифровому телевидению стало появление систем цифрового телевизионного вещания.

С возникновения первых цифровых видеосистем (до вещания было еще ох как далеко!) началась и активная разработка методов и алгоритмов сжатия видеоданных. Это и понятно, ведь для качественной оцифровки телевизионного сигнала шириной 6 МГц необходимо работать с частотой дискретизации (помните теорему Котельникова?) не менее 12 МГц, т. е. брать как минимум 12 млн отсчетов в секунду. При использовании восьмибитного кодирования получим скорость передачи сигнала яркости (для черно-белой картинки) 100—120 Мбит/с. Добавьте сюда цветовую информацию и служебные сигналы, получите цифру 270 Мбит/с. Обработать в реальном времени, передать и сохранить такой поток зачастую не под силу и современным компьютерным системам, а что уж говорить о 80-х!

Однако разработчики не оставляли надежд создать оптимальные алгоритмы сжатия цифрового видео. По сути, они в очередной раз пытались реализовать теоретические положения, сформулированные и доказанные более полувека назад. Ведь теория решения задач цифрового представления и сжатия информации была обоснована в трудах Н. Винера, К. Шеннона, А. Колмогорова и В. Котельникова еще в 30-е годы. Другое дело, что тогда в руках авторов теории не было технологии, способной воплотить в жизнь их идеи.

Стоит также вспомнить, что теория цифровой компрессии видеосигнала была изящно и доступно изложена в 1965 г. в книге Д. С. Лебедева и И. И. Цукермана «Телевидение и теория информации». Правда, ее введение содержало и такую «отрезвляющую» фразу: «К сожалению, несмотря на все теоретические успехи, практика применения теории информации в телевидении пока еще стерильна». Сегодня, 35 лет спустя, наконец наступило время, когда эта теория перестала быть бесплодной, и мы склоняемся над колыбелью младенца, только что пришедшего в мир. «Новорожденное» явление — цифровое ТВ, которое, что уже очевидно, изменит и облик самого телевидения, и образ жизни телезрителей.

Как в старой сказке о спящей красавице, к колыбели с подарками и пожеланиями пришли волшебницы. И главная из фей — MPEG (Motion Picture Experts Group), группа экспертов по подвижным изображениям, специально организованная Международной организацией по стандартизации (ISO) и Международной электротехнической комиссией (IEC). MPEG активно участвует в разработке стандартных алгоритмов сжатия, от которых всецело зависит судьба цифрового телевидения. В эту группу входят Fujitsu, General Instrument, Matsushita, Mitsubishi, Philips, Scientific Atlanta, Sony, Samsung Electronics и ряд других производителей аппаратуры сжатия, мультиплексирования и модуляции телевизионного сигнала.

Каждый новый стандарт, утверждаемый MPEG, имеет свою точку отсчета: это значение скорости передачи информации, которая зависит не только от уровня развития компьютерных технологий, но и от области применения конкретного стандарта. Воплощение алгоритмов сжатия относится к сфере ответственности производителя. Такой подход стимулирует непрекращающуюся борьбу за потребителя, а значит, и за достижение наилучших результатов.

MPEG — 1, 2...

В 1988 г. немногочисленная группа молодых экспертов взялась за разработку формата хранения видеоинформации на CD-ROM и ее воспроизведения со скоростью около 1,5 Мбит/c. Поддержку ей оказала голландская фирма Philips, которая в 1956 г. выпустила на рынок первую компакт-кассету, а затем создала технологию цифровых оптических дисков (она и по сей день играет заметную роль в деятельности MPEG).

В январе 1992 г. опубликованы спецификации MPEG-1 — первого представителя семейства MPEG. В качестве стандарта они были приняты почти через два года, к декабрю 1993.

Алгоритм сжатия MPEG-1 предусматривает получение изображения с разрешением (за счет развертки) вчетверо меньшим, чем разрешение картинки вещательного телевидения: 288 активных строк по 352 отсчета в активной части каждой. Этот эффект достигнут благодаря идее «прореживания» исходного телевизионного сигнала по вертикали и горизонтали (согласно MPEG-1, изымается каждая вторая строка и каждый второй отсчет в оставшихся строках). При приеме такое изображение с помощью аппаратных или программных средств растягивается до размера полного экрана. И хотя картинка явно теряет качество, зато остается возможность смотреть полноэкранную видеозапись, даже если используются самые простенькие дисководы CD-ROM.

Воодушевленная успехом применения MPEG-1, группа энтузиастов приступает к работе над MPEG-2. Он был задуман как стандарт для передачи (а не для хранения и воспроизведения, подобно MPEG-1) цифрового телевизионного изображения, поэтому, конечно, хотелось обойтись без потерь четкости. Естественно, это не единственное отличие MPEG-2 от MPEG-1.

Ключевой особенностью MPEG-2 является возможность разделить результирующий, подготовленный к передаче, видеосигнал на несколько независимых потоков, содержащих сигналы различного качества. Такая функция потребуется в будущем, когда (пофантазируем) возникнет необходимость в одновременной трансляции сигнала ТВЧ (телевидения высокой четкости) и стандартного цифрового телевизионного сигнала. Это «уравняет» возможности владельца «крутого» телевизора ТВЧ и тети Клавы из соседнего подъезда, имеющей старенький цифровой «Рекорд». Они будут принимать одну и ту же программу, но с разным качеством картинки. (История телевидения опять повторяется. Помните, при разработке стандартов цветного телевидения одним из требований было обеспечение совместимости, т.е. возможности приема цветной картинки в черно-белом варианте на монохромные телевизионные приемники?) И совместимость важна не только потому, что позволяет использовать предшествующие, более простые, системы. Она создает условия для перехода на более высокие уровни качества.

Эти и многие другие требования легли в основу стандарта ISO/IEC 13818-2, определяющего MPEG-2 как целое семейство согласованных и совместимых цифровых стандартов сжатия телевизионных сигналов с различной степенью сложности используемых алгоритмов.

Повальное увлечение телевидением высокой четкости, охватившее в свое время специалистов в области телевещания, не обошло стороной и MPEG. Первоначально для сжатия сигналов ТВЧ разрабатывался самостоятельный алгоритм MPEG-3, однако на последующих этапах оказалось, что кодирование по MPEG-2 и даже по MPEG-1 (правда, с некоторой доработкой) вполне можно применять для формата ТВЧ. В результате разработка MPEG-3 была прекращена.

Зато начались работы над MPEG-4 — принципиально новым объектно-ориентированным мультимедийным алгоритмом компрессии и передачи цифровых аудио- и видеосигналов, предназначенным для «кодирования аудио- и видеоданных с очень малыми скоростями передачи». И хотя разработка его спецификаций началась еще до массового признания Всемирной паутины, MPEG-4 прочат большое будущее в приложениях Internet-вещания, причем не случайно. Здесь задачи намного сложнее, чем при традиционной передаче изображений. Большего внимания требуют не только само кодирование, но и коррекция ошибок, адаптивная синхронизация. Кроме того, для обеспечения непрерывности трансляции при постоянно меняющейся доступной пропускной способности особое значение приобретает система буферизации. Все это требует принципиально иных (по сравнению с MPEG-1) технологий сжатия изображения и звука, которые и реализованы в MPEG-4.

Вообще, 1998-й год можно назвать переломным в судьбе телевещания. Именно с этого момента к обычным требованиям, которые предъявляются к телевизионной программе, стали добавлять цифровое сжатие или уменьшение объема данных, описывающих телевизионную картинку.

Компрессия видеоданных

Любому третьекурснику института связи известно, что телевизионный сигнал избыточен, поскольку от кадра к кадру меняется только некоторая часть подвижного изображения — как правило, действие происходит на переднем плане, а фон остается достаточно стабильным. На лекциях по теории вероятностей учат, что «избыточность есть следствие определенных корреляционных связей». Отсюда легко понять: для телевизионного сигнала корреляция означает, что каждый элемент изображения некоторым образом зависит от элементов, соседствующих с ним во времени и пространстве.

При поточном сжатии видеосигнала алгоритм MPEG анализирует динамику изменений изображения и устраняет имеющиеся в нем избыточности.

Статистическая избыточность — это взаимозависимость между соседними (по вертикали, горизонтали и во времени) отсчетами сигнала. Уменьшение такой избыточности до определенных пределов полностью обратимо, т. е. сигнал может быть восстановлен без потери информации.

Избыточность по восприятию обусловлена несовершенством нашего зрения, что, к слову, используется для технических целей уже достаточно давно. Например, свойство глаза замечать изменение яркости лучше, чем изменение цвета, учитывается при разработке всех стандартных аналоговых системах кодирования цвета. Для нас незаметны и быстрые смены картинок — именно эта особенность сделала возможным появление кино, а затем и мультипликации.

Структурная избыточность заложена в формате телевизионного сигнала. Избыточными являются периодически вводимые в аналоговый ТВ-сигнал стандартные служебные импульсы — гасящие, синхронизирующие, уравнивающие. При передаче цифрового сигнала необходимость в передаче служебных отпадает, поскольку они легко восстанавливаются при приеме. Для сведения скажем, что удалив из цифрового ТВ-сигнала только гасящие импульсы строк и полей, можно снизить скорость передачи почти на четверть.

Спектральная избыточность возникает в результате использования чрезмерно высокой частоты дискретизации. Проинтерполировав определенные группы отсчетов, можно изменить спектральный состав за счет снижения верхней частоты полученного на выходе ЦАП аналогового ТВ-сигнала. Затем сигнал заново оцифровывают с меньшей частотой дискретизации. Однако такая обработка сигнала требует значительного объема вычислений, она необратима, а кроме того, что совсем печально, качество восстановленного изображения почти всегда существенно хуже исходного. В отличие от первых трех видов избыточности, спектральная избыточность при кодировании по MPEG-2 не устраняется.

Помимо давно известных (их уже можно называть академическими) методов устранения избыточности в MPEG-2 были использованы и новые алгоритмы сокращения статистической избыточности. Здесь особо эффективными оказались два метода: кодирование отсчетов с предсказанием и дискретно-косинусное преобразование (ДКП).

Кодирование отсчетов с предсказанием

При кодировании с предсказанием вычисляется разность между истинным и предсказанным значением отсчета. Именно эта величина и передается в сигнале. Предсказание выполняется по соседним с предсказываемым отсчетам, причем под соседними надо понимать отсчеты, расположенные до и после рассматриваемого по горизонтали (соседние отсчеты на строке), вертикали (в соседних строках) и во времени (отсчеты с теми же координатами в соседних полях и кадрах).

Предсказание может быть экстраполяционным (его часто называют предсказанием вперед). В этом случае оценку отсчета получают в результате экстраполяции предшествующих значений. При простейшем предсказании вперед за ожидаемое значение принимается уровень предшествующего отсчета на строке (внутрикадровое предсказание). При использовании более сложного, межкадрового, предсказания текущий отсчет оценивается на основании знания о величине отсчета с теми же координатами в предыдущем кадре.

При интерполяционном (двунаправленном) предсказании оценка выполняется по известным значениям предшествующих и последующих отсчетов с применением алгоритмов интерполяции. И хотя оценка при этом получается наиболее точная, за нее приходится платить увеличением объема вычислений, а значит, и памяти, необходимой для их выполнения. Надо сказать, овчинка стоит выделки далеко не всегда.

Описанные методы предсказания эффективны при передаче неподвижных изображений или крупных участков изображения без мелких деталей, где яркость остается постоянной или изменяется достаточно медленно. Если же в изображении имеются движущиеся объекты или оно смещается целиком, то ситуация значительно усложняется. Тогда отсчеты, описывающие одни и те же элементы изображения, от кадра к кадру будут смещаться, приводя к появлению значительной по объему разностной информации, хотя в остальном никаких изменений картинки может и не происходить.

Здесь незаменима еще одна ключевая возможность MPEG-2, получившая название «компенсация движения». Для ее реализации определяются векторы, описывающие направление и дистанцию смещения от кадра к кадру движущихся частей изображения. С их помощью указывается положение кодируемого отсчета в новом кадре (компенсируется его движение) и, таким образом, сохраняется высокая точность предсказания. При этом чем точнее оценка векторов смещения, тем меньше искажения, вносимые процессом компрессии.

Кроме того, если в подвижном изображении какие-либо объекты движутся в одном направлении и с одинаковой скоростью (что бывает часто), то соответствующие фрагменты сигнала будут кодироваться одним и тем же вектором смещения. При последующем сжатии это даст дополнительное увеличение степени компрессии.

И здесь опять вспомним о волшебницах. Одним из подарков от «феи» Philips стал разработанный ее специалистами алгоритм оценки движения, основанный на методе векторного анализа с переменной разрешающей способностью. Согласно данному алгоритму, векторы определяются относительно результирующих рядом расположенных векторов, что позволяет еще более повысить степень сжатия.

Несомненно, простое предсказание не может обеспечить высокой эффективности сжатия изображений, содержащих как неподвижные участки, так и быстро перемещающиеся фрагменты. По этой причине в алгоритмах семейства MPEG используются три вида предсказаний с компенсацией движения: внутрикадровое и межкадровое предсказание вперед, а также межкадровое двунаправленное предсказание.

Дискретно-косинусное преобразование

ДКП предусматривает разбиение кадра на блоки по 64 (8х8) отсчета, называемые сигнальными матрицами. Нет необходимости расписывать формулы дискретно-косинусного преобразования: все, кому это интересно, могут найти их в справочнике по высшей математике. Главное здесь то, что в результате исходная сигнальная матрица преобразуется в матрицу частотных коэффициентов такого же размера. Она уже не имеет прямой геометрической связи с положением отсчетов сигнала в растре, а просто является удобной формой математической записи, в которой частотные коэффициенты ДКП можно рассматривать как двумерный спектр изображения в горизонтальном и вертикальном направлениях.

ДКП-спектр очень удобен для сжатия данных. Действительно, одной из его особенностей является то, что основной «вес» его составляющих концентрируется в небольшой области вблизи нулевых частот, а амплитуды высокочастотных составляющих или очень малы, или равны нулю. И в этом весь секрет. Передаются только те коэффициенты, которые превышают пороговую величину, а остальные считаются нулевыми. Введение порога, строго говоря, приводит к потерям информации и, соответственно, к снижению качества восстановленного изображения, однако при оптимальном выборе величины порога такое ухудшение окажется практически незаметным.

Структура MPEG-сигнала

MPEG-сжатие начинается с создания исходного (ключевого) I-кадра, или Intra-кадра. I-кадры играют роль опорных при восстановлении остальных изображений и размещаются последовательно через каждые 10—15 кадров. В интервале между I-кадрами изменяются только некоторые фрагменты изображений, и именно эта разница кодируется. Кроме I-кадров в MPEG-последовательности имеются еще два типа изображений:

predicted (P) — предсказанные кадры, описывающие различия между текущим и предыдущим кадрами (типа I или P);
bi-directional interpolated (B) — интерполированные в двух направлениях (вперед и назад) кадры, содержащие лишь указатели на предыдущие или последующие кадры типа I или P.

Основу файла формата MPEG составляют I-кадры, сжатие которых выполняется только с применением внутрикадрового предсказания. Выделение I-кадра — это первый этап, на котором степень компрессии еще относительно невелика, но зато восстановленное изображение почти полностью соответствует исходному, а его качество мало зависит от ошибок, возникающих в процессе кодирования и передачи сигнала по каналу связи.

Вообще MPEG-кодирование — процесс «возвратно-поступательный». Кодирование Р-кадров выполняется с помощью алгоритмов компенсации движения и межкадрового предсказания вперед по предшествующим I- или Р-кадрам до тех пор, пока в блоке не появится новый объект. После его обнаружения опять происходит переход к алгоритмам, используемым для кодирования I-кадров, т. е. к внутрикадровому предсказанию. Заметим, что степень сжатия Р-кадров почти втрое превышает этот показатель для I-кадров.

Определим «иерархию»: I-кадры являются основой для предсказания Р- и В-кадров, а Р-кадры, в свою очередь, используются для создания последующих Р- или В-кадров. Очевидно, что ошибки любого кадра распределяются по всем кадрам, созданным на его основе, поэтому при декодировании I- и Р-кадров требуется обеспечивать высокую точность восстановления исходного изображения.

Алгоритмы кодирования В-кадров зависят от характера картинки. В MPEG-2 предусмотрено четыре способа кодирования. Первый, самый простой, — компенсация движения и предсказание вперед по ближайшим предшествующим I- или Р-кадрам. При появлении в кодируемом В-кадре новых объектов применяется предсказание назад по ближайшим последующим I- или Р-кадрам вместе с компенсацией движения. Третий алгоритм включает в себя компенсацию движения и двунаправленное предсказание по предшествующим и последующим I- или Р-кадрам. И наконец, четвертый основан на внутрикадровом предсказании без компенсации движения (он чаще всего используется при резкой смене плана или высоких скоростях движения отдельных фрагментов картинки).

При кодировании В-кадров обеспечивается наибольший коэффициент сжатия. Однако чем выше степень сжатия, тем ниже точность восстановления исходного изображения. Именно поэтому В-кадры не применяются в качестве опорных, а значит, и ошибки при их декодировании не распределяются по другим кадрам.

Метод компенсации движения, определенный в алгоритме MPEG-2, основан на обработке макроблоков (структурных единиц кадра, описывающих квадратные участки изображения размером 16 пикселей на 16 строк). Согласно спецификации MPEG-2, размеры макроблока согласуются со структурой, используемой для дискретизации изображения ТВ-кадра. При этом в каждом ТВ-кадре должно быть целое число макроблоков.

В процесс кодирования входят операции сравнения базового и последующих кадров, поиска идентичных или похожих макроблоков. Макроблоки, не содержащие изменений, игнорируются. В результирующем потоке сохраняются только данные о различиях между кадрами — так называемый вектор смещения.

Чтобы определить вектор смещения, например, при предсказании вперед, поиск нового положения определенного макроблока первого кадра выполняется в зоне поиска второго кадра. Для всех отсчетов этого макроблока вычисляются межкадровые разности и рассчитываются координаты вектора смещения, описывающего движение макроблока по вертикали и горизонтали относительно его начального положения.

Зона поиска должна быть достаточно большой, чтобы быстро движущийся макроблок изображения первого кадра не вышел из зоны поиска второго кадра. Однако ее размеры ограничены техническими возможностями аппаратуры, так как понятно, что чем больше размер зоны, тем больше и объем вычислений, которые необходимо выполнить в масштабе реального времени. На практике размеры зоны в четыре раза больше размеров макроблока, т. е. она ограничена квадратом изображения 64х64 пикселей.

Повышение эффективности сжатия

К настоящему времени создано множество схем сжатия, по которым выполняется компрессия различной степени — от средней, используемой при профессиональной видеозаписи, до достаточно высокой, реализуемой в любительских магнитофонах и устройствах видеозаписи на компакт-диски. Для цифрового спутникового, наземного и кабельного телевизионного радиовещания цифровая компрессия становится, в значительной мере, гарантией максимально эффективного использования спектра при одновременном сохранении качества. Чем выше эффективность сжатия, тем более экономно расходуется драгоценный ресурс полосы пропускания, что позволяет либо улучшить качество картинки в пределах заданной полосы, либо, за счет уменьшения полосы, понизить стоимость передачи телевизионной программы.

Еще один подарок от Philips — кодер DVS 3115/01, разработанный на базе MPEG-2. Для повышения эффективности сжатия в нем реализованы оптимальное подавление шума, обнаружение момента смены плана, двупроходное кодирование и адаптивное кодирование поля/кадра.

Выбор оптимальной эффективности сжатия — задача достаточно сложная. Пропускная способность должна динамически распределяться в соответствии с требованиями отображения исходного материала. При этом необходимо избегать кодирования изображения, которое не воспринимается зрением человека.

Шум — заклятый враг всякого телевидения, в том числе цифрового. Он съедает полосу в ущерб эффективности сжатия или качеству изображения. Ясно, что шум повышает сложность видеосигнала. Являясь в значительной степени случайным, он по-разному проявляется в разных кадрах, увеличивая, таким образом, разностную информацию. А поскольку кодируется и передается именно разностная информация, наличие шума приводит к пустым тратам полосы частот на его тщательное кодирование, что, понятно, не повышает качества воспринимаемого изображения.

Подавление шума на этапе предварительной обработки исключает как сами шумовые составляющие, так и необходимость их кодирования, т.е. позволяет сберечь драгоценный частотный ресурс. Добавленное к эффективному кодированию, шумоподавление обеспечивает выигрыш в скорости передачи до 15% (при передаче сильно зашумленных сигналов). Сохраненная полоса может использоваться либо для добавления новых каналов, либо для повышения качества изображения.

Выравнивание качества. Поскольку при телевизионном вещании качество передаваемого сигнала во многом определяется сложностью изображения, то для обеспечения комфортного просмотра важно поддерживать качество такого сигнала практически постоянным для изображений различной сложности. С этой целью в MPEG-2 предусмотрен буфер, позволяющий избежать переполнения или недостаточного заполнения декодера.

Двупроходное кодирование применяется в качестве дополнительного способа повышения эффективности сжатия. Процедура выполняется в режиме реального времени, при этом каждый кадр «просматривается» дважды. Во время первого прохода анализируется сложность изображения, чтобы обнаружить момент смены плана и выбрать тип структуры, наилучшим образом соответствующей кодированию данного изображения. При втором проходе создается бинарный поток и выполняется оптимизация распределения бит в доступной пропускной способности канала и использования объема буфера.

Статистическое мультиплексирование. Основу системы кодирования составляет видеокодер, рассчитанный на работу с постоянной либо переменной скоростью потока. Говоря о статистическом мультиплексировании, необходимо понимать, что взаимосвязь между скоростью потока и картинкой не описывается фиксированным соотношением бит, а зависит от содержимого изображения, точнее — от показателя, который часто называют его сложностью (X). Например, если для кодирования двух картинок (1 и 2) разной сложности (Х1<Х2) используется одинаковое количество бит, то их качество изображения (PQ) будет различным (PQ1>PQ2). Системы с постоянной скоростью потока будут вести себя именно так. Как правило, качество изображения, полученного при использовании таких систем, достаточно хорошее, за исключением случаев, когда степень сложности изображения превышает возможности видеокодера (тогда искажения кодирования становятся заметными).

Технология статистического мультиплексирования, задействуемая, например, в системе StatCast (Philips), позволяет получить выигрыш в использовании полосы (за счет шумоподавления) и реализовать его для достижения лучшего качества изображения и/или понижения «удельной» скорости потока (на канал). Система обеспечивает и такое выравнивание (усреднение) качества получаемых телепрограмм, что качество картинки остается постоянным на протяжении всей передачи; при этом появляется возможность перераспределить пропускную способность. При передаче большинства типов картинок StatCast поддерживает необходимый уровень пропускной способности, как бы «запасая» часть полосы для кодирования более сложных фрагментов изображения. Очень быстрые последовательные изменения изображений также требуют больших затрат пропускной способности (хотя они не всегда определяются человеческим глазом). В системе StatCast быстрая смена картинки отслеживается во избежание расточительности при распределении скорости потока.

Условный доступ

Использование цифрового сигнала открыло для ТВ-операторов дополнительные возможности. Одна из них реализуется с помощью систем условного доступа, которые предоставляют абонентам гарантированную возможность индивидуального доступа к телевизионным каналам, а операторам позволяют отслеживать абонентские счета и управлять распределением платных ТВ-программ.

На рынке существует немало систем условного доступа, но, как правило, все они обладают примерно одинаковыми возможностями. Наиболее часто используется продукт CryptoWorks компании Philips. Он поддерживает разнообразные режимы доступа (как для профессиональных пользователей, так и для потребителей), в том числе абонентский, для просмотра предварительно заказанных платных передач, для спонтанного просмотра предварительно заказанных платных передач (без предварительного заказа). Кроме того, CryptoWorks обеспечивает услуги передачи данных по конкретному адресу (электронная почта).

На передающей стороне система условного доступа обычно интегрируется с одной или несколькими системами администрирования (она передает им сведения о правах доступа к программе и получает команды для регулирования условий работы пользователей). На приемной стороне это ПО встроено в декодер и обеспечивает доступ абонентов к оплаченным ими каналам. Передаваемая информация — изображение, звук и данные — скремблируется и шифруется, что делает ее недоступной для тех, кому она не предназначена, и позволяет предотвратить несанкционированный доступ.

Без MPEG нет «цифры»

Сегодня цифровое телевидение немыслимо без стандарта MPEG-2. Можно сказать, что оно вообще смогло выйти за порог студий лишь благодаря методам компрессии, основанным на «схожести» последовательных изображений и несовершенстве нашего зрения. Для цифрового телевещания алгоритмы сжатия MPEG-2 позволяют без заметной потери качества снизить первоначальную скорость передачи приблизительно в 20 раз. Если же не привередничать и не предъявлять высоких требований к качеству, то скорость можно снизить в 50 и даже 100 раз.

Применение компрессии обеспечивает огромную экономию ресурсов, а значит, и средств. Например, в транспондер телевещательного спутника, через который передавался один аналоговый телевизионный канал, можно «упаковать» от двух цифровых каналов с высоким качеством (ТВЧ) до 16 каналов с более низким качеством. И хотя достойно сожаления, что ширина полосы для передачи телевизионных сигналов сегодня определяется не показателями качества, а выкладками бухгалтера, что под давлением финансовых обстоятельств оператор зачастую «набивает» полосу большим числом каналов, чем это допустимо для сохранения приемлемого качества, но без MPEG-2 даже эти «недостойные» действия едва ли имели бы место.

И хотя компания Philips уже объявила о создании кодера в новом стандарте MPEG-4, который предназначен для потоков изображений, передаваемых со скоростями от 16 до 2000 кбит/с, пока можно с уверенностью утверждать, что MPEG-2 — доминирующий алгоритм сжатия для всех приложений цифрового видео. Исключение составляют разве что системы нелинейного монтажа, где ныне в основном применяется Motion-JPEG. Однако с большой долей вероятности можно предсказать, что с увеличением на рынке количества устройств кодирования в стандарте MPEG-2 и эта ниша будет занята данным стандартом. Легко прогнозировать и освоение технологией MPEG новых областей применения. Например, вскоре наверняка появятся устройства записи на высококачественные цифровые DVD-видеодиски, полностью цифровые вещательные и монтажные комплексы.

* * *

Давно известный тезис о том, что совершенству нет предела, в ходе развития цифрового телевидения подтверждался неоднократно. Однако мы должны отдавать себе отчет и в том, что методы и устройства цифровой компрессии, доступные для нас сегодня, — это, скорее всего, только самые простые решения, а наилучшим устройством цифровой компрессии, которое было создано природой (или Богом) несколько тысячелетий назад, по-прежнему остается человеческий мозг.

Нормальное цветное изображение на сетчатке глаза представляет собой информационный поток со скоростью 140 Мбит/с. Но электрохимический компьютер, расположенный у нас в голове, не может работать с большими скоростями. Его тактовая частота (альфа-ритм) равна всего 10 Гц. При большем объеме информации человек теряет способность даже к самому простейшему восприятию (и, как правило, к осмысленным действиям), поэтому по зрительному нерву от глаза к мозгу информация передается со скоростью лишь 50— 70 бит/с. Следовательно, в системе «глаз—мозг» сигнал сжимается в миллионы раз по неизвестным нам пока алгоритмам. Мы же, изобретая стандарты компрессии, радуемся возможности уплотнить сигнал всего в несколько десятков раз и при этом умножаем сущности, описывающие изображение. Кто и когда реализует подобный природному алгоритм сжатия, оперирующий с минимальным количеством сущностей?

ОБ АВТОРЕ

Юлия Волкова — независимый автор. С ней можно связаться по адресу nets@networld.ru, Волковой.

* Уильям Оккам — англ. философ-схоласт 14 века. Согласно приведенному принципу «бритвы Оккама», понятия, несводимые к интуитивному или опытному восприятию, должны быть удалены из науки.