Структура MPEG-последовательности
Использование MPEG
MPEG-1
MPEG-2
Заключение
Словарь специальных терминов
Статус MPEG
MPEG: профессиональные системы для оцифровки и сжатия

Если вы воспринимаете идею об использовании компьютера в качестве видеомагнитофона и телевизора как некую экзотику, функцию, предназначенную больше для демонстрации возможностей своего любимца, чем для повседневного применения, вы неправы. Возможность смотреть на компьютере полнометражные полноэкранные видеофильмы (CD-i, Video-CD) всего несколько лет назад казалась просто нереальной. И если раньше найти Video-CD фильмы было довольно сложно, то сейчас их ассортимент состоит уже из сотен наименований, причем каждый месяц на российском рынке появляются десятки новых дисков, многие из которых представляют прекрасные отечественные фильмы.

Сейчас, когда идея домашней видеостудии уже витает в воздухе, чтобы оцифровать и отредактировать одну минуту видео с качеством VHS (например, с помощью платы miroVideo DC20), требуется от 100 до 200 Мбайт дискового пространства. Легко подсчитать, что для монтажа получасового свадебного ролика необходимо такое количество свободных мегабайтов, которое вряд ли имеется на вашем жестком диске. В отличие от AVI-формата, который обычно использует алгоритмы сжатия Motion-JPEG, MPEG-файлы занимают значительно меньше места. С помощью MPEG-сжатия мы бы без проблем уложились в 1Гбайт. Но здесь есть свои проблемы: во-первых, MPEG в отличие от AVI очень трудно редактировать и до последнего времени не было соответствующих редакторов; во-вторых, цена систем для оцифровки MPEG несколько выше, чем на обычные платы ввода видео. Постепенно цена плат для проигрывания MPEG становится все более доступной, да и большинство современных компьютеров Pentium могут справиться с этой задачей за счет программных средств. Грядущая эра MMX окончательно сделает компьютерное видео привычным элементом на любом домашнем ПК.

Структура MPEG-последовательности

Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности (как это происходит при сжатии видео с помощью алгоритмов Motion-JPEG), а анализируется динамика изменений видеофрагментов и устраняются избыточные данные. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, алгоритм MPEG начинает сжатие с создания исходного (ключевого) кадра. Играя роль опорных при восстановлении остальных изображений, они размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между ними, претерпевают изменения, и именно эта разница сохраняется при сжатии. Таким образом, MPEG-последовательность содержит три типа изображений:

  • Intra (I) - исходные (И) кадры, содержащие основное изображение;
  • Predicted (P) - предсказуемые (П) кадры, содержащие разность текущего изображения с предыдущим И-кадром или учитывающие смещения отдельных фрагментов;
  • Bi-directional Interpolated (B) - двунаправленные (Д) кадры, содержащие только отсылки к предыдущим или последующим изображениям (И или П) с учетом смещений отдельных фрагментов.
  • И-кадры имеют довольно низкий коэффициент сжатия и составляют основу MPEG-файла. Именно благодаря им возможен случайный доступ к какому-либо отрывку видео. П-кадры кодируются относительно предыдущих кадров (будь то И- или П-кадры) и обычно используются как сравнительный образец для дальнейшей последовательности П-кадров. В этом случае достигается высокий коэффициент сжатия. Д-кадры обеспечивают наибольший коэффициент сжатия, но при этом для их привязки к видеопоследовательности необходимо использовать не только предыдущее, но и последующее изображение. Сами Д-кадры никогда не используются для сравнения. Изображения объединяются в группы (GOP - Group of Pictures), представляющие собой минимальный повторяемый набор последовательных изображений. Типичной является группа вида:

    (И0 Д1 Д2 П3 Д4 Д5 П6 Д7 Д8 П9 Д10 Д11) 
    (И12 Д13 Д14 П15 Д16 Д17 П18 Д19 Д20 П21 Д22 Д23)

    Отдельные изображения состоят из структурных единиц - макроблоков, соответствующих участку изображения размером 16Ё16 пикселов. Компьютер анализирует изображение и ищет идентичные или похожие макроблоки, сравнивая базовый и последующие кадры. В результате сохраняются только данные о различиях между кадрами, называемые вектором смещения (vector movement code). Макроблоки, которые не претерпевают изменений, игнорируются, так что количество данных для реального сжатия и хранения существенно снижается. Для повышения устойчивости процесса восстановления изображений к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices). В свою очередь, каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости, а два определяют цветовые компоненты. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется дискретное косинусное преобразование (DCT - Discrete Cosine Transform). В результате при использовании MPEG-технологии можно добиться рабочего коэффициента сжатия более чем 200:1, хотя это приводит к некоторой потере качества.

    Использование MPEG

    MPEG-1

    Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители.

    Видеокиоски (или информационные киоски) дают возможность по-новому организовать и автоматизировать информационный сервис в рамках одной организации. Особенно это важно для розничных магазинов, автомобильных салонов, банков и музеев. Продавец не всегда способен уделить достаточно внимания сразу нескольким клиентам, зачастую он не имеет возможности подробно рассказать обо всех особенностях и спецификациях того или иного продукта или наглядно и эффектно его продемонстрировать. А видеокиоск всегда под рукой. В нем можно разместить не только подробную информацию об имеющихся продуктах и услугах, но и включить туда интерактивные видеофильмы, позволяющие просто и наглядно ответить на многие вопросы. К примеру: "Какие у вас имеются модели автомобилей?", "Расскажите об их особенностях", "Какой цвет я могу выбрать?". Информация, которая ранее выводилась в виде слайдов и сопроводительного текста, теперь становится более доступной и эффектной благодаря внедрению полноэкранного видео. Используя MPEG-1, разработчик может регулярно и без особых дополнительных затрат обновлять содержание видеокиоска. Развитие программных средств и эволюция пользовательского интерфейса ведут ко все более впечатляющим возможностям интерактивности.

    Видео по требованию (Video on Demand). Термин "видео по требованию" появился сравнительно недавно. Вначале подобный сервис можно было встретить только в дорогих отелях, а теперь уже полным ходом идет реализация глобальной идеи об интерактивной цифровой телевизионной системе, благодаря которой любой пользователь сможет запросить какой-либо фильм или передачу в определенное время и прямо на дом. Современные технологии позволяют говорить об этом проекте как о грядущей реальности, хотя до появления подобного устройства в широком употреблении пройдет еще несколько лет.

    Видео по телефону. Некоторые телефонные компании сейчас разрабатывают системы, позволяющие получать фильмы по обыкновенной телефонной линии. Правда, приходится учитывать ограниченную пропускную способность имеющихся телефонных коммуникаций, но повсеместное внедрение стандарта ISDN и других новых технологий связи поможет решить эту проблему.

    Обучение. Рынок тренажеров и интерактивных учебных комплексов сейчас бурно развивается. Раньше для подобных задач использовались аналоговые видеосистемы и лазерные видеодиски. Стандарт MPEG стал идеальной альтернативой, так как эта технология при более низких затратах дает целый ряд преимуществ: транспортабельность и компактность, простота модернизации и возможность работать в сети. Мне кажется, что для российских фирм этот рынок сегодня также представляет большой интерес.

    Презентации. Корпоративный рынок становится все более требовательным к качеству и техническим возможностям презентационного оборудования. Большинство новых программных пакетов, предназначенных для подобных целей, поддерживают работу с видео, в том числе в формате MPEG. Однако многие пользователи пока недооценивают возможности, которые предлагают нам современные мультимедиа-системы. Ведь даже если написать хороший, аргументированный проект или доклад, то без эффектного сопровождения и интерактивных иллюстраций ваши идеи могут остаться непонятыми и невостребованными. Многие менеджеры уже убедились в этом на собственном опыте.

    Видеобиблиотеки. Организации, имеющие большие видеоархивы, могут существенно выиграть, перекодировав их в цифровой формат и поместив на CD-носители или специальный сервер. В отличие от аналоговых носителей данный метод гарантирует длительное хранение, многократное проигрывание без потери качества и быстрый доступ к любому фрагменту. К тому же, обладая подобным видеоматериалом, вы легко сможете открыть удаленный доступ к нему через внутреннюю локальную сеть (интранет) или через WWW. Поэтому музеи, библиотеки, государственные предприятия и научные учреждения, так же как рекламные фирмы и информационные агентства, переходят сейчас на цифровое видео.

    MPEG-2

    Спецификации MPEG-2 подразумевают использование высоких разрешений для достижения максимального качества изображения, поэтому этот формат применяется в первую очередь профессионалами.

    Кабельное телевидение (CATV: Cable Television). Идея перевести кабельное телевидение на цифровое вещание напрашивается сама собой. Имеющиеся магистрали для передачи видеосигнала вполне могут выдержать интенсивность и объем данных, необходимые для вещания MPEG-видео высокого разрешения (MPEG-2). Уже в ближайшее время должны появиться первые подобные системы, и тогда пользователь реально сможет принимать телепередачи в высоком разрешении со стереозвуком и даже Dolby Surround.

    Направленное спутниковое вещание (DBS: Direct Broadcast Satellite). Консорциум Hughes/ USSB собирается использовать MPEG-2 для направленного вещания. Компания Thomson уже производит специальные декодеры, установив которые вы сможете принимать до 150 каналов. Правда, такие системы работают пока только в Северной Америке.

    ТВЧ - телевидение высокой четкости (HDTV: High-Definition Television). В США создан консорциум компаний (U.S. Grand Alliance), который разрабатывает новый стандарт HDTV для телевидения высокого разрешения. В нем будет использоваться MPEG-2 с поддержкой следующих режимов: 1440Ё960 при 30 Гц и 1280Ё720 при 60 Гц. Легко себе представить, сколь высоко будет качество изображения и звука в подобных телепередачах.

    Заключение

    В итоге можно утверждать, что MPEG является доминирующим стандартом для полнометражного цифрового видео, за исключением нелинейного цифрового монтажа, где в данный момент более распространен Motion-JPEG. Однако по мере того как все большее количество кодирующих MPEG-систем будет появляться на рынке, MPEG-2 внедрится и в эту нишу. Надо полагать, что найдется много новых областей применения для технологии MPEG, начиная от высококачественных цифровых DVD-видеодисков и новейших игровых систем и заканчивая совершенными цифровыми вещательными и монтажными комплексами.


    Словарь специальных терминов

    AES/EBU (Audio Engineers Society / European Broadcast Union) - Общество звукоинженеров / Европейское вещательное объединение - цифровой интерфейс для студийной радиоаппаратуры; позволяет передавать звуковые сигналы между аппаратурой без ухудшения качества, которое неизбежно теряется при передаче сигналов в аналоговой форме.

    AVI (Audio Video Interleaved) - оригинальная аббревиатура для Microsoft Video for Windows.

    AVI MPEG (Editable MPEG) - разновидность MPEG-формата. Структура AVI MPEG основана только на И-кадрах, поддающихся редактированию в любом видеоредакторе. Для дальнейшего преобразования этого формата в стандартный MPEG-файл необходимо перекодировать его на основе И-, П- и Д-последовательностей (IPB).

    CCIR-601 - стандарт Интернационального комитета по телеграфу и телефонии (International Committee on Telegraph and Telephones), описывающий формат цифрового видео с разрешением 720Ё486 при частоте 30 Гц.

    CD-i (Compact Disc Interactive) - разновидность игровой приставки со встроенным дисководом CD-ROM. Аналогичное название получил формат CD-дисков с MPEG-фильмами и играми, разработанный фирмой Philips для этой приставки.

    CODEC (Coder and Decoder) - кодек, аббревиатура для микросхемы или программного драйвера, осуществляющих кодирование и декодирование определенных данных (например, аппаратный CODEC Motion-JPEG).

    Decode (декодирование) - термин, определяющий процесс декомпрессии данных.

    DVI (Digital Video Interactive) - схема сжатия видеоданных фирмы Intel, которая не была утверждена комитетом ISO из-за развития MPEG-стандарта.

    Encode (кодирование) - термин, определяющий процесс сжатия данных.

    Field - поле, отдельное изображение в составе видеопотока. Каждый телевизионный кадр делится на четные и нечетные строки (чересстрочная развертка). Нечетные строки формируют нечетное поле, четные - четное поле. Видеосигнал может записываться с полной разверткой (25 кадров/50 полей) и частичной разверткой (25 кадров/25 полей).

    IEC (International Electrotechnical Commission - Интернациональная электротехническая комиссия) - государственная организация, работающая с ISO (см. ниже).

    Indeo - оригинальный формат цифровой видеозаписи фирмы Intel.

    Interpolation - интерполяция, специальный алгоритм масштабирования исходной картинки для получения полноэкранного изображения. На этом принципе работают MPEG-распаковщики, "растягивая" кадры с разрешением 352Ё240 до полноэкранного формата.

    ISO (International Standards Organization) - Интернациональная организация по стандартам.

    Киоск - автономная система для предоставления информации.

    Pre-filtering - предварительная фильтрация, процесс обработки изображения перед сжатием.

    Post-filtering - последующая фильтрация, процесс обработки изображения после сжатия.

    QuickTime - системные расширения фирмы Apple для просмотра и монтажа цифрового видео; соответствующий видеоформат.

    PCM (Pulse Code Modulation) - импульсно-кодовая модуляция, стандартный способ цифрового кодирования звукового сигнала с помощью последовательности абсолютных значений амплитуды.

    Real-Time - процесс, происходящий в режиме реального времени (например, на запись одной минуты видео в стандарте MPEG требуется одна минута времени).

    SIF - термин, описывающий компьютерное разрешение 352Ё240 точек, соответствующее разрешению VHS (QSIF - Quarter SIF, т. е. четверть от разрешения SIF: 176Ё120).

    SMPTE (Society of Motion Picture and Television Engineers - Сообщество инженеров кино и телевидения) - формат кода для синхронизации аудио- и видеоданных.

    S/PDIF (Sony/Philips Digital Interface Format) - формат цифрового интерфейса фирм Sony и Philips; цифровой интерфейс для бытовой радиоаппаратуры; S/PDIF представляет собой упрощенный вариант AES/EBU и используется, в частности, для вывода в цифровом формате сигнала с компакт-дисков.

    Square Pixel Resolution - компьютерное разрешение видеосигнала, соответствующее стандартному VGA-режиму 320Ё240.

    VFW (Video for Windows) - интерфейс и формат цифрового видео фирмы Microsoft.

    VOD (Video on Demand) - видео по требованию; возможность для пользователя в данный момент времени затребовать любой выбранный им для просмотра видеофильм.

    VTR (Video Tape Recorder) - магнитофон для записи и воспроизведения видео.

    URL - аббревиатура HTTP-адреса в Internet.

    .WAV - широко распространенный звуковой формат для PC.


    Статус MPEG

    MPE (Moving Picture Experts Group) - объединенный комитет Интернациональной организации по стандартизации (ISO) и Интернациональной электротехнической комиссии (IEC). Эта группа экспертов встречается примерно четыре раза в год, чтобы разработать и утвердить стандарты на сжатие цифрового видео и звука. Основной критерий, который обсуждается комитетом MPEG, - это интенсивность потока сжатых данных, определяемая в зависимости от современного уровня компьютерных технологий и сферы применения данного формата. Так, MPEG-1 был разработан с учетом возможностей двухскоростных дисководов CD-ROM и компьютеров с процессором 486. Алгоритмы сжатия могут определяться самими производителями оборудования и микросхем, поэтому в этой области идет постоянная конкуренция за достижение лучших результатов.

    В январе 1992 г. комитет MPEG опубликовал общие характеристики MPEG-1, а к декабрю 1993 г. они были приняты в качестве стандарта (дополнительные материалы вы можете найти в статье "Живое видео на выставке Comptek'95", "Мир ПК", 1995 г., # 7-8). По этим спецификациям интенсивность потока данных сжатого видео и звука должна укладываться в 1,5 Мбайт/с, хотя были предусмотрены режимы вплоть до 4-5 Мбайт/с. Важность сокращения потока данных определялась существовавшими на тот момент стандартами Video-CD, CD-i и характеристиками дисководов CD-ROM. Базовый алгоритм ограничивает скорость передачи данных диапазоном 150-225 Кбайт/с с разрешением 352x288 (PAL) или 320x240 (NTSC) при частоте смены 25 или 30 кадров в секунду соответственно.

    Окончательное утверждение MPEG-2 в качестве международного стандарта было дано на 29-м съезде MPEG (Сингапур, ноябрь 1994 г.). В его спецификациях определена допустимая интенсивность потока данных от 2 до 10 Мбайт/с. Первично MPEG-2 разрабатывался для цифровой передачи и отображения видео вещательного качества, но позже в нем был предусмотрен формат телевидения высокой четкости (ТВЧ). До этого необходимые спецификации для ТВЧ предполагалось включить в последующий стандарт MPEG-3, с разрешением вплоть до 1920x1080 при частоте 30 Гц и интенсивности потока данных от 20 до 40 Мбайт/с. Оказалось, что с некоторой доработкой метод кодирования MPEG-2 и даже MPEG-1 работают вполне нормально даже для задач телевидения высокой четкости. В результате разработка MPEG-3 была прекращена.

    Зато начались работы над MPEG-4. Новый стандарт будет рассчитан на очень низкие потоки данных для применения в видеотелефонах, мультимедийной электронной почте, электронных информационных изданиях и т. п. Объявлено об этом было на встрече в Брюсселе в сентябре 1993 г. MPEG-4 будет оптимизирован для минимальных разрешений, вплоть до 176x144 при частоте 10 Гц с интенсивностью потока данных от 4800 до 64000 бит в секунду. Для достижения нормальной производительности и приемлемого качества при столь низких требованиях к ресурсам, скорее всего, будет применена новая технология сжатия видео- и аудиоданных. Обнародование примерных технических спецификаций нового стандарта ожидается в 1997 г., а официальное его утверждение состоится не ранее ноября 1998 г.


    MPEG: профессиональные системы для оцифровки и сжатия

    Компания
    PrimeView Duet
    MPEG Forge
    RTE-3000
    FutureTel 888/658-5868
    Optibase 800/451-5101
    Sony 800/352-7669
    URL
    www.futuretel.com
    www.b-way.com
    www.sony.com
    Платформа (шина, ОС)
    ISA, Windows
    PCI (видео) и ISA (звук), Windows
    ISA, Windows
    Формат оцифровки
    Real-Time MPEG-1, Half-MPEG-2
    Real-Time MPEG-1, Half-MPEG-2
    Real-Time MPEG-1
    Разрешения:
    CIF и SIF/QSIF
    да/нет
    да/нет
    да/да
    Square pixel
    да
    нет
    да
    Видеовходы:
    композитный (S-Video)
    да
    да
    да
    компонентный (аналоговый)
    да
    да
    да
    компонентный (цифровой)
    Дополнительно
    да
    Дополнительно
    Аудиовходы:
    сбалансированные/несбалансированные
    да/да
    да/да
    да/да
    AES/EBU
    Дополнительно
    да
    да
    S/PDIF
    Дополнительно
    нет
    Дополнительно
    Предварительная обработка и фильтрация
    8 уровней FIR по горизонтали, 2 по вертикали
    7 уровней FIR по горизонтали, 2 по вертикали
    Усреднение полей, 4 уровня FIR
    Функция предварительного просмотра
    да
    да (в том числе с источника сигнала)
    да
    Пакетная обработка
    да
    да
    да
    Поддержка EDL-листа
    да
    да
    да
    Автоматическое определение смены сцен
    да
    да
    да
    Вставка И-кадров вручную
    да
    да
    да
    Управление VTR
    да
    При наличии программного пакета MPEGWorks (1500 долл.)
    да
    да
    1097