Опрос

Какой архиватор наиболее эффективный?:

Новички

Виктор Васильев
Юрий Антонов
Сергей Андреевич
Генадий
Avanasy

MPEG-4

MPEG-4 кардинально отличается от принимаемых ранее стандартов. Рассмотрим наиболее интересные и полезные нововведения.

Расчет трехмерных сцен и работа с синтетическими объектами.

В состав декодера MPEG-4 как составная часть входит блок визуализации трехмерных объектов (Animation Framework extension - AFX - то, что в просторечии называют данными для трехмерного движка). Те, кто кодиро­вал видео, знают, сколько проблем доставляют титры и вообще любые накладываемые поверх фильма объекты (логотипы, заставки и т. п.). Если хо­рошо выглядит основной план - будут подпорчены накладываемые объек­ты, если хорошо смотрятся они - будет низкой общая степень сжатия. BMPEG-4 предлагается решить проблему кардинально. Накладываемые объекты рассчитываются отдельно и накладываются потом. Кроме того, можно использовать видеопоток даже как текстуру, накладываемую на по­верхности рассчитываемых объектов. Такая гибкая работа с трехмерными объектами позволяет существенно поднять степень сжатия при заметно лучшем качестве изображения. Более того, никто не мешает делать видео­ролики вообще без живого видео, а состоящие только из рассчитанных (синтетических) объектов. Размер их описания будет в разы меньше, чем размер аналогичных фильмов, сжатых просто как поток кадров. Кстати, от­дельно в стандарте предусмотрена работа со "спрайтами" - статическими изображениями, накладьшаемыми на кадр. При этом размер спрайта может быть как совсем маленький (логотип канала в уголке экрана), так и превы­шать размер кадра и "прокручиваться" (т. е. в качестве спрайта может быть задан фон, а небольшие видеообъекты, например голова диктора, будут на него накладывать). Это дает значительную гибкость при создании MPEG-4-фильмов и позволяет заметно уменьшить объем кодируемой информации.

Объектно-ориентированная работа с потоком данных. Теперь работа с потоком данных становится объектно-ориентированной. При этом данные могут быть живым видео, звуковыми данными, синтетическими объектами и т. д. Из них создаются сцены, этими сценами можно управлять. Для про­стых смертных при этом мало что изменится, однако для программистов объектная среда означает кардинальное упрощение работы с возникающими сложными структурами.

Помещение в поток двоичного кода "C++ подобного" языка BIFS. С помощью BIFS в поток добавляются описания объектов, классов объектов и сцен. Также на нем можно менять координаты, размеры, свойства, пове­дение и реакцию объектов на действия пользователя. В свое время Flash был назван революцией 2D графики в Интернете. Аналогичный прорыв в области видео совершает MPEG-4.

Активная зрительская позиция. Как было замечено выше, BIFS позво­ляет задавать реакцию объектов сцены на действия пользователя. Потенци­ально возможно удаление, добавление или перемещение объектов, ввод ко­манд с клавиатуры. Событийная модель заимствована из развивавшегося уже долгое время языка моделирования виртуальной реальности VRML. Для тех, кто играл в написанные на VRML игры, очевидно, что в MPEG-4 будет совершенно реально создавать "квест"-подобные (и не только) игры. Широчайший простор открывается для создания обучающих и развлекательных программ. Представляете, скачиваете из Интернета один файл, ко­торый сразу в себе содержит все, что необходимо для небольшого курса лекций, причем вы можете прослушать его, видя говорящую голову препо­давателя, или, отключив его, увеличить фрагменты (спрайты) с материала­ми. А в конце - пройти короткий тест на понимание предмета. Кстати, в стандарте предусмотрена обработка команд на стороне сервера, т. е. про-грамма-просмотрщик может отослать данные на сервер и получить оттуда оценку. Отличие от предыдущих стандартов революционное.

Синтезатор лиц и фигур. В стандарт заложен интерфейс к модулю син­теза лиц и фигур. Например, в файле сохраняются ключевые данные о про­филе лица и текстуры лица, а при записи фильма сохраняются только коэф­фициенты изменения формы. Для передач типа новостей этот прием позво­ляет в десятки раз сократить размер файла при замечательном качестве.

Синтезатор звуков и речи. Помимо синтеза лиц в стандарт MPEG-4 также заложены алгоритмы синтеза звуков, и даже речи(!).

Улучшенные алгоритмы сжатия видео. В стандарте предусмотрены блоки, отвечающие за потоки 4.8-65 Кбит/с с прогрессивной разверткой и большие потоки с поддержкой чересстрочной развертки. Для передачи по ненадежным каналам возможно использование помехоустойчивых методов кодирования (за счет незначительного увеличения объема передаваемых данных резко снижается вероятность искажения изображения). При переда­че видео с одновременным просмотром заложена возможность огрубить изображение, если декодер из-за ограничений канала связи не успевает по­лучить всю информацию. Всего в стандарт заложено 3 уровня детализации. Эта возможность позволит легко адаптировать алгоритм для трансляций видео по сети.

Поддержка профилей на уровне стандарта. Понятно, что реализация всех возможностей стандарта превращает декодер в весьма сложную и большую конструкцию. При этом далеко не для всех приложений необхо­димы какие-то сложные специфические функции (например, синтез речи). Создатели стандарта поступили просто: они оговорили наборы профилей, каждый из которых включает в себя набор обязательных функций. Если в фильме записано, что ему для проигрывания необходим такой-то профиль и декодер этот профиль поддерживает, то стандарт гарантирует, что фильм будет проигран правильно.

Выше кратко перечислены некоторые отличия MPEG-4 от предыдущих стандартов. Надо отметить, что на момент создания стандарта острой по­требности в описанных выше вещах еще не было. Иначе говоря, мы имеем дело с хорошо продуманной работой по формированию стандарта, которая была закончена к тому времени, когда в нем возникла первая необходи­мость.

Создателями MPEG-4 учтен опыт предшественников (в частности, VRML), когда слишком раннее появление стандарта и отсутствие в нем ме­ханизма профилей серьезно подорвало его массовое применение. Будем на­деяться, что массовому применению MPEG-4 такие проблемы не грозят.

Характеристики MPEG-4:

Поток, разрешение: 0,0048-20 Мбит/с, поддерживаются все основ-| ные стандарты видеопотоков.

Плюсы: поддержка достаточно прогрессивных звуковых стандартов, | высокая степень универсальности, поддержка новых технологий (различ­ные виды синтеза звука и изображения).

Минусы: высокая сложность реализации.