Портал вычислительной техники
 

Мы - лучшие!

 

 


Системы видеомонтажа


 

В настоящее время для записи или воспроизведения видео еще довольно часто (особенно если речь идет о домашней технике) используются аналоговые видеоустройства: аналоговые видеокамеры, видеомагнитофоны, телевизоры и т. д. Однако развитие цифровых апаратных средств позволило обрабатывать видеоизображения на компьютере. Плюсы цифровой обработки заключаются не столько в хорошем ее качестве, сколько в тех возможностях, которые она предоставляет и которые не могут дать аналоговые способы монтажа. Но до того, как работать с видео на компьютере, его нужно оцифровать, так как РС понимает только цифровые сигналы. Эту задачу и призваны решить платы ввода/вывода видео (видеобластеры). Хорошей альтернативой видеобластерам являются цифровые видеокамеры, которые позволяют передать изображение в компьютер напрямую. Для этого камеры оснащаются компьютерным интерфейсом (в последнее время это IEEE1394, а простенькие домашние видеокамеры подключаются к РС через шину USB), так что необходимость в каких-либо специальных дополнительных устройствах отпадает.

Простейшими устройствами захвата видео являются видеоплаты с TV-входом. Они позволяют просматривать изображание, полученное с видеокамеры, магнитофона, тюнера или другого бытового видеоустройства, на экране монитора, сохранять отдельные кадры или даже видеопоследовательность (часто со звуковым сопровождением, тогда видеокарта должна иметь аудиовход) на диск - здесь главным образом нужна только соответствующая программная поддержка. Однако такие мультимедийные видеоадаптеры не являются настоящими платами видеомонтажа, оцифровка видео для них скорее побочная задача, которую они решеют не совсем хорошо. Для серьезной же оцифровки аналогового видео и последующего монтажа нужны специализированные системы. Такими системами являются устройства, позволяющие:

  • Принимать аналоговый сигнал (от видеомагнитофона, аналоговой камеры) на один из нескольких (числом не менее трех) выбираемых программным способом входов
  • Оцифровывать сигнал и отображать его в реальном времени на экране монитора (то есть его можно использовать как телевизор) в окне или на весь экран
  • Аппаратно сжимать (при необходимости) отделные кадры видеопоследовательности и сохранять их в файлы на диске
  • Аппаратно сжимать видео со звуком и писать его на диск в файл соответствующего формата
  • Выводить изображение на внешнее аналоговое устройство (скажем, телевизор или видеомагнитофон) с помощью имеющихся на устройстве аналоговых выходов, причем желательно, чтобы декодирование компрессированного видеофайла выполнялось аппаратно самой платой

Последние три особенности подобного рода систем и являются их основным отличием от видеокарт с видеовходом и возможностью записи видео, так как при использовании последних кодирование и декодирование обычно осуществляется программным способом, что требует наличия достаточно мощного процессора. Необходимость сжатия обуславливается тем, что некомпрессированный поток цифровых видеоданных имеет весьма приличные размеры, и для записи изображения хорошего качества потребуется носитель (жесткий диск), который обеспечивал бы скорость записи не менее 20-30 Mb/s. И хотя большнство современных HDD могут работать в таком режиме, нельзя гарантировать, что они смогут делать это достаточно продолжительное время, тем более что тогда сильно возрастает нагрузка на систему, и параллельный запуск каких-либо приложений может обернуться весьма нприятными последствиями в виде пропуска кадров или полной остановки записи. Да и жесткие диски все-таки не резиновые и их размер не позволяет столь неэкономно расходовать их емкость. Поэтому было создано довольно большое количесто алгоритмов, которые позволяют сжимать видеоинформацию с той или иной степенью потери качества. Наибольшее распространение получили два из них.

MJPEG

Стандарт MJPEG основывается на отдельном кодировании каждого кадра и объединении полученной последовательности в файл (формат AVI). Компрессия кадров осуществляется по JPEG-алгоритму (Joint Photographers Expert Group), когда каждая картинка разбивается на блоки размером по 88 пиеселов и представляется в векторной форме путем дискретного косинусного преобразования и высокочастотной фильтрации полученного спектра. В результате на границах блоков нарушается гладкость изображения, поэтому характерным признаком JPEG является блочная структура. Правда, при сжатии не более 1:15 эти искажения не сильно заметны. По сути AVI-файл представляет собой последовательность независимых JPEG-рисунков (отсюда и название MJPEG, то есть Motion JPEG). Так как каждый кадр кодируется независимо от других, то возможно легкое покадровое редактирование ролика. Стандарт предусматривает возможность выбирать желаемый уровень компрессии и нужное разрешение. Это очень полезно, так как, например, не имеет смысла кодировать сигнал с телеэфира с разрешением больше 320х240 и низким уровнем сжатия. Поток 4-6 Mb/s соответствует качеству профессиональной аппаратуры формата Betacam (при коэффициенте сжатия не выше 5), а видеопоток 2-3 Mb/s эквивалентен качеству, характерному для формата S-Video (при этом уровень компрессии равен где-то 1:10). Другим большим достоинством формата является его симметричность, то есть для кодирования и декодирования необходимы одни и те же вычислительные затраты. Эти факторы позволили алгоритму MJPEG стать стандартным в области мультимедиа, и видеоабластеры, как правило, используют именно MJPEG-кодек. Кроме видео, стандарт AVI позволяет также записывать стереозвук.

Из недостатков стандарта можно отметить не очень большую эффективность сжатия, а также невозможность создания AVI-файлов размером более 2 Gb (сама структура файла не позволяет сделать его больше двух Gb). Последнее является весьма серьезным препятствием для компьютерного видео, так как на 2 гигабайта много не запишешь, особенно если необходимо получить высокое качество изображения. Для преодоления этого ограничения применяются различные ухищрения. Их реализация может существенно различаться, но в конце концов она сводится к созданию нескольких взаимосвязанных файлов. Решающее значение здесь имеет то, насколько хорошо программное обеспечение видеобластера умеет переключаться между файлами и делать это незаметно. Современные платы видеомонтажа позволяют создавать и воспроизводить видеофайлы неограниченного размера (это зависит только от емкости носителя), причем переключение между различными файлами происходит для пользователя совершенно незаметно. Следует заметить, что в старых моделях использование нескольких AVI-файлов может сопровождаться некоторыми проблемами, а иногда оно и вообще невозможно.

MPEG

Вторым популярным стандартом является MPEG (Moving Picture Expert Group), в основу которого положены более изощренные способы сжатия видеоданных. Основным принципом является устранение временной избыточности, которой в той или иной степени обладает тот или иной видеопоток. Дело в том, что смежные кадры чаще всего содержат одни и те же объекты сцены, что позволяет ограничиться только передачей межкадровых различий.

При тех же скоростях передачи данных MPEG обеспечивает значительно лучшее качество изображения по сравнению с MJPEG. Сначала путем все тех же JPEG-преобразований уменьшается избыточность внутри кадра, а затем алгоритмы MPEG, анализируя происходящие в различных кадрах изменения, осуществляют дальнейшее сжатие, уже практически без потери качества. Избыточность устраняется с помощью метода компенации движения (motion compesation), то есть основным носителем видеоданных является какой-то один ключевой кадр, а некоторое количество других смежных кадров восстанавливается из него путем применения специального алгоритма. Например, если последовательность кадров изображает летящий в чистом небе самолет, то будут учитываться только изменения положения самолета на экране, а информация, ответственная за внешний облик самого самолета и неба запишется только один раз (причем она, как уже говорилось, сожмется по JPEG'у). Если быть точнее, то MPEG определяет три типа кадров: ключевые (Intra frames, I-кадры), зависимые (Predicted frames, P-кадры) и двусторонние (Bi-directional, B-кадры). Ключевые кадры, как уже говорилось являются основой MPEG-файла. Они записываются с высоким разрешением и обеспечивают произвольный доступ к информации. Каждый зависимый кадр описывается как ссылка на предшествующий ему ключевой и другой зависимый кадр и имеет среднюю степень сжатия. Двусторонние же кадры имеют наибольшую степень сжатия, они имеют двунаправленную ориентацию, ссылаясь как на на предыдущие, так и на последующие кадры.

Как и MJPEG, MPEG тоже позволяет записывать звуковое сопровождение. Звук также подвергается компрессии, которая устраняет из звукового потока неслышимые или плохо слышимые составляющие аналогично алгоритму MP3. Благодаря таким преобразованиям удается уменьшить размер данных больше чем в 100 раз при не очень значительной потере качества, хотя она и заметна (особенно это касается звука). Недостатком стандарта является его ассиметричность, то есть для кодирования нужны значительные объемы сложных вычислений, в то время как восстановление (декодирование) может быть выполнено на сравнительно маломощных аппаратных средствах. Наибольшее распространение алгоритм получил в области бытовой записи фильмов, так как там необходимо обеспечивать большой коэффициент сжатия при приемлемом качестве. MPEG первоначально стал широко применяться в Video CD, а позднее и в DVD (правда, там используется усовершенствованная версия - MPEG-2, но об этом немного ниже), и сегодня является стандартным для записи фильмов, предназначенных для просмотра на бытовой аппаратуре. В связи с эти приведу описание основных проблемы, которые могут возникать при использовании этого алгоритма.

  • Грязное оконное стекло (Dirty Window Pane). Этот дефект состоит в том, что объекты на экране выглядят так, как будто вы смотрите на них сквозь дымку - кажется, что между наблюдателем и экраном натянута мутная пленка. Более всего такой эффект заметен на фрагментах с большими темным областями, а порождается он ошибками в работе кодера, декодера или того и другого
  • Танцующие глаза (Dancing Eyes). При MPEG-кодировании иногда теряются мелкие детали на изображении человеческого глаза. В результате в отснятом материале вдруг обнаруживаются моргание или слезы, хотя в действительности ничего подобного не происходило
  • Призрачные следы (Ghostly Trails). Дефект заключается в появлении облака частиц, сопровождающего движущиеся объекты: это либо своеобразные хвосты, либо зыбкие переливающиеся границы вокруг быстро движущегося объекта. Появляется, когда кодер или декодер не успевает за движущимся элементами сцены и воспроизводит их просто наугад
  • Танцующие цвета (Dancing Colors). Ошибки в оценке движения могут вызвать периливающуюся цветную радугу на больших поверхностях движущихся одноцветных предметов, таких как, например, автомобиль
  • DCT-блочность (DCT Blockiness). На большой части экрана заметны правильные квадратики размером 8х8 или 16х16 пикселов. В их появлении виновно дискретное косинусное преобразование (Discrete Cosine Transform, DCT), используемое для сжатия кадра. Когда углы и вершины этих блоков попадают на границы изображения, появляются дополнительные искажения. Для уменьшения этих искажений используется уменьшение размеров блоков до 2х2 или 4х4
  • Сжатие яркости (Luminance Compression). Этот дефект состоит в резком усилении контрастности изображения. Весь диапазон яркости от светлого до темного может неправильно интерпретироваться DCT-кодером или механизмом оценки движения. Например, если во время съемки прекращает работать вспышка или камера следует за обектом, движущимся из ярко освщенного места в в тень, сцена может показаться распавшейся на части
  • Цветные полосы (Color Banding). Узоры, появляющиеся после компрессии/декомпресии, обычно вызываемые шумом в аналоговых схемах монтажных систем. Для устранения дефекта можно переходить к более глубокому кодированию цвета, однако это заставляет увеличивать объем памяти монтажной системы
  • Шевелящийся фон (Busy Background). Обычно неподвижные области фона (и некоторые элементы переднего плана) кажутся живыми или шевелящимися, как будто маленькие частицы бродят по их поверхности. Техническое название этого явления - шум квантования. Системы, имеющие улучшенные АЦП или оперирующие более чем с 8 битами на каждый цвет, меньше подвержены этому эффекту

Качество MPEG довольно сильно зависит от применяемого кодера (или декодера), так что для получения хорошего эффекта кодер/декодер должен работать без большого количества ошибок и использовать изощренный алгоритм кодирования/декодирования. Это в равной степени относится как к аппаратным средствам, так и к программным кодерам и проигрывателям.

Первоначальный вариант стандарта (MPEG-1) обеспечивал VHS-качество (320х240, 25 кадров в секунду) при потоке порядка 200 Kb/s, а также позволял записывать трехканальный звук. Такое качество было вполне сравнимо с качеством обычной видеокассеты; более лучшее качество потребовало бы больший поток данных и, как следствие, более емкий носитель. Но фильмы в цифровой форме тогда записывались на Video CD, что очень ограничивало скорость потока - полнометражный фильм даже не помещался один CD. Появление DVD изменило ситуацию, и в результате появился стандарт MPEG-2. Он определял гораздо более высокое качество изображения (разрешение до 500-600 твл, то есть как у профессионального Betacam), а также в него была заложена возможность записи шестиканального звука в формате AC-3. Существенным улучшением является переменный битрейт (Variable Bit Rate, VBR), то есть когда сложные и быстро сменяющиеся изображения кодируются с меньшим коэффициентом сжатия, что повышает общее качество изображения и несколько снижает скорость потока данных. Кроме DVD, MPEG-2 также испоьзуется в спутниковом вещании, например, NTV+. Есть также MPEG-4, сравнительно новый и очень мощный формат, позволяющий достичь повышения коэффициента сжатия примерно в два раза больше, чем у MPEG-1 при аналогичном уровне качества. Однако в бытовой технике он не получил такого большого распространения (там уже популярен MPEG-2, и нет пока видимых причин от него отказываться), поэтому используется по большей части только в компьютерном мире как альтернатива MPEG-2 или, чаще, устаревшему MPEG-1. Хотя чем черт не шутит - возможно, вскоре MPEG-4 будет широко известен и как стандарт бытового видео.

Как можно заметить, MPEG не является таким универсальным и гибким в использовании для РС, как MJPEG. Кроме того, системы видеомонтажа стандарта MPEG (сейчас используется MPEG-2) стоят значительно дороже, чем аналогичные по возможностям системы с MJPEG-кодеком. Все это ограничивает популярность видеобластеров, работающих с MPEG, и они используются не так часто. Кроме того, при необходимости можно оцифровать изображение и в AVI-файл, а затем с помощью программного кодера конвертировать его в MPEG (1, 2 или 4), причем этот способ также будет более гибок и универсален. Вот только большой объем необходимых вычислений заставит вас немного подождать. Если система не располагает достаточно мощным процессором и фильм имеет приличные размеры, то можно оставлять компьютер заниматься кодированием MPEG всю ночь.

Кроме стандарта сжатия, который используют устройства захвата видеоизображения, есть также еще ряд параметров, влияющих на их качество, возможности и, соответственно, цену. Остановимся на них более подробно. Телевизионный низкочастотный аналоговый сигнал является композитным, то есть представляет собой результат сложения яркостного сигнала Y, двух цветовых поднесущих, модулированных цветоразностными сигналами U и V, которые образуют сигнал цветности C (Chronoinance), а также синхроимпульсов. Причем сигналы цветности передаются в полосе частот сигнала яркости, обеспечивается так называемое частотное перемежение спектров. Это делается с целью обеспечения совместимости систем цветного и черно-белого телевидения, а также для уплотнения спектра телевизионного сигнала. Однако эта мера приводит к необходимости разделения сигналов на принимающей стороне и, как следствие качества этого разделения, появлению перекрестных искажений на изображении, вызванных взаимным влиянием этих сигналов друг на друга. Эффективное разделение сигналов цветности и яркости возможно с помощью специальных гребенчатых фильтров, однако они весьма сложны и дороги, поэтому обычно применяются только в достаточно дорогой профессиональной или полупрофессиональной аппаратуре.

В бытовых устройствах, рассчитанных на массового пользователя, чаще ограничиваются простыми и дешевыми полосовыми фильтрами, заметно снижающими четкость изображения. Недорогие домашние магнитофоны и камеры формата VHS (кстати, VHS и означает Video Home System, а придумала этот стандарт еще в 80-х годах фирма JVC, и рассчитан он был прежде всего на домашнюю технику) и Video-8 работают только с композитными сигналами, при этом разрешение составляет не более 240-280 твл (телевизионных линий).

Более эффективным оказывается использование не единого композитного сигнала, а двух Y/C, где Y - сигнал яркости с синхроимпульсами, а C - сигнал цветности. Такой сигнал называют S-Video, он применяется в форматах S-VHS и Hi-8. Такую технику обычно относят к полупрофессиональной, она обеспечивает разрешение около 400 твл, что уже несколько лучше, чем традиционный телевизионный эфир.

Наконец, для еще большего повышения качества можно перейти к полностью компонентному сигналу YUV, составляющие которого передаются раздельно. Он используется в профессиональной аппаратуре формата Betacam (причем довольно дорогостоящей) и обеспечивает разрешение до 500 твл. Последним в этой череде является RGB-представление, при котором отсутвтвует какие-либо кодирование и модуляция, обеспечивается простая и точная передача цвета. Тем не менее, достигаемое здесь повышение качества не очень ощутимо визуально, поэтому RGB-представление, как правило, используется только в высокоточной научной измерительной аппаратуре.

Современные видеобластеры должны как минимум иметь 1 композитный вход (FBAS), 1 вход S-Video. Часто они оснащаются еще входм типа Mini-DIN, который может использоваться, скажем, в видеокамерах. Такого же типа и в таком же количестве должны наличествовать и видеовыходы. При этом важно то, какие телевизионные стандарты поддерживает чип видеобластера. Стандартной является поддержка форматов PAL (европейский стандарт) и NTSC (применяется в американском телевидении), многие платы также могут декодировать и SECAM (советский стандарт). Правда, поддержка SECAM для системы видеомонтажа не очень уж и важна, так как вряд ли кто-то в настоящее время будет заниматься оцифровкой видео с помощью архаичной аппаратуры отечественного производства.

Независимо от формата сигнала и видеостандарта большое значение на качество получаемого в конечном итоге результата оказывает частота оцифровки видеосигнала. Она определяет получаемое разрешение по горизонтали. В теории цифровых стандартов кодирования за базовую частоту принимается 3.375 MHz, а частоты оцифровки составляющих определяются умножением базовой частоты на соответствующую цифру в обозначении стандарта. Например, запись 4:1:1 означает, что результирующая частота оцифровки сигнала яркости составляет 3.375*4=13.5 MHz, а сигналов цветности - в четыре раза ниже. При этом сам декодер, осуществляющий разложение входного электрического сигнала на составляющие YUV уже после оцифровки, должен осуществлять выборку в два раза чаще, то есть с частотой 27 MHz. Но тогда элемент изображения получится неквадратным. Дело в том, что в теливидении в качестве стандарта принято отношение ширины иображения к его высоте как 4:3 (кстати, такое же соотношение размеров имеет и монитор). Чтобы сохранить это соотношение и предотвратить появление геометрических искажений, необходимо выделить в каждой строке соответствующее количество элементов. Например, при 576 телевизионных строках нужно в каждой строке выделить 768 элементов (768:576=4:3). При частоте дискретизации 13.5 MHz, будет получено всего 702 элемента, а для 768 частота должна быть увеличена примерно до 14.77 MHz (в нашем случае).

Наряду с частотой оцифровки очень важное значение также имеет ее глубина, задаваемая числом битов на отсчет. Для получения полноцветного изображания необходимо обеспечить 16.7 млн. оттенков (режим True Color), что требует по 8 бит на каждый элемент изображения для каждой составляющей видеосигнала. Правда, считается, что человеческий глаз воспринимает только около 10 миллионов цветов. Оцифрованные видеобластером могут храниться в его памяти как в YUV-, так и в RGB-представлении. При YUV-кодировке для хранения одного элемента изображения достаточно 16 бит (при оцировке 4:2:2 отводится один байт для сигнала яркости и по 4 бита на кодирование сигналов цветности). Но в большинстве устройств как более универсальное используется RGB-представление, при котором для обеспечения полноцветного изображения необходимо уже 24 бита на элемент - по 8 бит на каждую составляющую. Обычно такую кодировку обозначают RGB 8:8:8. Если же ограничиться 16-ю битами, то получится 64 тысячи цветов (используется кодировка 5:6:5), что заметно хуже, чем 16.7 млн., и соответствует режиму High Color.

Соответственно от глубины оцифровки и разрешения зависит объем памяти, которой должна располагать плата видеомонтажа. Все приличные платы позволяют оцифровывать изображение в режиме True Color c разрешением 768x576 для PAL/SECAM или 640x480 (что эквивалентоно стандартному VGA-разрешению) для NTSC. Поэтому плата должна для хранения изображения иметь буфер размером около 2 Mb. Кроме этого требуется некоторый объем памяти для осуществления аппаратной компрессии и некоторых других нужд. Частота кадров при оцифровке принята стандартной и составляет 25-30 кадров в секунду, то есть содержимое памяти регенерируется не реже, чем каждые 40 ms. При этом стоит различать реальное разрешение, которое получается в результате оцифровки изображения, и достижимое программными методами (последнее, в принципе, может быть сколь угодно большим, но все равно не заменит настоящего). Также некоторые карты могут не иметь собственной памяти и использовать RAM компьютера, они обычно имеют обозначение Fly Video. Это существенно повышает требование к производительности PC и сильно расходует его ресурсы, поэтому подобные устройства имеет смысл использовать только тогда, когда на что-нибудь более серьезное не хватает денег. Хотя в случае нехватки средств, по-моему, лучше ограничиться видеоадаптером с функцией захвата изображения и возможностью записи видео, так как он при наличии более-менее мощного процессора может дать примерно столько же, но стоить будет меньше, чем обычная видеокарта с таким граббером вместе.

Одновременно с этим процессом видеоконтроллер видеобластера постоянно считывает данные из буфера и передает их в память видеокарты. Последняя с помощью собственного набора микросхем считывает их и посылает на монитор. Таким образом осуществляется формирование окна с живым видео, то есть вы можете одновременно писать видео на диск и просматривать его на мониторе или, например, только просматривать, если сохранять результаты оцифровки не требуется. Возможно также растягивать изображение на полный экран путем масштабирования. Таким образом, при наличии платы ввода/вывода видео компьютер может выступать в роли полноценного бытового видеокомплекса. И при этом вы получаете еще целый ряд функций и озможностей, которые вряд ли когда-либо сможет дать обычный телевизор и видеомагнитофон.

Передача видеоданных в графическую карту происходит через ситемную шину. Раньше для формирования захваченного изображения на экране монитора требовался еще дополнителный 25-контактный разъем Future Connector, который также должен находиться на видеокарте (а это было далеко не всегда), но сегодня необходимость в разъеме Future Connector отпала. Естественно, шина должна иметь соответствующую пропускную способность, иначе формирование живого окна будет осуществляться некачественно. В связи с этим все современные платы рассчитаны только на шину PCI, хотя раньшне производиоись и модели для шины ISA. Kстати, не стоит путать настоящее видеоизображение с preview, когда частота смены кадров не превышает 5-15 кадров в секунду. Preview можно встретить в основном у старых моделей видеограбберов, и используется оно обычно только для контроля процесса записи.

Кроме видео, практически все платы позволяют оцифровывать аудио, причем с довольно неплохим качеством. Обычно режимы оцифровки звука можно регулировать от 8-битного моно 11 КHz до 16-битного стерео при частоте дискретизации 44.1 КHz. Необходимость использовать более низкое качество звука может быть вызвана, например, оцифровкой телеэфира, так как телевидение у нас до сих пор монофоническое и расходовать ресурсы на стерео не имеет смысла. Также системы видеомонтажа могут обладать различнми дополнительными возможностями, например встроенным ТV-тюнером. Но, как показывает практика, применение внешнего тюнера (скажем, тюнера видеомагнитофона) дает лучшие результаты. Системы более профессионального уровня часто располагают интерфейсом управления (или позволяют подключать соответствующий дополнительный блок) монтажными магнитофонами или камерами, что позволяет сделать процесс оцифровки или записи изображения на кассету более удобным (при использовании профессиональной видеоаппаратуры, естественно).

Кроме теории, при оценке платы видеомонтажа неплохо учитывать и визуальное качество оцифровки. Хотя здесь было бы неправильно возлагать вину за плохое качество целиком на видеобластер, потому что большинство тех же видеокамер и магнитофонов сами по себе имеют довольно плохую картинку, и обеспечиваемое платой качество оцифровки на практике, как правило, не достижимо. Но на помехи и различные артефакты обратить внимание все же следует, так как в дешевых устройствах они за счет применения плохих фильтров и аналого-цифровых схем иногда очень заметны

 

Главная | Микросхемотехника | Периферийные устройства СВТ | ЭВМ и системы | Цифровая схемотехника | Вычислительная техника | Электронная техника | Обратная связь © Все права защищены.
Web-4-U - Бесплатные сайты