百科解釋
所謂視頻編碼方式就是指通過(guò)特定的壓縮技術(shù),將某個(gè)視頻格式的文件轉(zhuǎn)換成另一種視頻格式文件的方式。目前視頻流傳輸中最為重要的編解碼標(biāo)準(zhǔn)有國(guó)際電聯(lián)的H.261、H.263,運(yùn)動(dòng)靜止圖像專(zhuān)家組的M-JPEG和國(guó)際標(biāo)準(zhǔn)化組織運(yùn)動(dòng)圖像專(zhuān)家組的MPEG系列標(biāo)準(zhǔn),此外在互聯(lián)網(wǎng)上被廣泛應(yīng)用的還有Real-Networks的RealVideo、微軟公司的WMT以及Apple公司的QuickTime等。
MPEG是活動(dòng)圖像專(zhuān)家組(Moving Picture Exports Group)的縮寫(xiě),于1988年成立,是為數(shù)字視/音頻制定壓縮標(biāo)準(zhǔn)的專(zhuān)家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動(dòng)圖像”編碼的各種標(biāo)準(zhǔn),隨后擴(kuò)充為“及其伴隨的音頻”及其組合編碼。后來(lái)針對(duì)不同的應(yīng)用需求,解除了“用于數(shù)字存儲(chǔ)媒體”的限制,成為現(xiàn)在制定“活動(dòng)圖像和音頻編碼”標(biāo)準(zhǔn)的組織。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。 視頻圖像數(shù)據(jù)有極強(qiáng)的相關(guān)性,也就是說(shuō)有大量的冗余信息。其中冗余信息可分為空域冗余信息和時(shí)域冗余信息。壓縮技術(shù)就是將數(shù)據(jù)中的冗余信息去掉(去除數(shù)據(jù)之間的相關(guān)性),壓縮技術(shù)包含幀內(nèi)圖像數(shù)據(jù)壓縮技術(shù)、幀間圖像數(shù)據(jù)壓縮技術(shù)和熵編碼壓縮技術(shù)。
去時(shí)域冗余信息
使用幀間編碼技術(shù)可去除時(shí)域冗余信息,它包括以下三部分:
。 運(yùn)動(dòng)補(bǔ)償
運(yùn)動(dòng)補(bǔ)償是通過(guò)先前的局部圖像來(lái)預(yù)測(cè)、補(bǔ)償當(dāng)前的局部圖像,它是減少幀序列冗余信息的有效方法。
。 運(yùn)動(dòng)表示
不同區(qū)域的圖像需要使用不同的運(yùn)動(dòng)矢量來(lái)描述運(yùn)動(dòng)信息。運(yùn)動(dòng)矢量通過(guò)熵編碼進(jìn)行壓縮。
- 運(yùn)動(dòng)估計(jì)
運(yùn)動(dòng)估計(jì)是從視頻序列中抽取運(yùn)動(dòng)信息的一整套技術(shù)。
注:通用的壓縮標(biāo)準(zhǔn)都使用基于塊的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。
去空域冗余信息
主要使用幀間編碼技術(shù)和熵編碼技術(shù):
- 變換編碼
幀內(nèi)圖像和預(yù)測(cè)差分信號(hào)都有很高的空域冗余信息。變換編碼將空域信號(hào)變換到另一正交矢量空間,使其相關(guān)性下降,數(shù)據(jù)冗余度減小。
。 量化編碼
經(jīng)過(guò)變換編碼后,產(chǎn)生一批變換系數(shù),對(duì)這些系數(shù)進(jìn)行量化,使編碼器的輸出達(dá)到一定的位率。這一過(guò)程導(dǎo)致精度的降低。
- 熵編碼
熵編碼是無(wú)損編碼。它對(duì)變換、量化后得到的系數(shù)和運(yùn)動(dòng)信息,進(jìn)行進(jìn)一步的壓縮。 視頻編碼的基本框架(圖)
國(guó)際音視頻壓縮標(biāo)準(zhǔn)發(fā)展歷程:
H.261
H.261標(biāo)準(zhǔn)是為ISDN設(shè)計(jì),主要針對(duì)實(shí)時(shí)編碼和解碼設(shè)計(jì),壓縮和解壓縮的信號(hào)延時(shí)不超過(guò)150ms,碼率px64kbps(p=1~30)。
H.261標(biāo)準(zhǔn)主要采用運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、DCT變換、自適應(yīng)量化、熵編碼等壓縮技術(shù)。 只有I幀和P幀,沒(méi)有B幀,運(yùn)動(dòng)估計(jì)精度只精確到像素級(jí)。支持兩種圖像掃描格式:QCIF和CIF。
H.263
H.263標(biāo)準(zhǔn)是甚低碼率的圖像編碼國(guó)際標(biāo)準(zhǔn),它一方面以H.261為基礎(chǔ),以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數(shù)據(jù)和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國(guó)際標(biāo)準(zhǔn)中有效、合理的部分,如:半像素精度的運(yùn)動(dòng)估計(jì)、PB幀預(yù)測(cè)等,使它性能優(yōu)于H.261。
H.263使用的位率可小于64Kb/s,且傳輸比特率可不固定(變碼率)。H.263支持多種分辨率: SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
與H.261和H.263相關(guān)的國(guó)際標(biāo)準(zhǔn);
與H.261有關(guān)的國(guó)際標(biāo)準(zhǔn);
H.320:窄帶可視電話系統(tǒng)和終端設(shè)備;
H.221:視聽(tīng)電信業(yè)務(wù)中64~1 920Kb/s信道的幀結(jié)構(gòu);
H.230:視聽(tīng)系統(tǒng)的幀同步控制和指示信號(hào);
H.242:使用直到2Mb/s數(shù)字信道的視聽(tīng)終端的系統(tǒng)。
與H.263有關(guān)的國(guó)際標(biāo)準(zhǔn);
H.324:甚低碼率多媒體通信終端設(shè)備;
H.223:甚低碼率多媒體通信復(fù)合協(xié)議;
H.245:多媒體通信控制協(xié)議;
G.723.1.1:傳輸速率為5.3Kb/s和6.3Kb/s的語(yǔ)音編碼器。
JPEG
國(guó)際標(biāo)準(zhǔn)化組織于1986年成立了JPEG(Joint Photographic Expert Group)聯(lián)合圖片專(zhuān)家小組,主要致力于制定連續(xù)色調(diào)、多級(jí)灰度、靜態(tài)圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。常用的基于離散余弦變換(DCT)的編碼方法,是JPEG算法的核心內(nèi)容。
MPEG-1/2
MPEG-1標(biāo)準(zhǔn)用于數(shù)字存儲(chǔ)體上活動(dòng)圖像及其伴音的編碼,其數(shù)碼率為1.5Mb/s。 MPEG-1的視頻原理框圖和H.261的相似。
MPEG-1視頻壓縮技術(shù)的特點(diǎn):1. 隨機(jī)存;2. 快速正向/逆向搜索;3 .逆向重播;4. 視聽(tīng)同步;5. 容錯(cuò)性;6. 編/解碼延遲。MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時(shí)使用。幀內(nèi)壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術(shù),用以減少空域冗余信息。幀間壓縮算法,采用預(yù)測(cè)法和插補(bǔ)法。預(yù)測(cè)誤差可在通過(guò)DCT變換編碼處理,進(jìn)一步壓縮。幀間編碼技術(shù)可減少時(shí)間軸方向的冗余信息。
MPEG-2被稱(chēng)為“21世紀(jì)的電視標(biāo)準(zhǔn)”,它在MPEG-1的基礎(chǔ)上作了許多重要的擴(kuò)展和改進(jìn),但基本算法和MPEG-1相同。
MPEG-4
MPEG-4標(biāo)準(zhǔn)并非是MPEG-2的替代品,它著眼于不同的應(yīng)用領(lǐng)域。MPEG-4的制定初衷主要針對(duì)視頻會(huì)議、可視電話超低比特率壓縮(小于64Kb/s)的需求。在制定過(guò)程中,MPEG組織深深感受到人們對(duì)媒體信息,特別是對(duì)視頻信息的需求由播放型轉(zhuǎn)向基于內(nèi)容的訪問(wèn)、檢索和操作。
MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同,它為多媒體數(shù)據(jù)壓縮編碼提供了更為廣闊的平臺(tái),它定義的是一種格式、一種框架,而不是具體算法,它希望建立一種更自由的通信與開(kāi)發(fā)環(huán)境。于是MPEG-4新的目標(biāo)就是定義為:支持多種多媒體的應(yīng)用,特別是多媒體信息基于內(nèi)容的檢索和訪問(wèn),可根據(jù)不同的應(yīng)用需求,現(xiàn)場(chǎng)配置解碼器。編碼系統(tǒng)也是開(kāi)放的,可隨時(shí)加入新的有效的算法模塊。應(yīng)用范圍包括實(shí)時(shí)視聽(tīng)通信、多媒體通信、遠(yuǎn)地監(jiān)測(cè)/監(jiān)視、VOD、家庭購(gòu)物/娛樂(lè)等。
JVT:新一代的視頻壓縮標(biāo)準(zhǔn)
JVT是由ISO/IEC MPEG和ITU-T VCEG成立的聯(lián)合視頻工作組(Joint Video Team),致力于新一代數(shù)字視頻壓縮標(biāo)準(zhǔn)的制定。
JVT標(biāo)準(zhǔn)在ISO/IEC中的正式名稱(chēng)為:MPEG-4 AVC(part10)標(biāo)準(zhǔn);在ITU-T中的名稱(chēng):H.264(早期被稱(chēng)為H.26L)
H264/AVC
H264集中了以往標(biāo)準(zhǔn)的優(yōu)點(diǎn),并吸收了以往標(biāo)準(zhǔn)制定中積累的經(jīng)驗(yàn), 采用簡(jiǎn)潔設(shè)計(jì),使它比MPEG4更容易推廣。H.264創(chuàng)造性了多參考幀、多塊類(lèi)型、整數(shù)變換、幀內(nèi)預(yù)測(cè)等新的壓縮技術(shù),使用了更精細(xì)的分象素運(yùn)動(dòng)矢量(1/4、1/8)和新一代的環(huán)路濾波器,使得壓縮性能大大提高,系統(tǒng)更加完善。
H.264主要有以下幾大優(yōu)點(diǎn):
。 高效壓縮:與H.263+和MPEG4 SP相比,減小50%比特率;
。 延時(shí)約束方面有很好的柔韌性;
。 容錯(cuò)能力;
。 編/解碼的復(fù)雜性可伸縮性;
。 解碼全部細(xì)節(jié):沒(méi)有不匹配;
。 高質(zhì)量應(yīng)用;
。 網(wǎng)絡(luò)友善。 目前監(jiān)控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等幾種視頻編碼技術(shù)。對(duì)于最終用戶(hù)來(lái)言他最為關(guān)心的主要有:清晰度、存儲(chǔ)量(帶寬)、穩(wěn)定性還有價(jià)格。采用不同的壓縮技術(shù),將很大程度影響以上幾大要素。
MJPEG
MJPEG(Motion JPEG)壓縮技術(shù),主要是基于靜態(tài)視頻壓縮發(fā)展起來(lái)的技術(shù),它的主要特點(diǎn)是基本不考慮視頻流中不同幀之間的變化,只單獨(dú)對(duì)某一幀進(jìn)行壓縮。
MJPEG壓縮技術(shù)可以獲取清晰度很高的視頻圖像,可以動(dòng)態(tài)調(diào)整幀率、分辨率。但由于沒(méi)有考慮到幀間變化,造成大量冗余信息被重復(fù)存儲(chǔ),因此單幀視頻的占用空間較大,目前流行的MJPEG技術(shù)最好的也只能做到3K字節(jié)/幀,通常要8~20K!
MPEG-1/2
MPEG-1標(biāo)準(zhǔn)主要針對(duì)SIF標(biāo)準(zhǔn)分辨率(NTSC制為352X240;PAL制為352X288)的圖像進(jìn)行壓縮. 壓縮位率主要目標(biāo)為1.5Mb/s.較MJPEG技術(shù),MPEG1在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量、處理速度上有顯著的提高。但MPEG1也有較多不利地方:存儲(chǔ)容量還是過(guò)大、清晰度不夠高和網(wǎng)絡(luò)傳輸困難。
MPEG-2 在MPEG-1基礎(chǔ)上進(jìn)行了擴(kuò)充和提升,和MPEG-1向下兼容,主要針對(duì)存儲(chǔ)媒體、數(shù)字電視、高清晰等應(yīng)用領(lǐng)域,分辨率為:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2視頻相對(duì)MPEG-1提升了分辨率,滿(mǎn)足了用戶(hù)高清晰的要求,但由于壓縮性能沒(méi)有多少提高,使得存儲(chǔ)容量還是太大,也不適和網(wǎng)絡(luò)傳輸。
MPEG-4
MPEG-4視頻壓縮算法相對(duì)于MPEG-1/2在低比特率壓縮上有著顯著提高,在CIF(352*288)或者更高清晰度(768*576)情況下的視頻壓縮,無(wú)論從清晰度還是從存儲(chǔ)量上都比MPEG1具有更大的優(yōu)勢(shì),也更適合網(wǎng)絡(luò)傳輸。另外MPEG-4可以方便地動(dòng)態(tài)調(diào)整幀率、比特率,以降低存儲(chǔ)量。
MPEG-4由于系統(tǒng)設(shè)計(jì)過(guò)于復(fù)雜,使得MPEG-4難以完全實(shí)現(xiàn)并且兼容,很難在視頻會(huì)議、可視電話等領(lǐng)域?qū)崿F(xiàn),這一點(diǎn)有點(diǎn)偏離原來(lái)地初衷。另外對(duì)于中國(guó)企業(yè)來(lái)說(shuō)還要面臨高昂的專(zhuān)利費(fèi)問(wèn)題,目前規(guī)定:
。 每臺(tái)解碼設(shè)備需要交給MPEG-LA 0.25美元。
。 編碼/解碼設(shè)備還需要按時(shí)間交費(fèi)(4美分/天=1.2美元/月 =14.4美元/年)。
H.264/AVC
H.264集中了以往標(biāo)準(zhǔn)的優(yōu)點(diǎn),在許多領(lǐng)域都得到突破性進(jìn)展,使得它獲得比以往標(biāo)準(zhǔn)好得多整體性能:
。 和H.263+和MPEG-4 SP相比最多可節(jié)省50%的碼率,使存儲(chǔ)容量大大降低;
。 H.264在不同分辨率、不同碼率下都能提供較高的視頻質(zhì)量;
。 采用“網(wǎng)絡(luò)友善”的結(jié)構(gòu)和語(yǔ)法,使其更有利于網(wǎng)絡(luò)傳輸。
H.264采用簡(jiǎn)潔設(shè)計(jì),使它比MPEG4更容易推廣,更容易在視頻會(huì)議、視頻電話中實(shí)現(xiàn),更容易實(shí)現(xiàn)互連互通,可以簡(jiǎn)便地和G.729等低比特率語(yǔ)音壓縮組成一個(gè)完整的系統(tǒng)。
MPEG LA吸收MPEG-4的高昂專(zhuān)利費(fèi)而使它難以推廣的教訓(xùn),MPEG LA制定了以下低廉的H.264收費(fèi)標(biāo)準(zhǔn):H.264廣播時(shí)基本不收費(fèi);產(chǎn)品中嵌入H.264編/解碼器時(shí),年產(chǎn)量10萬(wàn)臺(tái)以下不收取費(fèi),超過(guò)10萬(wàn)臺(tái)每臺(tái)收取0.2美元,超過(guò)500萬(wàn)臺(tái)每臺(tái)收取0.1美元。低廉的專(zhuān)利費(fèi)使得中國(guó)H.264監(jiān)控產(chǎn)品更容易走向世界。
監(jiān)控中視頻編碼分辨率的選擇
目前監(jiān)控行業(yè)中主要使用以下分辨率:SQCIF、QCIF、CIF、4CIF。
SQCIF和QCIF的優(yōu)點(diǎn)是存儲(chǔ)量低,可以在窄帶中使用,使用這種分辨率的產(chǎn)品價(jià)格低廉;缺點(diǎn)是圖像質(zhì)量往往很差、不被用戶(hù)所接受。
CIF是目前監(jiān)控行業(yè)的主流分辨率,它的優(yōu)點(diǎn)是存儲(chǔ)量較低,能在普通寬帶網(wǎng)絡(luò)中傳輸,價(jià)格也相對(duì)低廉,它的圖像質(zhì)量較好,被大部分用戶(hù)所接受。缺點(diǎn)是圖像質(zhì)量不能滿(mǎn)足高清晰的要求。
4CIF是標(biāo)清分辨率,它的優(yōu)點(diǎn)是圖像清晰。缺點(diǎn)是存儲(chǔ)量高,網(wǎng)絡(luò)傳輸帶寬要求很高,價(jià)格也較高。
分辨率新的選擇-528x384。
2CIF(704x288)已被部分產(chǎn)品采用,用來(lái)解決CIF清晰度不夠高和4CIF存儲(chǔ)量高、價(jià)格高昂的缺點(diǎn)。但由于704x288只是水平分辨率的提升,圖像質(zhì)量提高不是特別明顯。
經(jīng)過(guò)測(cè)試,我們發(fā)現(xiàn)另外一種2CIF分辨率528x384,比704x288能更好解決CIF、4CIF的問(wèn)題。特別是在512Kbps-1Mbps碼率之間,能獲得穩(wěn)定的高質(zhì)量圖像,滿(mǎn)足用戶(hù)較高圖像質(zhì)量的要求。目前這一分辨率已被許多網(wǎng)絡(luò)多媒體廣播所采用,被廣大用戶(hù)所接受。比如杭州網(wǎng)通網(wǎng)上影院是采用512x384分辨率,在768k下能穩(wěn)定地獲得近似DVD的圖像質(zhì)量。
監(jiān)控中實(shí)現(xiàn)視頻編碼的最佳方式
目前視頻編碼正處于一個(gè)技術(shù)日新月異的時(shí)期,視頻編碼的壓縮性能在不斷得到提升。
在監(jiān)控中主要使用ASCI和DSP兩種方案。由于ASIC芯片的設(shè)計(jì)、生產(chǎn)周期過(guò)長(zhǎng),使它已跟不上視頻編碼的發(fā)展速度。而DSP芯片,由于它的通用設(shè)計(jì),使它能實(shí)現(xiàn)各種視頻編碼算法,并且可以及時(shí)更新視頻編碼器,緊跟視頻編碼的發(fā)展速度。另外使用DSP芯片可以比ASIC更靈活的配置編碼器,使編碼器達(dá)到最佳性能。
?低暜a(chǎn)品目前達(dá)到的技術(shù)水準(zhǔn)。
?低暜a(chǎn)品采用最先進(jìn)的H.264視頻壓縮算法和高性能的DSP處理器。
強(qiáng)大的H.264視頻壓縮引擎使產(chǎn)品獲得極高的壓縮比、高質(zhì)量的圖像質(zhì)量和良好的網(wǎng)絡(luò)傳輸性能。高性能的DSP處理器能靈活的配置視頻編/解碼器:動(dòng)態(tài)設(shè)置分辨率、幀率、碼率、圖像質(zhì)量等;可以雙碼流輸出,達(dá)到本地存儲(chǔ)和網(wǎng)絡(luò)傳輸分別處理的功能。
使用TM130X DSP的產(chǎn)品,單個(gè)芯片能實(shí)時(shí)壓縮一路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。
使用DM642 DSP的產(chǎn)品,單個(gè)芯片能實(shí)時(shí)壓縮4路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。單個(gè)芯片能實(shí)時(shí)壓縮2路4CIF視頻。