百科解釋
目錄·數(shù)字視頻的概述·數(shù)字視頻的發(fā)展·數(shù)字視頻的采樣·數(shù)字視頻的標(biāo)準(zhǔn)·SMPTE表示單位·視頻壓縮基本概念·數(shù)字視頻的格式·數(shù)字化影視基礎(chǔ)·模擬視頻的世界·DSP的應(yīng)用技術(shù) 英文名稱:Digital Video 數(shù)字視頻的概述 數(shù)字視頻就是先用攝像機之類的視頻捕捉設(shè)備,將外界影像的顏色和亮度信息轉(zhuǎn)變?yōu)殡娦盘,再記錄到儲存介質(zhì)(如錄像帶)。播放時,視頻信號被轉(zhuǎn)變?yōu)閹畔ⅲ⒁悦棵爰s30幀的速度投影到顯示器上,使人類的眼睛認(rèn)為它是連續(xù)不間斷地運動著的。電影播放的幀率大約是每秒24幀。如果用示波器(一種測試工具)來觀看,未投影的模擬電信號看起來就像腦電波的掃描圖像,由一些連續(xù)鋸齒狀的山峰和山谷組成。 為了存儲視覺信息,模擬視頻信號的山峰和山谷必須通過數(shù)字/模擬(D/A)轉(zhuǎn)換器來轉(zhuǎn)變?yōu)閿?shù)字的“0”或“1”。這個轉(zhuǎn)變過程就是我們所說的視頻捕捉(或采集過程)。如果要在電視機上觀看數(shù)字視頻,則需要一個從數(shù)字到模擬的轉(zhuǎn)換器將二進制信息解碼成模擬信號,才能進行播放。 模擬視頻的數(shù)字化包括不少技術(shù)問題,如電視信號具有不同的制式而且采用復(fù)合的YUV信號方式,而計算機工作在RGB空間;電視機是隔行掃描,計算機顯示器大多逐行掃描;電視圖像的分辨率與顯示器的分辨率也不盡相同等等。因此,模擬視頻的數(shù)字化主要包括色彩空間的轉(zhuǎn)換、光柵掃描的轉(zhuǎn)換以及分辨率的統(tǒng)一。 模擬視頻一般采用分量數(shù)字化方式,先把復(fù)合視頻信號中的亮度和色度分離,得到Y(jié)UV或YIQ分量,然后用三個模/數(shù)轉(zhuǎn)換器對三個分量分別進行數(shù)字化,最后再轉(zhuǎn)換成RGB空間。 數(shù)字視頻的發(fā)展 談到數(shù)字視頻的發(fā)展歷史,不能不回顧計算機的發(fā)展歷程,它實際上是與計算機所能處理的信息類型密切相關(guān)的,自上個世紀(jì)40年代計算機誕生以來,計算機大約經(jīng)歷了以下幾個發(fā)展階段: 數(shù)值計算階段。這是計算機問世后的“幼年”時期。在這個時期計算機只能處理數(shù)值數(shù)據(jù),主要用于解決科學(xué)與工程技術(shù)中的數(shù)學(xué)問題。實際上,世界上第一臺電子計算機ENIAC就是為美國國防部解決彈道計算問題和編制射擊表而研制生產(chǎn)的。 數(shù)據(jù)處理階段。50年代發(fā)明了字符發(fā)生器,使計算機不但能處理數(shù)值,也能表示和處理字母及其它各種符號,從而使計算機的應(yīng)用領(lǐng)域從單純的數(shù)值計算進入了更加廣泛的數(shù)據(jù)處理。這是由世界上第一個批量生產(chǎn)的商用計算機UNIAC—1首開先河的。 多媒體階段。隨著電子器件的進展,尤其是各種圖形、圖像設(shè)備和語音設(shè)備的問世,計算機逐漸進入多媒體時代,信息載體擴展到文、圖、聲等多種類型,使計算機的應(yīng)用領(lǐng)域進一步擴大。 由于視覺,即圖形、圖像,最能直觀明了、生動形象地傳達有關(guān)對象的信息,因而在多媒體計算機中占有重要的地位。 在多媒體階段,計算機與視頻就產(chǎn)生了聯(lián)姻。數(shù)字視頻的發(fā)展主要是指在個人計算機上的發(fā)展,可以大致分為初級、主流和高級幾個歷史階段。 第—階段是初級階段,其主要特點就是在臺式計算機上增加簡單的視頻功能,利用電腦來處理活動畫面,這給人展示了一番美好的前景,但是由于設(shè)備還未能普及,都是面向制作視頻制作領(lǐng)域的專業(yè)人員。在普通PC用戶還無法奢望在自己的電腦上實現(xiàn)視頻功能。 第二個階段為主流階段,在這個階段數(shù)字視頻在計算機中得到廣泛應(yīng)用,成為主流。初期數(shù)字視頻的發(fā)展沒有人們期望的那么快,原因很簡單,就是對數(shù)字視頻的處理很費力,這是因為數(shù)字視頻的數(shù)據(jù)量非常之大,1分鐘的滿屏的真彩色數(shù)字視頻需要1.5GB的存儲空間,而在早期—般臺式機配備的硬盤容量大約是幾百兆,顯然無法勝任如此大的數(shù)據(jù)量。 雖然在當(dāng)時處理數(shù)字視頻很困難,但它所帶來的誘惑促使人們采用折衷的方法。先是用計算機捕獲單幀視頻畫面,可以捕獲一幀視頻圖像并以一定的文件格式存儲起來,可以利用圖像處理軟件進行處理,將它放進準(zhǔn)備出版的資料中;后來,在計算機上觀看活動的視頻成為可能。雖然畫面時斷時續(xù),但畢竟是動了起來,帶給人們無限的驚喜。 而最有意義的突破是計算機有了捕獲活動影像的能力,將視頻捕獲到計算機中,隨時可以從硬盤上播放視頻文件。能夠捕獲視頻得益于數(shù)據(jù)壓縮方法,壓縮方法有兩種:純軟件壓縮和硬件輔助壓縮純軟件壓縮方便易行,只用一個小窗口顯示視頻,有很多這方面的軟件。硬件壓縮花費高,但速度快。在這一過程中,雖然能夠捕獲到視頻,但是缺乏一個統(tǒng)一的標(biāo)準(zhǔn),不同的計算機捕獲的視頻文件不能交換。雖然有過一個所謂的“標(biāo)準(zhǔn)”,但是它沒有得到足夠的流行,因此沒有變成真正的標(biāo)準(zhǔn),它就是數(shù)字視頻交互(DVI)。DVI在捕獲視頻時使用硬件輔助壓縮,但在播放時卻只使用軟件,因此在播放時不需要專門的設(shè)備。但是DVI沒有形成市場,因此沒有被廣泛的了解和使用。因此就難以流行。這就需要計算機與視頻再做一次結(jié)合,建立一個標(biāo)準(zhǔn),使得每臺計算機都能播放令人心動的視頻文件。這次結(jié)合成功的關(guān)鍵是各種壓縮解壓縮Codec技術(shù)的成熟。Codec來自于兩個單詞Compression(壓縮)和Decompression(解壓),它是一種軟件或者固件(固化于用于視頻文件的壓縮和解壓的程序芯片)。壓縮使得將視頻數(shù)據(jù)存儲到硬盤上成為可能。如果幀尺寸較小幀切換速度較慢,再使用壓縮和解壓,存儲1分鐘的視頻數(shù)據(jù)只需20MB的空間而不是1.5GB,所需存儲空間的比例是20:1500,即1:75。當(dāng)然在顯示窗口看到的只是分辨率為160×120郵票般大小的畫面,幀速率也只有15幀/s,色彩也只有256色,但畫面畢竟活動起來了。 Quicktime和Video for Windows通過建立視頻文件標(biāo)準(zhǔn)MOV和AVI使數(shù)字視頻的應(yīng)用前景更為廣闊,使它不再是一種專用的工具,而成為每個人電腦中的必備成分。而正是數(shù)字視頻發(fā)展的這一步,為電影和電視提供了一個前所未有的工具,為影視藝術(shù)帶來了影響空前的變革。 第三階段是高級階段,在這一階段,普通個人計算機進入了成熟的多媒體計算機時代。各種計算機外設(shè)產(chǎn)品日益齊備,數(shù)字影像設(shè)備爭奇斗艷,視音頻處理硬件與軟件技術(shù)高度發(fā)達,這些都為數(shù)字視頻的流行起到了推波助瀾的作用。 數(shù)字視頻的采樣 根據(jù)電視信號的特征,亮度信號的帶寬是色度信號帶寬的兩倍。因此其數(shù)字化時可采用幅色采樣法,即對信號的色差分量的采樣率低于對亮度分量的采樣率。用Y:U:V來表示YUV三分量的采樣比例,則數(shù)字視頻的采樣格式分別有4:1:1、4:2:2和4:4:4三種。電視圖像既是空間的函數(shù),也是時間的函數(shù),而且又是隔行掃描式,所以其采樣方式比掃描儀掃描圖像的方式要復(fù)雜得多。分量采樣時采到的是隔行樣本點,要把隔行樣本組合成逐行樣本,然后進行樣本點的量化,YUV到RGB色彩空間的轉(zhuǎn)換等等,最后才能得到數(shù)字視頻數(shù)據(jù)。 數(shù)字視頻的標(biāo)準(zhǔn) 為了在PAL、NTSC和 SECAM電視制式之間確定共同的數(shù)字化參數(shù),國家無線電咨詢委員會(CCIR)制定了廣播級質(zhì)量的數(shù)字電視編碼標(biāo)準(zhǔn),稱為CCIR 601標(biāo)準(zhǔn)。在該標(biāo)準(zhǔn)中,對采樣頻率、采樣結(jié)構(gòu)、色彩空間轉(zhuǎn)換等都作了嚴(yán)格的規(guī)定,主要有: 1、采樣頻率為f s=13.5MHz 2、分辨率與幀率 3、根據(jù)f s的采樣率,在不同的采樣格式下計算出數(shù)字視頻的數(shù)據(jù)量: 這種未壓縮的數(shù)字視頻數(shù)據(jù)量對于目前的計算機和網(wǎng)絡(luò)來說無論是存儲或傳輸都是不現(xiàn)實的,因此在多媒體中應(yīng)用數(shù)字視頻的關(guān)鍵問題是數(shù)字視頻的壓縮技術(shù)! SMPTE表示單位 通常用時間碼來識別和記錄視頻數(shù)據(jù)流中的每一幀,從一段視頻的起始幀到終止幀,其間的每一幀都有一個唯一的時間碼地址。根據(jù)動畫和電視工程師協(xié)會SMPTE(Society of Motion Picture and Television Engineers)使用的時間碼標(biāo)準(zhǔn),其格式是:小時:分鐘:秒:幀,或 hours:minutes:seconds:frames。一段長度為00:02:31:15的視頻片段的播放時間為2分鐘31秒15幀,如果以每秒30幀的速率播放,則播放時間為2分鐘31.5秒。 根據(jù)電影、錄像和電視工業(yè)中使用的幀率的不同,各有其對應(yīng)的SMPTE標(biāo)準(zhǔn)。由于技術(shù)的原因NTSC制式實際使用的幀率是29.97fps而不是30fps,因此在時間碼與實際播放時間之間有0.1%的誤差。為了解決這個誤差問題,設(shè)計出丟幀(drop-frame)格式,也即在播放時每分鐘要丟2幀(實際上是有兩幀不顯示而不是從文件中刪除),這樣可以保證時間碼與實際播放時間的一致。與丟幀格式對應(yīng)的是不丟幀(nondrop-frame)格式,它忽略時間碼與實際播放幀之間的誤差。 視頻壓縮基本概念 視頻壓縮的目標(biāo)是在盡可能保證視覺效果的前提下減少視頻數(shù)據(jù)率。視頻壓縮比一般指壓縮后的數(shù)據(jù)量與壓縮前的數(shù)據(jù)量之比。由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有某些共同之處,但是運動的視頻還有其自身的特性,因此在壓縮時還應(yīng)考慮其運動特性才能達到高壓縮的目標(biāo)。在視頻壓縮中常需用到以下的一些基本概念: 。ㄒ唬、有損和無損壓縮: 在視頻壓縮中有損(Lossy )和無損(Lossless)的概念與靜態(tài)圖像中基本類似。無損壓縮也即壓縮前和解壓縮后的數(shù)據(jù)完全一致。多數(shù)的無損壓縮都采用RLE行程編碼算法。有損壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù)。幾乎所有高壓縮的算法都采用有損壓縮,這樣才能達到低數(shù)據(jù)率的目標(biāo)。丟失的數(shù)據(jù)率與壓縮比有關(guān),壓縮比越小,丟失的數(shù)據(jù)越多,解壓縮后的效果一般越差。此外,某些有損壓縮算法采用多次重復(fù)壓縮的方式,這樣還會引起額外的數(shù)據(jù)丟失。 。ǘ、幀內(nèi)和幀間壓縮: 幀內(nèi)(Intraframe)壓縮也稱為空間壓縮(Spatial compression)。當(dāng)壓縮一幀圖像時,僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實際上與靜態(tài)圖像壓縮類似。幀內(nèi)一般采用有損壓縮算法,由于幀內(nèi)壓縮時各個幀之間沒有相互關(guān)系,所以壓縮后的視頻數(shù)據(jù)仍可以以幀為單位進行編輯。幀內(nèi)壓縮一般達不到很高的壓縮。 采用幀間(Interframe)壓縮是基于許多視頻或動畫的連續(xù)前后兩幀具有很大的相關(guān)性,或者說前后兩幀信息變化很小的特點。也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性,壓縮相鄰幀之間的冗余量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporal compression),它通過比較時間軸上不同幀之間的數(shù)據(jù)進行壓縮。幀間壓縮一般是無損的。幀差值(Frame differencing)算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數(shù)據(jù)量。 (三)、對稱和不對稱編碼: 對稱性(symmetric)是壓縮編碼的一個關(guān)鍵特征。對稱意味著壓縮和解壓縮占用相同的計算處理能力和時間,對稱算法適合于實時壓縮和傳送視頻,如視頻會議應(yīng)用就以采用對稱的壓縮編碼算法為好。而在電子出版和其它多媒體應(yīng)用中,一般是把視頻預(yù)先壓縮處理好,爾后再播放,因此可以采用不對稱(asymmetric)編碼。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。例如,壓縮一段三分鐘的視頻片斷可能需要10多分鐘的時間,而該片斷實時回放時間只有三分鐘。 。ㄋ模⿺(shù)字視頻壓縮說明 如果使用數(shù)字視頻,需要考慮的一個重要因素是文件大小,因為數(shù)字視頻文件往往會很大,這將占用大量硬盤空間。解決這些問題的方法是壓縮—讓文件變小。 使用文本文件,大小問題就顯得不那么重要了,因為這樣的文件充滿了“空格”,可以大幅度壓縮—一個文本文件至少可以壓縮 90%,壓縮率是相當(dāng)高的(壓縮率是指已壓縮數(shù)據(jù)與未壓縮數(shù)據(jù)之比值)。其他類型的文件,如 MPEG 視頻或 JPEG 照片幾乎無法壓縮,因為它們是用非常緊密的壓縮格式制成的。 為什么數(shù)字視頻要壓縮? 數(shù)字視頻之所以需要壓縮,是因為它原來的形式占用的空間大得驚人。視頻經(jīng)過壓縮后,存儲時會更方便。數(shù)字視頻壓縮以后并不影響作品的最終視覺效果,因為它只影響人的視覺不能感受到的那部分視頻。例如,有數(shù)十億種顏色,但是我們只能辨別大約 1024 種。因為我們覺察不到一種顏色與其鄰近顏色的細(xì)微差別,所以也就沒必要將每一種顏色都保留下來。還有一個冗余圖像的問題—如果在一個 60 秒的視頻作品中每幀圖像中都有位于同一位置的同一把椅子,有必要在每幀圖像中都保存這把椅子的數(shù)據(jù)嗎? 壓縮視頻的過程實質(zhì)上就是去掉我們感覺不到的那些東西的數(shù)據(jù)。標(biāo)準(zhǔn)的數(shù)字?jǐn)z像機的壓縮率為 5 比 1,有的格式可使視頻的壓縮率達到 100 比 1。但過分壓縮也不是件好事。因為壓縮得越多,丟失的數(shù)據(jù)就越多。如果丟棄的數(shù)據(jù)太多,產(chǎn)生的影響就顯而易見了。過分壓縮的視頻會導(dǎo)致無法辨認(rèn)。 壓縮視頻的時候,請始終嘗試幾種壓縮設(shè)置。目的是盡可能將數(shù)據(jù)壓縮到最小,當(dāng)數(shù)據(jù)丟失到從畫面中能夠明顯看到時,再將壓縮率稍微向回調(diào)一點兒。這樣就可以在文件大小和畫面質(zhì)量之間達到最佳平衡。不要忘記,每個視頻作品都各不相同—有些視頻經(jīng)過高度壓縮后看上去仍不錯,有些卻不是,所以您需要通過試驗才能得到最好的效果。 位速說明 位速是指在一個數(shù)據(jù)流中每秒鐘能通過的信息量。您可能看到過音頻文件用 “128–Kbps MP3” 或 “64–Kbps WMA” 進行描述的情形。Kbps 表示 “每秒千字節(jié)數(shù)”,因此數(shù)值越大表示數(shù)據(jù)越多:128–Kbps MP3 音頻文件包含的數(shù)據(jù)量是 64–Kbps WMA 文件的兩倍,并占用兩倍的空間。(不過在這種情況下,這兩種文件聽起來沒什么兩樣。原因是什么呢?有些文件格式比其他文件能夠更有效地利用數(shù)據(jù),64–Kbps WMA 文件的音質(zhì)與 128–Kbps MP3 的音質(zhì)相同。)需要了解的重要一點是,位速越高,信息量越大,對這些信息進行解碼的處理量就越大,文件需要占用的空間也就越多。 為項目選擇適當(dāng)?shù)奈凰偃Q于播放目標(biāo):如果您想把制作的 VCD 放在 DVD 播放器上播放,那么視頻必須是 1150 Kbps,音頻必須是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 視頻可達到 400 Kbps—超過這個限度播放時就會出現(xiàn)異常。 壓縮策略 可以用多種不同的方法和策略壓縮數(shù)字媒體文件,使之達到便于管理的大小。下面是幾種最常用的方法: 心理聲學(xué)音頻壓縮 心理聲學(xué) 一詞似乎很令人費解,其實很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強大的算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區(qū)別。 心理視覺視頻壓縮 心理視覺視頻壓縮與和其對等的音頻壓縮相似。心理視覺模型去掉的不是我們聽不到的音頻數(shù)據(jù),而是去掉眼睛不需要的視頻數(shù)據(jù)。假設(shè)有一個在 60 秒的時間內(nèi)顯示位于同一位置的一把椅子的未經(jīng)壓縮的視頻片段,在每幀圖像中,都將重復(fù)這把椅子的同一數(shù)據(jù)。如果使用了心理視覺壓縮,就會把一幀圖像中椅子的數(shù)據(jù)存儲下來,以在接下來的幀中使用。這種壓縮類型—叫做“統(tǒng)計數(shù)據(jù)冗余”—是 WMV、MPEG 和其他視頻格式用于壓縮視頻并同時保持高質(zhì)量的一種數(shù)學(xué)竅門。 無損壓縮 無損 一詞的意思是“不丟失數(shù)據(jù)”。當(dāng)一個文件以無損格式壓縮時,全部數(shù)據(jù)仍然存在,這與壓縮文檔很相似—文檔文件雖然變小了,但解壓縮之后每一個字都還存在。您可以反復(fù)保存無損視頻而不會丟失任何數(shù)據(jù)—這種壓縮只是將數(shù)據(jù)壓縮到更小的空間。無損壓縮節(jié)省的空間較少,因為在不丟失信息的前提下,只能將數(shù)據(jù)壓縮到這一程度。 有損壓縮 有損壓縮丟棄一些數(shù)據(jù),以便獲得較低的位速。心理聲學(xué)壓縮和心理視覺壓縮是有損壓縮技術(shù),壓縮結(jié)果是文件變小,但包含的源數(shù)據(jù)也更少。每次以有損文件格式保存文件時,都會損失很多數(shù)據(jù)—即使用同一種格式保存也是如此。一條好的經(jīng)驗是,只在項目的最后階段才使用有損壓縮。 數(shù)字視頻的格式 MPEG-1 用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的編碼,經(jīng)過MPEG-1標(biāo)準(zhǔn)壓縮后,視頻數(shù)據(jù)壓縮率為1/100-1/2 00,音頻壓縮率為1/6.5。MPEG-1提供每秒30幀352*240分辨率的圖像,當(dāng)使用合適的壓縮技術(shù)時,具有接近家用視頻制式(VHS)錄像帶的質(zhì)量。 MPEG-1允許超過70分鐘的高質(zhì)量的視頻和音頻存儲在一張CD-ROM盤上。VCD采用的就是MPEG-1的標(biāo)準(zhǔn),該標(biāo)準(zhǔn)是一個面向家庭電視質(zhì)量級的視頻、音頻壓縮標(biāo)準(zhǔn)。 MPEG-2 主要針對高清晰度電視(HDTV)的需要,傳輸速率為10Mbps,與MPEG-1兼容,適用于1.5-60Mbps甚至更高的編碼范圍。 MPEG-2有每秒30幀704*480的分辨率,是MPEG-1播放速度的四倍。它適用于高要求的廣播和娛樂應(yīng)用程序,如: DSS衛(wèi)星廣播和DVD,MPEG-2是家用視頻制式(VHS)錄像帶分辨率的兩倍。 DAC 即數(shù)/模轉(zhuǎn)裝換器,一種將數(shù)字信號轉(zhuǎn)換成模擬信號的裝置。 DAC的位數(shù)越高,信號失真就越小。圖像也更清晰穩(wěn)定。 AVI AVI是將語音和影像同步組合在一起的文件格式。它對視頻文件采用了一種有損壓縮方式,但壓縮比較高,因此盡管面面質(zhì)量不是太好,但其應(yīng)用范圍仍然非常廣泛。A VI支持256色和RLE壓縮。AVI信息主要應(yīng)用在多媒體光盤上,用來保存電視、電影等各種影像信息。 RGB 對一種顏色進行編碼的方法統(tǒng)稱為“顏色空間”或“色域”。“顏色空間”都可定義成一個固定的數(shù)字或變量。RGB(紅、綠、藍(lán))只是眾多顏色空間的一種。采用這種編碼方法,每種顏色都可用三個變量來表示-紅色綠色以及藍(lán)色的強度。記錄及顯示彩色圖像時,R GB是最常見的一種方案。但是,它缺乏與早期黑白顯示系統(tǒng)的良好兼容性。因此,件多電子電器廠商普遍采用的做法是,將RGB轉(zhuǎn)換成YUV 顏色空同,以維持兼容,再根據(jù)需要換回RGB格式,以便在電腦顯示器上顯示彩色圖形。 YUV YUV(亦稱YCrCb)是被歐洲電視系統(tǒng)所采用的一種顏色編碼方法(屬于PAL)。YUV主要用于優(yōu)化彩色視頻信號的傳輸,使其向后兼容老式黑白電視。與R GB視頻信號傳輸相比,它最大的優(yōu)點在于只需占用極少的帶寬(RGB要求三個獨立的視頻信號同時傳輸)。其中“Y”表示明亮度(Lumina nce或Luma),也就是灰階值;而“U”和“V”表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用于指定像素的顏色。通過R GB輸入信號來創(chuàng)建的,方法是將RGB信號的特定部分疊加到一起。“色度”則定義了顏色的兩個方面-色調(diào)與飽和度,分別用Cr和CB來表示。其中,C r反映了GB輸入信號紅色部分與RGB信號亮度值之間的差異。而CB反映的是RGB輸入信號藍(lán)色部分與RGB信號亮度值之同的差異。 復(fù)合視頻和S-Video NTSC和PAL彩色視頻信號是這樣構(gòu)成的--首先有一個基本的黑白視頻信號,然后在每個水平同步脈沖之后,加入一個顏色脈沖和一個亮度信號。因為彩色信號是由多種數(shù)據(jù)“疊加”起來的,故稱之為“復(fù)合視頻”。S -Video則是一種信號質(zhì)量更高的視頻接口,它取消了信號疊加的方法,可有效避免一些無謂的質(zhì)量損失。它的 功能是將RGB三原色和亮度進行分離處理。 NTSC、PAL和SECAM 基帶視頻是一種簡單的模擬信號,由視頻模擬數(shù)據(jù)和視頻同步數(shù)據(jù)構(gòu)成,用于接收端正確地顯示圖像。信號的細(xì)節(jié)取決于應(yīng)用的視頻標(biāo)準(zhǔn)或者"制式"--NTSC(美國全國電視標(biāo)準(zhǔn)委員會,National Television Standards Committee)、PAL(逐行倒相,Phase Alternate Line)以及SECAM(順序傳送與存儲彩色電視系統(tǒng),法國采用的一種電視制式,SEquential Couleur Avec Memoire)。在PC領(lǐng)域,由于使用的制式不同,存在不兼容的情況。就拿分辨率來說,有的制式每幀有625線(50Hz),有的則每幀只有525線(60 Hz)。后者是北美和日本采用的標(biāo)準(zhǔn),統(tǒng)稱為NTSC。通常,一個視頻信號是由一個視頻源生成的,比如攝像機、VCR或者電視調(diào)諧器等。為傳輸圖像,視頻源首先要生成-個垂直同步信號(V SYNC)。這個信號會重設(shè)接收端設(shè)備(PC顯示器),保征新圖像從屏幕的頂部開始顯示。發(fā)出VSYNC信號之后,視頻源接著掃描圖像的第一行。完成后,視頻源又生成一個水平同步信號,重設(shè)接收端,以便從屏幕左側(cè)開始顯示下一行。并針對圖像的每一行,都要發(fā)出一條掃描線,以及一個水平同步脈沖信號。 另外,NTSC標(biāo)準(zhǔn)還規(guī)定視頻源每秒鐘需要發(fā)送30幅完整的圖像(幀)。假如不作其它處理,閃爍現(xiàn)象會非常嚴(yán)重。為解決這個問題,每幀又被均分為兩部分,每部分2 62.5行。一部分全是奇數(shù)行,另一部分則全是偶數(shù)行。顯示的時候,先掃描奇數(shù)行,再掃描偶數(shù)行,就可以有效地改善圖像顯示的穩(wěn)定性,減少閃爍。目前世界上彩色電視主要有三種制式,即N TSC、PAL和SECAM制式,三種制式目前尚無法統(tǒng)一。我國采用的是PAL-D制式。 Ultrascale Ultra6cale是Rockwell(洛克威爾)采用的一種掃描轉(zhuǎn)換技術(shù)?蓪Υ怪焙退椒较虻娘@示進行任意縮 放。在電視這樣的隔行掃描設(shè)備上顯示逐行視頻時,整個過程本身就己非常麻煩。而采用 UltraScale技木,甚至還能像在電腦顯示器上那祥,迸行類似的縱橫方向自由伸縮。 數(shù)字化影視基礎(chǔ) 以下是對影視數(shù)字化以及桌面電影制作的一些基本概念的概括和介紹。 數(shù)字化(Digitizing) 模擬視頻信號(以模擬攝象機拍攝的信號或者由膠片轉(zhuǎn)換成的模擬視頻信號)必須被轉(zhuǎn)換成數(shù)字信息,也就是被數(shù)字化,才能夠在電腦中對其進行操作。 視頻捕捉卡(The Video Card) 視頻捕捉卡需要占用電腦的一個擴充槽,視頻信號通過它由放像設(shè)備被捕捉入電腦。一般來說,視頻捕捉卡都附帶一個擴展塢,上面提供用以連接放像設(shè)備的各種插口。 數(shù)字化的視頻信號所占硬盤空間都非常大,所以很多捕捉卡在采集視頻信號的同時對信號進行壓縮,以避免在CPU、數(shù)據(jù)橋(連接捕捉卡和電腦)以及寫入硬盤時可能出現(xiàn)的瓶頸。所謂的瓶頸,就是指當(dāng)以上之中任何一個環(huán)節(jié)來不及處理輸入的信號,最直接的后果一般就是部分視頻內(nèi)容(幀)的丟失。 當(dāng)視頻流被捕捉入電腦時,它將會被存儲為一個視頻文件。你可以通過你的視頻捕捉軟件指定一個幀速度,比如15幀,視頻捕捉軟件就會通過捕捉卡以每秒種1 5幅靜止畫面的速度將輸入的視頻信號保存到緩存中,然后將視頻文件寫入硬盤。 最容易出現(xiàn)瓶頸的地方是硬盤。所以,安裝一個持續(xù)吞吐量盡可能高的硬盤非常重要,要知道,硬盤要連續(xù)處理的數(shù)據(jù)甚至比你想象的還要大。那些制作廣播級影視作品的人一般都使用磁盤陣列- -通過幾個硬盤的協(xié)作獲得最大的吞吐量。 屏幕長寬比(Aspect Ratio) 在電影和電視中,屏幕長寬比指的是屏幕的寬度和屏幕的高度的比例。大多數(shù)桌面電腦、普通電視系統(tǒng)的長寬比都是4:3。 AVI Audio/Video Interleave(音頻/視頻隔行掃描)的縮寫。AVI是Windows下的指定視頻文件格式,也是PC系統(tǒng)中使用最為廣泛的視頻文件格式,同QUICK TIME和MPEG并稱為電腦的三大主流視頻技術(shù)。簡單說,AVI以隔行掃描的視頻和音頻不斷交錯的方式工作。 分量視頻信號(Component Video) 將畫面按三個顏色通道(RGB)分成紅、綠和藍(lán)(附加亮度信號)三個單獨信號通道。產(chǎn)生的畫面質(zhì)量較高,一般在廣播級視頻設(shè)備中被采用。 合成視頻信號(Composite Video) 將彩色信號、亮度信號和同步信號混合在一個信號通道內(nèi),在家用視頻設(shè)備中被大量采用。 壓縮(Compression) 壓縮是制作數(shù)字電影的一個重要感念。視頻和音頻在數(shù)字化過程中都可以通過電腦進行壓縮。當(dāng)聲音和畫面被壓縮后,他們可以更高效的得到C PU的處理并減少視頻及音頻文件占用的硬盤空間。壓縮也是視頻在網(wǎng)絡(luò)上傳播的關(guān)鍵,必須將文件大小壓縮至帶寬允許的程度才可以被用戶下載。 壓縮比(Compression Ratio) 圖象文件原始大小和經(jīng)壓縮后圖象文件大小的比例。信號編解碼器(Codec) 壓縮/解壓縮的運算法則。也就是壓縮與解壓縮所使用的壓縮標(biāo)準(zhǔn)(例如JPEG或者Cinepak)。一般的編碼包括將模擬視頻信號轉(zhuǎn)換到壓縮視頻文件(比如M PEG)或?qū)⒛M聲音信號轉(zhuǎn)變?yōu)閿?shù)字化聲音(比如RealAudio)。 CPU 中央處理器(Central Processing Unit)。簡單的說就是電腦的"大腦",是最重要的微處理芯片,和主板及系統(tǒng)內(nèi)存協(xié)同工作。 數(shù)字化(Digitize) 將模擬信號轉(zhuǎn)變?yōu)閿?shù)字信號的過程。 信號丟失(Dropout) 由于磁帶金屬磁粉掉落引起的問題,一般是因為存放時間過長或誤操作引起的。信號丟失會造成畫面噪音、拖影以及不同步等問題。 MPEG Moving Pictures Experts Group(運動畫面專家小組)的縮寫。MPEG是一種運動畫面及聲音的壓縮標(biāo)準(zhǔn)。MPEG-1標(biāo)準(zhǔn)的視頻/音頻流的數(shù)據(jù)流量是150千比特每秒,和單倍速C D-ROM的傳輸率相同。它通過設(shè)定關(guān)鍵幀并只改變臨近幀畫面中的不同區(qū)域工作。 網(wǎng)絡(luò)用戶總線是Macintosh電腦內(nèi)部擴展槽的標(biāo)準(zhǔn)接口(專指視頻及音頻擴展卡)。新的Mac電腦均開始使用Intel的超級PCI標(biāo)準(zhǔn),所以你只能在老的M ac機種上看到網(wǎng)絡(luò)用戶總線的插槽。如果你計劃購買視頻或音頻擴展卡,并有一臺老式的Mac電腦,請先確認(rèn)你的電腦擁有什么樣的插槽。網(wǎng)絡(luò)用戶總線是由德州儀器公司( Texas Instruments)設(shè)計的。 NTSC 國家電視標(biāo)準(zhǔn)委員會(National Television Standards Commitee)的縮寫。是中北美洲及日本通用的電視制式,與歐洲的PAL制式和法國的SECAM只是相對。他的垂直分辨率有525線,幀速為30(2 9.97)FPS。 PAL 逐行倒相(Phase Alteration Line)的縮寫,是中國及歐洲大多數(shù)國家通用的電視制式。具有更高的垂直分辨率(625線),但是幀速相對慢于NTSC(25FPS)。 PCI 外接設(shè)備連接總線(Peripheral Component Interconnect)的縮寫,PCI是奔騰電腦系統(tǒng)所使用的相當(dāng)優(yōu)秀的內(nèi)置擴展接口(現(xiàn)在Apple公司的PowerPC也使用了這一總線)。 SECAM 順序傳送彩色與記憶制(Systeme Electronique Pour Couleur Avec Memoire)的縮寫。是法國、俄羅斯和部分東歐及非洲國家采用的電視制式。它和PAL制式有著相同的垂直分辨率和幀速,但是SECAM置是的色彩是調(diào)頻信號調(diào)制的。 模擬視頻的世界 視頻,簡單來說,用攝像機交將已經(jīng)錄好的視頻進行無線廣播或從錄像帶進行回放,像電流一樣在外界連續(xù)錄像(模擬信號),能看見各聽見視頻的內(nèi)容都包含在這個信號內(nèi),通過某種制備按照一定的標(biāo)準(zhǔn)進行解碼。最普通的設(shè)備是一臺電視機各最普通的標(biāo)準(zhǔn)是NTSC(國家電視標(biāo)準(zhǔn)委員會)和PAL(逐行倒相制式)。在北美的NTSC主要用于工業(yè),而在一些亞洲國家,歐洲國家和太平洋南岸在正常情況下都按照PAL標(biāo)準(zhǔn),不同的標(biāo)準(zhǔn)說明了為什么不能在英國的電視上看到的視頻卻在美國正好相反,原因是缺少專業(yè)對口的設(shè)備。 標(biāo)準(zhǔn)的視頻信號定義顏色有兩個系數(shù)。亮度和色度,亮度是黑白兩種顏色,適用控制圖像的對比度和亮度。NTSC各PAL標(biāo)準(zhǔn)兩者都運用亮度和色度,使他們與任何視音頻信號混合一起,這類信號被叫做復(fù)合信號.如同將視頻的各個方面結(jié)合起來一樣,中一部分就是信號類型,成分各區(qū)分亮度和度度,并且通過控制顏色的不同值來達到更好的視頻質(zhì)量。 我們看到的圖像是電視顯像管內(nèi)發(fā)出的一系列連續(xù)的線,線數(shù)的多少決定了視頻的質(zhì)量,NTSC為525線。PAL為625線。視頻信號慢公認(rèn)的,它刷新這些線進行瀏覽,象掃描那樣完全通過,如果它反過和升級后瀏覽,在顯示器重復(fù)的結(jié)果是60次/秒為NTSC。和50次/秒為PAL制。在模擬視頻世界中,視頻表現(xiàn)為一系列連續(xù)波動的信號。 DSP的應(yīng)用技術(shù) DSP是數(shù)字信號處理器的簡稱,在全球的數(shù)字化浪潮中,DSP以其高性能和軟件可編程等特點,長期對數(shù)字媒體處理起到了積極的推動作用。最初DSP的應(yīng)用在于專業(yè)數(shù)據(jù)通信和語音處理,各種專用調(diào)制解調(diào)器、聲碼器、數(shù)據(jù)加密機初步獲得市場。其后DSP應(yīng)用擴展到廣泛的民用產(chǎn)品,諸如硬盤驅(qū)動器、通用調(diào)制解調(diào)器、數(shù)字答錄機、無線通信終端。九十年代中DSP在數(shù)字GSM手機應(yīng)用和無線基站應(yīng)用中都獲得了巨大的成功。與此同時,DSP開始全面拓展到新興應(yīng)用,并在寬帶通信、數(shù)字控制、數(shù)字音頻、數(shù)字視頻等眾多市場全球,F(xiàn)在,我們就DSP在數(shù)字視頻行業(yè)中的應(yīng)用進行分析。 視頻行業(yè)的數(shù)字化,是模擬世界中數(shù)字化較晚的行業(yè)之一。原因主要是因為模擬視頻的數(shù)字化產(chǎn)生巨大的數(shù)據(jù)量,造成應(yīng)用的實現(xiàn)比較困難。隨著互聯(lián)網(wǎng)的速度提高,數(shù)字視頻已經(jīng)開始商業(yè)化,并逐步取代原來模式視頻的地位。 最早實現(xiàn)數(shù)字視頻的行業(yè)是家庭消費的VCD和DVD,在90年代初VCD問世后帶來了人們在家庭娛樂的新模式,而最早實現(xiàn)VCD商業(yè)化的C-CUBE公司,其核心的MPEG1的解碼芯片就是基于DSP實現(xiàn)的專用芯片。 數(shù)字視頻的發(fā)展,是隨著數(shù)字視頻標(biāo)準(zhǔn)的發(fā)展而發(fā)展,它將經(jīng)歷數(shù)字化、網(wǎng)絡(luò)化和智能化的步驟發(fā)展,并且由此帶來無限的商機。數(shù)字化的階段其實就是一個標(biāo)準(zhǔn)化的階段,現(xiàn)階段國際兩大組織分別制訂了MPEG 標(biāo)準(zhǔn)和H.26x的標(biāo)準(zhǔn),比如MPEG1的標(biāo)準(zhǔn)帶來了VCD的興起,MPEG2的標(biāo)準(zhǔn)帶來了DVD的商機,而H.261、H.263為可視電話制訂標(biāo)準(zhǔn)并為此形成網(wǎng)絡(luò)化時代的新興市場,數(shù)字視頻的標(biāo)準(zhǔn)也逐步開始統(tǒng)一,隨著MPEG4和H.264的推出,標(biāo)準(zhǔn)的統(tǒng)一將勢在必行。 現(xiàn)階段,DSP在數(shù)字視頻中將主要在數(shù)字監(jiān)控、會議電視、可視電話、家庭媒體網(wǎng)關(guān)和數(shù)字基頂盒等領(lǐng)域得到很好的應(yīng)用。 數(shù)字監(jiān)控系統(tǒng)在中國仍是一個的市場熱點,業(yè)內(nèi)專家預(yù)計今年國內(nèi)需求將突破一百萬路。幾年來數(shù)字系統(tǒng)已經(jīng)逐步取代傳統(tǒng)模擬系統(tǒng),而今年基于MPEG4的數(shù)字系統(tǒng)又全面取代MPEG1系統(tǒng),國內(nèi)已經(jīng)有領(lǐng)先廠商應(yīng)用DSP推出基于H.264的數(shù)字系統(tǒng)并投入市場。在早期的MPEG1類產(chǎn)品中,視頻有專用芯片,DSP只處理語音。在MPEG4及H.264類產(chǎn)品中DSP全面完成視頻和語音處理工作。 相比較ASIC而言,數(shù)字監(jiān)控行業(yè)在DSP平臺上進行視頻產(chǎn)品開發(fā)有以下幾方面的優(yōu)勢:第一,用戶開發(fā)自由度更大,支持多種個性化開發(fā),可以滿足市場不斷提出的新的要求,在第一時間提升產(chǎn)品性能,增強產(chǎn)品的競爭能力;第二,DSP處理能力強,可以在一個DSP上同時實現(xiàn)多路音視頻信號的壓縮處理,同時為了及時滿足應(yīng)用的需要、還提供了很多視頻專用功能,比如視頻濾波、De-interlace處理、高分辨顯示輸出、OSD功能等,甚至象網(wǎng)絡(luò)接口、IDE接口都成為了視頻DSP的主要功能,這樣使進一步大幅度降低產(chǎn)品的成本成為可能(這一點很重要);第三,開發(fā)周期短,實現(xiàn)快速技術(shù)更新和產(chǎn)品換代;第四,芯片功耗低,對提高產(chǎn)品的穩(wěn)定性提供可靠保障。 現(xiàn)階段在數(shù)字視頻領(lǐng)域內(nèi),主要有以下一些DSP廠商:Philips、Equator、Ti、ADI、Cradle等等。各家廠商都有其特點,以下分別進行詳細(xì)的介紹: 一、Philips視頻處理DSP介紹: Philips是最早開發(fā)視頻DSP的廠商之一,最早在1996年就推出了Trimedia系列的第一款芯片TM-1000,當(dāng)時主要的定位是數(shù)字電視方面的產(chǎn)品,隨后推出了TM-1100、TM-1300、PNX-1300(TM-1300改進版)系列。雖然在數(shù)字電視方面沒有取得很大的成功,但是PNX-1300系列芯片視頻監(jiān)控產(chǎn)品中得到了大規(guī)模的應(yīng)用,也算是無心插柳柳成蔭。隨后飛利浦推出PNX-1500系列,也同樣在視頻監(jiān)控應(yīng)用上面成為主流。下一步飛利浦還將推出PNX1700系列。現(xiàn)在主流的PNX1500主流的300M內(nèi)頻,內(nèi)部配有專門的媒體協(xié)處理器,在PNX1300系列的基礎(chǔ)上,解決了以前PNX1300系列中功耗過大的問題,增加了網(wǎng)絡(luò)口,IDE接口,提供了開發(fā)信息化家電和數(shù)字視頻設(shè)備的主要接口;提供LED高分辨輸出、高清視頻輸出(1920x1080)視頻輸出;具有視頻濾波和De-interlace處理視頻處理單元;可以生成2D圖形加速器;內(nèi)嵌看門狗并具有兩個Reset 管腳。 二、Ti視頻處理DSP介紹: 作為DSP行業(yè)的老大,隨著DSP在數(shù)字視頻行業(yè)的機會,Ti的TMS320DM64x系列也占據(jù)非常重要的地位。其實早在2000年,Ti就推出針對數(shù)碼相機的專業(yè)圖像處理DSP:TMS320DSC系列,并被一些廠商應(yīng)用于Motion JPEG的數(shù)字視頻算法中,隨后Ti又推出TMS320DM270和TMS320DM320等在DSC系列改進的產(chǎn)品,在多媒體的便攜式播放器上有不錯的應(yīng)用。而真正成為數(shù)字視頻的里程碑式的產(chǎn)品則是2003年TI發(fā)布的TMS320DM64X系列的視頻DSP產(chǎn)品,該產(chǎn)品以Ti的C64x為核心處理器。以TMS320DM642為例,它具有600M的處理能力,有3個Video Port,帶有PCI和網(wǎng)絡(luò)接口,該產(chǎn)品功耗低,因此產(chǎn)品一經(jīng)面世得到了數(shù)字視頻行業(yè)的強烈關(guān)注。2004年下半年TMS320DM642開始批量供貨,國內(nèi)一些著名的視頻監(jiān)控廠商采用DM642推出更新原來采用PNX1300系列的產(chǎn)品。另外,Ti還計劃不斷升級TMS320DM64x的運算速度。預(yù)計到明年,Ti還將推出內(nèi)嵌ARM9和C64x的數(shù)字視頻專用DSP,這將是業(yè)內(nèi)非常期待的產(chǎn)品。 三、ADI視頻處理DSP介紹: 作為在DSP領(lǐng)域內(nèi)Ti的最大競爭對手,2002年ADI公司推出了Blackfin系列DSP,其中的ADSP-21535是一款合適的數(shù)字視頻應(yīng)用的DSP,ADSP-21535具有600MHZ的核內(nèi)時鐘,300MHZ主頻,一個VP口,但是沒有預(yù)覽通道,接口資源也很豐富,Blackfin系列的DSP采用雙MAC的結(jié)構(gòu)具有正交的類似RISC的微處理器指令集,使單指令多數(shù)據(jù)和多媒體操作都引入單指令結(jié)構(gòu)。這樣的DSP芯片結(jié)構(gòu)不但易于編程,可以快速的信號處理和多媒體的處理,而且方便的擴展USB、PCI I/O、UART、SPORT等接口。非常適合對視頻讀入,處理以及傳輸。ADI最新的雙核ADSP-21561也是專業(yè)視頻處理DSP領(lǐng)域內(nèi)不容忽視的好產(chǎn)品。但是相比較Philips和Ti,ADI的數(shù)字視頻DSP的劣勢在于能夠支持Blackfin的第三方算法太少,這也是造成雖然Blackfin的產(chǎn)品非常有特點,但是應(yīng)用面要遠(yuǎn)遠(yuǎn)小于前面兩家公司的一個主要原因。 四、Equator視頻處理DSP介紹: 美國的Equator公司,也是最早做數(shù)字視頻領(lǐng)域內(nèi)的專業(yè)DSP廠商,Equator最先推出的MAP-CA及隨后推出的BSP-15系列產(chǎn)品,在會議電視領(lǐng)域和數(shù)字基頂盒領(lǐng)域都得到很好應(yīng)用,由于是專業(yè)的視頻DSP廠商,Equator的產(chǎn)品也非常具有特點,以BSP-15為例:該芯片最高可達到400Mhz的內(nèi)頻,具有兩個視頻輸入口和音頻輸入口,一個視頻輸出口,但是該產(chǎn)品的最大缺點就是功耗太大,產(chǎn)品必須加散熱風(fēng)扇,預(yù)計推出的BSP-16將會改變這一問題。 另外,還有其他一些廠商也開始進入數(shù)字視頻應(yīng)用DSP領(lǐng)域,諸如美國Cradle Technologies在推出CT3400后也將推出可對H.264/MPEG-4 AVC格式的D1規(guī)格影像以30幀/秒進行編解碼的DSP。而LSI則另辟蹊徑,提供DSP內(nèi)核的方式給專業(yè)的算法公司,這種方式也受到一些應(yīng)用領(lǐng)域客戶的青睞。 結(jié)束語: 隨著數(shù)字時代的到來,視頻領(lǐng)域的數(shù)字化也必將到來。而DSP在數(shù)字視頻的應(yīng)用發(fā)展也將起到越來越重要的作用,DSP技術(shù)的進步必將為人類帶來更多更大的便利,讓我們充滿期待的看著DSP在數(shù)字視頻領(lǐng)域的發(fā)展和應(yīng)用。
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團隊博客 | 免責(zé)聲明 | 關(guān)于詞典 | 幫助