遠程通信、計算機和電視/電影工業(yè)之間的傳統(tǒng)界限極為模糊。歷史上原本屬于某一領(lǐng)域的內(nèi)容現(xiàn)已滲透到其他兩個領(lǐng)域中。視頻、聲音和通信已進入計算機;交互性進入了電視;視頻和交互性則進入了遠程通信領(lǐng)域。看起來像一種聚集,實際上并非如此。這三種行業(yè)是從不同的技術(shù)角度來研究音像應(yīng)用的。
在當今世界,應(yīng)對三種主要趨勢予以關(guān)注:
1、向無線通信發(fā)展的趨勢;
2、向交互式計算機應(yīng)用發(fā)展的趨勢;
3、視聽數(shù)據(jù)的綜合應(yīng)用不斷增長的趨勢。
對于傳統(tǒng)意義上區(qū)分的各行業(yè)間的交叉,應(yīng)綜合考慮這三種趨勢;目前的標準和正在制作的標準沒有充分涉及這些新的需求。而MPEG-4的重點就是解決這些需求,即綜合三種行業(yè)的通用應(yīng)用,以提供便于交互的音頻-視頻編碼、高壓縮比和通用訪問能力。為了采用迅速發(fā)展的相關(guān)技術(shù)的優(yōu)點,MPEG-4標準將保證高度的靈活性和擴展性。
基于內(nèi)容的交互性包括人與音像畫面中有意義的對象相互作用的能力。目前,這種交互作用局限于計算機圖形,即人工合成的內(nèi)容。對于新的交互式音像應(yīng)用,能夠提供與自然的、人工的及自然/人工混合的音像對象的相互作用極為重要。
為了有效使用存儲空間和傳送帶寬,需要有較高的壓縮比。對于低比特率的應(yīng)用,改善壓縮效率非常重要。
通用訪問能力是指對有用的音像數(shù)據(jù)的訪問可以在存儲和傳送媒體的很大范圍內(nèi)進行的鑒于移動通信的迅速崛起,通過無線網(wǎng)絡(luò)進行這種應(yīng)用的訪問尤為重要。
高度的靈活性和可擴展性由句法描述語言來保證,這種句法描述語言稱為‘MPEG-4句法描述語言’(MSDL)。MSDL將在下面介紹。
目前的視聽標準是為從照相機和麥克風(fēng)獲取的自然內(nèi)容的編碼重現(xiàn)而設(shè)計的。由于上述三個領(lǐng)域的相互滲透,人工內(nèi)容的應(yīng)用在不斷增長。因此,很顯然的需求是一種既適合于自然對象又適合于人工對象的模式,它能夠用來產(chǎn)生單一的音像序列。