版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多媒体技术基础第3版练习与思考题参考答案林福宗清华人学计算机科学与技术系2008-2-15lmfzmail.tsmghua 第1章多媒体技术概要1.1多媒体是什么?多媒体是融合两种或冇两种以上媒体的一种人机交互式信息交流和传播媒体。便用的媒体包括文字、图形、图像、声音、动画和视像(video)o12超链接是什么?超链接(hyperlink)是两个对象或尤索Z间的泄向逻辑链接,是一个对象指向另一个对象 的指针。建立互相链接的这些对彖不受空间位宣的限制,可在同个文件、在不同的文件或 在世界上任何一台连网计算机上。13超文本是什么?超文本是包倉指向其他文档或文档尤素的指针的电子文档。与传统的文本文件
2、相比,它 们之间的主要差别是,传统文本是以线性方式组织的,而超文本是以非线性方式组织的。这 种文本的组织方式与人们的思维方式和工作方式比较接近。1.4无损压缩是什么?无损爪缩是用爪缩启的数拥进行贡构(也称还原或解爪缩),匝构后的数拥与原來的数拯 完全相同的数据压缩技术。岸损压缩用要求重构的数据与原始数据的应用,如穗盘文件压缩就是个应 用实例。根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原來的1/21/4。 常用的无损压缩算法包括哈夫曼编码和LZW等算法。15勺损压缩是什么?仃损压缩是用压缩后的数据进行重构,亚构后的数据与原來的数据仃所不同,但不影响 人对原始资料表达的信息造成误解的
3、数据压缩技术。有损床缩适用虑构数据不一泄非耍和原始数据完全相同的应用。例如,图像、视像和 川音数据就可采用仃损压缩,因为它们包含的数据往往多我们的视觉系统和听觉系统所能 感受的信息,丢掉一些数据而不至对图像、视像或声音所表达的意思产生谋解。1.6 SGML是什么语言? SGML语言的帮华是什么? HTRIL是什么语靑? HTML语詳与SGML 语言是什么关系?(1) 1986年国际标准化组织(ISO)采用的信息管理标准。该标准定义独工于平台和应用的 文本文档的格式、索引和链接信息,为用户提供一种类似语法的机制,用來泄义文档的结 构和指示文档结构的标签。(2) SGML的精华是把文档的内容与样式
4、分开处理。(3) HTML是用来创建超文本文档的标记语言,也是创建Web网页用的标记语言。(4) HTML 是 SGML 的一个 了集。1.7有人认为“因特网就是万维网”,这种看法対不对?为什么?(1) 不对。因特网是&指全球范国内垠人的、由众多网络和互连接而成的、基TCP/IP协议的 计算机网络:力维网是指分布在全世界所仃HTTP服务器上互相连接的超媒体文档的集介。1.8组成力维网的4个核心部分是什么?(1) 超文本传输协议(HTTP):(2) 文榔格式标准,包括HTML, XML XHTML:(3) 执行HTTP协议的Web浏览器:(4) 执行HTTP协议的Web服务器。1 9 H
5、.261-H.264和G.711G.731是哪个组织制定的标准?国际电信联盟(ITU)o1.10MPEG-1, NIPEG-2 fllNIPEG-4是哪个组织制泄的标准?ISOIEC,即国际标准化组织(ISO)/国际电丁技术委员会(IEC)o1.11因特网标准是哪个组织制定的标准?因特网标准是ISOC(因特网协会或称互联网协会)协调的4个组制定的。ISOC负责协调的4个组:(1)因特网工程特别工作组(IETF); (2)因特网体系结构研究 部(IAB): (3)因特网工程指导组(IESG): (4)因特网研究特别工作组(IRTF)<>1.12 HTML和XML语言是哪个组织制定的标
6、准?力维网协会(World Wide Web Consortium, W3C)。1.13阐述你对数据、内容、信息、知识和智慧的理解。(1) 数据(data)是以数宁、7符或图像等可读语言或K他记录方法农示的事实、概念或拆 令,适用于人或自动装置进行通信、解释或处理。数据本身没有意义,通常需要在一定的语 义环境中才有意义(2) 内容(content)是对数据的描述,(3) 信息(mformation)足对内容的解释,信息是数据的會义。 知识(knowledge)是在某个感兴趣领域屮的爭实、概念和关系。(5) 智慧(wisdom)是知识累积后产生的洞察力、判断力和发明创造能力。第2章无损数据压缩2
7、.1假设g,b,c是山3个卅I组成的集合,计算该集介的决策瓦(分别用Sh, Nat和Hart 作单位)。Ho =(log23) Sh =1.580 Sh=(loge3) Nat= 1.098 Nat=(logi03) Hart= 0.477 Hart2.2现仃幅川256级灰度衣示的图像,如果何级灰度出现的概率均为p(X,) = 1/256, 2 0,255,计算这幅图像数据的埼。丄11H (X)= -工"(兀)log2 /?(x.) = -256x ( x log2 ) =8 (位),也就是每级灰度的代码就耍用8比特,不能再少了。2.3现仃8个待编码的符号“ 它们的概率如练习表21所
8、示,计算这些符号的 夫曼码并填入表中。答案不唯一)。练习表21待编码符号概率分配的代码代码长度(比特数)叫04110.200030.150013加30 1001130.0701014叫0 04010005叫0030100106加70 0101001162.4现有5个待编码的符号,它们的概率见练习表22 计算该符号集的:(1)烁(2)霍夫 曼码;(3)平均码长。练习表22符号q6a5概率00.1爛nH (q)= 一工 “(a J log? P(4)二0.4 X 10g2 (0 4)-2 X 0.2* log2 (0 2)-2 X 0.1 log? (0.1) j=1=0.4X
9、13219+0.4X2,3219+0.2X3.3219=0.5288+.0.9288+0.6644=2.1220 (位)编码树和雷夫曼码3练习图2编码树编码表符号概率霍夫曼码*码长所需位数0.401040.21120.40.210130-60.1100140.40.1100040.4代码分配不啡一(3)平均码长o>(04)坷(0.2)1» 凡(10)色(0.2)_1厲(06)d5(0.1)0,片(0.2)耳(04)L = 04+0.4+0.6T.4+.04=2.2(位/符号)2.5使用算术编码生成字符Mgames的代码。字符g,a,ge,s的概率见练习表23。练习表23符号ga
10、mes概率0.840.7920.77920.77776l.Vg/ / /0.6Ay-/-/0.4-/-/02;r£70.1A A=Ns060.760.7760.77760.7776练习图2-2 games的算术码2.6字符流的输入如练习农24所示,使用LZW算法计算输出的码字流。如果对本章介绍的LZW算法不打算改进,并按表217所示步骤计算,请核对计算的输出码字流为: (8)(10)(11)。练习表24I 输入位置 I 1 I 2 I 3 I 4 I 5 I 6 I 7 I 8 I 9 liol 11 112 113 114 15 I 16 17
11、I I输入字符流ababcbababaaaaaaa 输出码字ab-abc-bababa-aa-aaa练习表25步骤位置词典输出码字(1)a(2)b(3)c11ab(1)22(5)ba(2)34(6)abc(4)45cb(3)57(8)bab(5)610(9)baba(8)711(10)aa(1)813(IDaaa(10)916(12)aaa(ID 1.7 LZ78算法和LZ77算法的差别在哪里?(1) LZ77编码算法的核心是杳找从前向缓冲存储器开始的报长的匹配出(242 LZ77算 法)。LZ78的编码思想是不断地从字符流屮提取新的缀-符串(String),通俗地理解为新“词 条”,然后用“
12、代号”也就是码字(Code word)衷示这个“词条”。这样一來,対字符流的 编码就变成了用码字(Codeword)去替换字符流(Charstream),生成码字流(Codestream),从而 达到压缩数据的目的。(244LZ78算法)1.8 LZSS算法和LZ/7算法的核心思想足什么?它们之间仃什么差别?(DLZSS通过输出真实字符解决了在窗II中出现没有匹配串的问题,但这个解决方案包 含有兀余信息。(243LZSS算法)LZ77编码算法的核心是查找从前向缓冲心储器开始的虽长匹配串(242 LZ77算法)2.9LZW算法和LZ78算法的核心思想是什么?它们之间有什么差别?(1) LZW/.
13、丿、和LZ78算法的核心思想都是不断地从字符流中提取新的缀符串(Stnng), 通俗地理解为新“词条”,然后用“代号”也就是码字(Code word)衣示这个“词条”。这 样-谏,対字符流的编码就变成了用码字(Code word)去替换字符流(Charstream),生成码字 流(Codestream),从而达到压缩数据的冃的。(244 LZ78算法)(2) 在编码原理上,LZW与LZ78相比有如F差别:LZW只输出代表诃典中的缀符 冷(String)的码字(code word)。这就意味在开始时词典不能是空的,它必须包含对能在?符流 中出现的所冇单个字符,即前缀根(Root)。由J:所冇可能
14、出现的单个字符都事先包仟在 词典中,每个编码步骤开始时都使用一字符前缀(one-characterprefix), |丙此在词典中搜索的 第1个缀符串有两个字符。 新询缀开始的字符是先询缀符串(C)的垠眉 个字符,这样 在巫构词典时就不需要在码字流中加入额外的字符。(245 LZW算法)2.10你是是否同意“某个事件的信息最就是某个事件的爛”的看法。"信息鼠(information content)是具有确定概率事件的信息的定量度吊",而“爛(entropy) 是事件的信息量的平均值,也称事件的平均信息最(mean mfonnation content)”。第3章数字声音编
15、码3.1音频信号的频率范用人约多少?话音信号频率范闱人约多少?(1) Audio: 20-20000 Hz(2) Speech: 3003400 Hz3.2什么叫做模拟信号?什么叫做数字信号?(1)模拟信号是幅度或频率发生连续变化的一种信号 数字信号是以二进制代码形式农示有无或高低的一种信号。3.3什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?(1) 采样:在某些特定的时刻对模拟信号进行测炭的过程。(2) 战化:褊值连续的模拟信巧转化成为幅值离散的数字信号的过程。(3) 线性彊化:在届化时,信号幅度的划分是等间隔的吊化。(4) IH线性最化:在量化时,信号幅度的划分是非等间
16、隔的量化 3.4采样频率根据什么原则來确定?奈奎斯特理论和声音信号本身的最高频率。采样频率不应低丁声音信号最高频率的两 倍,这样就能把以数字表达的声音还原成原来的声音。3-5样本粘:度为8位的信噪比等J哆少分贝?48分贝3.6出哪儿种等级?它们的频率范|;|分别是什么?表3声音质量和数据率质量采样频率(kHz)样本特度(bit/s)单道声/立体声数据率(kb/s) (未压缩)频率范甫电话*88单道声64.02003 400 HzAM11.0258单道声88.22015 000HzFM22.05016立体声705.6507 000HzCD44.116立体声1411.22020 000 HzDAT
17、4816立体声1536.02020 000 Hz3.7选择采样频率为22.050 kHz和样本粘度为16位的录育参数。在不采川爪缩技术的情况 卜,计算录制2分钟的立体声需要多少MB(兆宁节)的存储空间(1MB=1O24X1O24B)(22050 X 2 X 2 X 2 X 60)/(1024 X 1024) = 10 09 MB 3.8什么叫做均匀量化?什么叫做非均匀量化?(1) 均匀最化:采用相等的吊化间隔对采样得到的信号进行杲化。它是线性竜化的另一 种说法。(2) 非均匀量化:采用非相等的量化间隔対采样得到的信号进行量化。例如,对大的输 入信号采用人的駅化间隔,対小的输入信匕采用小的駅化间
18、隔。它是非线性斎化的另一种说 法。3.9什么叫做p率压扩?什么叫做A率压扩?(1) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITTJR (缩)扩(展)标准。在北美PCM电话网中,使用p率压扩算法。(2) 在脉冲编码调制(PCM)系统屮,一种模拟信号和数字信号之间进行转换的CCITT压 (缩)扩(展)标准。在欧洲电话网,使用A律压扩算法。対采样频率为8 kHz,样木精度为13比特、14比特或16比特的输入信号,使用卩律 斥扩编码或使用A律压扩编码,经过PCM编码器Z后每个样本的梢度为8比特,输出的数据 率为 64 kbpso310G.711标准定义的输出数据率是多
19、少? T1的数据率是多少? T2的数据率是多少?(DG.711使用p率和A率斥缩算法,信号带宽为3.4kHz,斥缩后的数据率为64 kbps。(2) T1 总传输率:1.544 Mbpso(2) T2 总传输率:6 312 Mbps.3.11自适应脉冲编码调制(APCM)的基本思想是什么?根据输入信号幅度人小來改变彊化阶人小的-种波形编码技术。这种口适应可以是瞬时 门适应,即吊化阶的人小每隔几个样本就改变,也可以是音节门适应,即鼠化阶的人小在较 长时间周期里发生变化。3.12差分脉冲编码调制(DPCM)的基本思想是什么?利用样本与样木之间存在的信息冗余度來进行编码的-种数据压缩技术。这种技术是
20、根 据过去的样本去估算(estimate)卜一个样本信号的幅度人小,这个值称为预测值,然后对实际 信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码 调制(PCM)不同的是,PCM足巨接对采样信号进行彊化编码,而DPCM是对实际信兮值与预 测值Z斥进行昴化编码,存储或苕传送的是无值而不是幅度绝对值,这就降低了传送或存储 的数据最。此外,它还能适应大范闱变化的输入信号。3.13自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?ADPCM综介T APCM的M适应特性和DPCM系统的差分特性,是一种性能比较好的波 形编码。它的核心想法是:利用自适应的思想改变量化
21、阶的大小,即使用小的量化阶 (step-size)去编码小的差值,使用人的届化阶去编码人的差值,使用过公的样本值佔算卜一 个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章 彩色数字图像基础4.1什么叫做真彩色和伪彩色?在一幅彩色图像中,每个像素值冇RGB三个某色分帚,每个基色分帚直接决定显 示设备的基色强度,这样产牛的彩色称为真彩色。例如用RGB 5 : 5 : 5表示的彩色图像,R.G, B徐用5位,用R, G, B分杲人小的值肖.接确定三个基色的强度,这样得到的彩色是真 实的原图彩色。现在,通常把每个像索的颜色值用24位表示的颜色叫做典彩色。24位衣示 的颜色总数:224
22、 = 16 777 216种颜色。4.2什么叫做屏幕分辩率和图像分辩率?査看你使用的计算机的所有屏幕分辩率。(1)屏幕分辩率是显示设备再现图像的粘细程度的度啟方法;图像分辨率是图像粘细 程度的度量方法。在Windows的主界而下,单击鼠标器的右键-在弹出的菜单上点击“属性” t在弹 出的“显示属性”窗【1上点击“设”按钮T然后点击“高级“按钮-在弹出的“默认监视 器和”窗II上点击“适配器”按钮t再点击“列出所有模式】)”按钮,就M看到你的 计算机的所有屏幕分辩率。43个像素的RGB分量分别用3, 3, 2位表示的图像,该幅图像的颜色数目最等是多少? 如果有-幅256色的图像,问该图的颜色深度
23、是多少?(1) 256 种;(2)8 位4.4按照JPEG标准的耍求,一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较,菲图像专家难以找出它们Z间的区别,此时的最人压缩比是多少?24:1 4.5 JPEG压缩编码算法的主耍计算步骤是:DCT变换,磺化,Z字形编码,使JIIDPCM对厲流系数(DC)进行编码, 使用RLE对交流系数(AC)进行编码, 爛编码。 假设计算机的椿度足够鬲,在上述计算方法中,哪些计算对图像的质炭是冇损的?哪些 计算对图像的质杲是无损的?I1.算法名称有损/无损算法名称有损/无损DCT变换无损 使用DPCM对直流系数(DC)进行编码无损量化有损 使J1IRLE
24、对交流系数(AC)进行编码无损Z字形编码无损爛编码无损4.6什么叫做Y校正?在屏幕上显示用离散啟衷示的色彩时采用的种色彩调整技术。计郭机显示器和电视釆 用的阴极射线管产生的光亮度与输入的电压不成正比,而是等r以某个常数为底,以输入电 斥为指数的数.这个常数称为Y,它的值随显示器的不同而改变.一般在2.5左右。4.7什么叫做Q通道?它的作用是什么?在每个像素用32位表示的图像表示法中的高8位,用广表示像素在一个对象中的透明 度。例如,用两幅图A和B混合成一幅新图New,新图的像素为:New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)
25、o在汁算机环境F, &通道可存储在帧缓冲存储器中的附加位 平而上。对J: 32位帧缓冲存储器,除高8位是&通道外,其余24位是颜色位,红、绿和 蓝各占8位。4.8 PNG图像文件格式的主要特点是什么?PNG用來存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像 的深度可多到48位.并FL还可存储女到16位的a通道数据。详见“4. 7. 4 PNG格式”。49 什么叫做图形(graphics).图像(image)、位图(bitmap)和图形图像(graphicalimage)?(1)图形:按照数学规则用绘图软件(如Adobe Illustrator)或图形输入i
26、殳备创建的图,如 丁程图和结构图。图像:用像素值阵列表示的人物或场景的图.位图:用像素值阵 列表示的图。(4)图形图像:表示矢最图的位图。4.10通过调査、试脸和分析,把BRCP, GIF, JPG和PNG格式的些特性填入卜表。图像文件格式名称BMPGIFJPGPNG有损还是无损压缩无损无损有损无损支持的址人颜色数16 777 21625616 777 21616 777 216第5章颜色的度量体系5.1 化开扌石颜色科学方I何,Newton, Tliomas Yoimg, Maxwell. Munsell. Ostwald和CIE分别做 出了哪些重嘤贡献?(1) Newton:发明了颜色圆,
27、用J度量颜色(2) Tliomas :认为人的眼睛冇三种不同类也的颜色感知接收器,人体上相当J红、绿 和蓝三种基色的接收器。(3) Maxwell:探索了三种基色的关系,并11认讲到三种基色相加产生的色调不能覆盖整 个感知色调的色域,而使用和减混色产生的色调却可以。他认识到彩色衷而的色调和饱和度 对眼睛的敏感度比明度低。Maxwell的工作可被认为是现代色度学的基础。Miuisell:开发f第一个广泛被接受的颜色次序制,称为Munsell color-order system或 者叫Munsell color system,对颜色作了榕确的描述并用在他的教学中。Munsell颜色次序制也 是其
28、他颜色体系的基础。(5) Ostwald:开发了Oshvald颜色体系,根据对颜色起决定作用的波长、纯度和亮度来 映射色调、饱和度和明度的值。(6) CIE定义了许多度彊颜色的标准5.2什么足颜色空间?对人、显示设备和打印设爸,通常采用什么颜色参数來定义颜色?(1)颜色空间:表示颜色的一种数学方法,人们用它來指定和产生颜色,使颜色形彖化。 对J人來说,可以通过色调、饱和度和明度來定义颜色;刈丁显示设备來说,人们 使用红、绿和蓝磷光体的发光昴来描述颜色:对打印或者印刷设备來说,人们使用青色、 品红色、黄色和黑色的反射和吸收来产生指定的颜色。53什么叫做颜色系统(即颜色体系)?简耍说明组织和农示颜
29、色的两种方法。(1) 组织和表示颜色的方法。(2) 两种方法:颜色模型(color model),编目系统(cataloging system)0注:(1) 颜色模型:在台式机排版和图形艺术屮,农示颜色的任何-种方法或约定。在图形 艺术和印刷领域,颜色常用Pantone(公司)颜色匹配系统:在计算机图形学方而,以卜任何一 种不同的色彩系统都可以描述色彩:HSB(色调,饱和度和亮度),CMY(青,品红,黄)和 RGB(红,绿,蓝)。颜色空间是颜色模丿跖让普通的例了. RGB, HSB, CMY, CEE XYZ, CIELAB. CMYK 和颜色的光谱描述方法都是颜色模型。105.4使用你能够找
30、到的工典和资料,探讨本章介绍的CIE度啟体系是否何错谋,哪些地方石 耍修改和补充。CIE度届体系包括:CIE 1931 RGB CIE 1931 XYZ CIE 1931 xyY CIE 1960 YUV和 CIE YLTV CIE 1976 LUV CIE 1976 LAB CIELUV LCh和CIELAB LCh (略)第6章颜色空间变换61 PAL制彩色电视使用什么颜色模熨? NTSC制彩色电视使用什么颜色模型?计算机图像 显示使用什么颜色模型?(1) PAL制彩色电视:YUV(2) NTSC制彩色电视:YIQ(3) 计算机图像显示设备:RGB6.2用YUV或YIQ模型來农示彩色图像的
31、优点足什么?为什么黑口电视机可看彩色电视图 像?(1) YUV表示法的优点:它的亮度信号(Y)和色度信号(U,V)是相耳.独工的,I大1此可 以对这些单色图分别进行编码;町以利用人眼的特性來降低数字彩色图像所石要的心储 容量。YIQ同样貝仃YUV的这两个优点。(2) 黑门电视能接收彩色电视信号的道理是利用了YUV/YIQ分吊:之间的独立性。6.3在RGB颜色空间屮,当RGB,且为任意数值,问计算机显示器显示的颜色是什么颜色? 灰色6.4在HSL颜色空间中,当H为任意值,S=L=0时,R, G和B的值是多少?当H=0, S=1,L =0.5, R, G和B的值是多少?(1) 当H为任意值,S=L
32、=0时,R=G = B = 0(2) 当H=0,S=l,L=0.5 时,R=l, G = B = 06.5打开Windows操作系统屮的“画图”程序,在“编辑颜色”窗11中的红(R)、绿(G)、蓝(B)和色调(H)、饱和度(S)、亮度(L)对应显示上,如耒设置R=G=B = 255,问H, S和L的 值分别为多少?分别改变R,G和B的值,观察H, S和L的值的变化。当R=G=B=255 时,H=160, S=0, L=240o(略)6 6用MATLAB编'与RGB到HSL和HSL到RGB颜色牢间的转换程序:rgb2hsl.m和hsl2rgb.m。(略)6.7用MATLAB编写YCbCr
33、和RGB,0,219颜色空间的转换程序:RGB2YCbCr和YCbCr2RGB mo (略)第7章小波与小波变换7.1写出矢空间yy 3的哈尔小i .: | imi出它的波形Z ZI 0 II I 二壬異寸X 寸 mmrJLmmIVXVI9WI 9I/SIVHVI9C龙 邑X 9MZIVXW9I 二 I 9I/IIVHW9I、OI冒K9I、8Y'VI9W9HXVI9U90I icrv邑X9V 寸 VXVI9IS9UEVXVI9UZ単w9I、TfIVHw8、29I、TVXvlg、eIs.9U0IVXW9U69i、6vxvi9is 邑w9I、9m、sUXVI9I、寸 邑M9UZVXVI9I
34、 二91 二 vxvlo7 nSvTMS聖怒堤厶、$住寸x寸Q)或汝宰怒摸厶、£冬寸X寸(I)007.3使用MATLAB中的多级一维小波分解换数例程(hinction)wavedec,对例7.2所示的函数 作小波变换。(略)7.4使用规范化的小波变换算法,用MATLAB编写个M文件,重新计算 /(.V)= 2, 5,8, 9, 7, 4,-1,-1的哈尔小波变换。(略)第8章小波图像编码8.1什么叫做零树?“零树"是指小波变换系数Z间的一种数据结构。因为离散小波变换是-种多分辨率的分 解方法,每一级分解都会产生表示图像比较粗糙(低频图像)和比较精细(高频图像)的小波系 数,
35、在同一方向和相同空间位置匕的所有小波系数之间的关系可用一棵树的形式表示,如果 树根和它的子孙的小波系数的绝対值小J某个给定的阈值"threshold),那么这棵树就叫做冬 树。8.2解释EZW的含义。嵌入零树小波编码(embedded zerotree wavelet, EZW)是Shapiro, J. M在 1993 年开发的- 种编码算法。”小波”衷示该算法以离散小波变换为呈础,以变换后的人系数比小系数更重耍 以及高频子带中的小系数可以忽略为背景:”零树”表示小波变换系数之间的一种数据结构, 用同一方向和相同空间位置上的所有小波系数构成-棵树,如果树根及其子孙的小波系数的 绝对值
36、小某个给定域值,则这棵树就称为零树;”嵌入”衷示一幅图像可以分解成-邮低分 辨率图像和分辨率由低到高(表示图像细节)的许多子图像,图像合成过程足通过子图像生成 许多分辨率不同的图像。EZW编码就是按照用户对图像分辨率的不同要求,编码器进行参 次编码,每进行一次编码,域值降低1/2,水平和垂直方向上的图像分辨率各提高1倍。编 码从最低分辨率图像开始扫描,每当遇到幅度大于域值的正系数就用符号R表示,幅度小f 域值的负系数用符号N表示,树根节点上的系数幅度小J:域值而树枝中冇人域值的II:零树 用符号Z表示,零树用符号T表示,编码的输出是符号集P,N,T,Z,O,1屮的一系列符号。83如果条件允许,
37、川MATLAB或者其他语言编写执行EZW算広的编码和解码程序 (略)&4解祥SPIHT的含义。层树分集算法(set partitioning in hierarchical trees, SPIHT)的根据是,图像经过小波变换 Z后,人部分能彊都集中在低频子带。从这个事实出发,最先传送幅度人的系数,这样解码 器即使在低速率应用环境卜也可得到图像的人部分信息。编码树的结构与EZW算法的结构 类似,每一个节点要么没有子节点,要么有4个子节点。在编码过程中使用三个列表变量 存储匝耍系数和不贞要系数。该算法适用图像的渐进传输,其令比较高的PSNR,复杂度 比较低,计算鼠比较少,位速率容易控制等
38、优点。8.5如果条件允许,用NIATLAB或者贞他语言编写执行SPIHT算法的编码和解码程序。(略)86诸用因特网搜索工具,査找并阅读EBCOT的详细说明。(略)8.7如果条件允许,用MATLAB或者其他语言编写执f J EBCOT算法的编码和解码程序。(略)8.8 JPEG 2000 Yf许多功能,请用因特网搜索工具调査和描述它的i羊细功能。(略)第9章数字电视基础9.1电视是什么?电视制是什么?世界上主耍的彩色电视制仃哪几种?(1)电视是捕获、广播和接收活动图像和声音的远程通信系统:(2)电视制(television system)是传输图像和声音的方法;(3)冃前世界匕使用的彩色电视制式
39、主耍仃PALNTSC, SECAA1三种,都是模拟彩色电视制式。9.2隔行扫描是什么意思?非隔行扫描是什么意思?(1) 在隔行扫描屮,一帧画面分两场,第一场扌1描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第 5、7行上扫,直到最后一行奇数行打完后接着扫偶数行,这样就完成了一帧(&ame)的扌J描。隔行打描耍求第一场结束J:最后一行的一半,不管电子束如何折冋,它必须冋到显 示屏顶部的屮央,这样就町以保证柑邻的第二场扌I描恰好嵌在第一场各扌I描线的中间。正是 这个原因,才要求总的行数必须是奇数。(2) 在非隔行打描
40、中,电子束从显示屏的左上角一行接一行地扌:!到右卜角,在显示屏上 扫一遍就显示一幅完報的图像。93电视机和计算机的显示器各使用什么打描方式?电视机通常使用隔行扌I描:计算机的显示器通常使用卄隔行打描。9.4 ITU-RBT.601标准中,PAL和NTSC彩色电视的毎一条打描线上的令效显示像索是多 少?720个像素9.5 SA-ideo信号是什么?它的连接器结构是什么样?S-Video(Separate Video)是亮度信号(Y)和色度信号(C)分开录制和处理的种电视信号。 SVideo是分昴模拟电视信号和复介模拟电视信号的-种折中方案。使用SVideo冇两个优 点:(1)减少亮度信号和色差信
41、号Z间的交叉干扰。(2)不须耍使用梳状滤波器來分离亮度 信号和色差信号,这样可提高亮度信号的带宽。S-Video连接器的结构和外形可用搜索引擎的图片搜索功能找到。it: SVHS和Hi8摄像机以及盒式录像机(video cassette recorder, VCR)使用这种技术, 它比标准的VHS和8亳米格式的设备提供质帚比较高的彩色图像。在使用S-video技术的设 备卜.,电视信号的输出除含冇分离的亮度(Y)和色差信号(C)输出外,还右复介彩色全电视信 巧。S-video设备与其他设备连接的连接器使用S-video连接器,而不是腔通的RCA连接器。 有些电视图像卡和高档家用录像机(VCR)
42、可以支持这种信号。9 6対彩色图像进行子采样的理论根据是什么?人的视觉系统所八何的两种特性。-是人眼对色度信号的敏感程度比对壳度信号的敬感 程度低,利用这个特性可以把图像屮表达颜色的倍号去掉些而使人不易察觉:二是人眼对 图像细节的分辨能力冇一定的限度,利用这个特性可以把图像中的高频信乃去掉而使人不易 察觉。子采样是压缩彩色电视信号的一种技术。9.7图像了采样是在哪个彩色空间进行的?在YCbCr颜色空间9.8 一幅YUV彩色图像的分辨率为720X576像索。分别计算采用4:2:2、4:1:1和4:2:0子采 样格式采样时的样本数。(1) 444这种采样格式不是子采样格式,它是指在每条打描线上每4
43、个连续的采样点取 4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本 表示。720X576X3 = 1 244 160(2) 4:2:2这种子采样格式是扌旨在每条打描线上每4个连续的采样点取4个亮度Y样本、 2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。720X576X2 = 829 440(3) 411这种子采样格式是指在每条打描线上每4个连续的采样点収4个亮度Y样本、 1个红色差Cr样本和1个蓝色差Cb样木,平均每个像素用L5个样本表示。720X576X1.5 = 622 080(4) 4:2 0这种子釆样格式是指在水平和垂直方向上每
44、2个连续的采样点上取2个壳度Y 样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像索用1.5个样本表示。720X576X1.5 = 62208099数字电视是什么?数字电视(digital television/digital TV, DTAD是用数据压缩技术和数字传输技术的远程 通信系统9.10在目前的数字电视传输方式中,勺哪3种主要传输方式?口前传输数字电视用得最多的方式是使用卫星、地而广播和电缆,用它们传输的电视分 别称为地面数字电视(digital tenestnal TV)、卫星数字电视(digital satellite TV)和有线数字电视 (digital cable T
45、V)。9.11高清晰度电视(HDTV)是什么?高清晰度电视(high definition television, HDTV)是貝仃正常视力的观众可得到与观看原 始景物时的感受儿乎相同的数字电视。通常认为,在观众与显示屏Z间的距离等J" 3倍显示 屏高度的情况卜就可获得这种感受。9 12你是否同意将DVB(D】gital Video Broadcasting)译成“数字电视广播(技术厂而将 DT*(digital television / digital T*)译成"数字电视";你是否同意"video是television的 同义词”的说法。略。第10章
46、MPEG简介10.1制定MPEG标准冇哪4个阶段以及各阶段提交什么类熨的文件?(1) I:作文件(Working Draft, WD);匸作组(Working Group, WG)准备的匸作文件(2) 委员会草案(Committee Draft CD):从1作纽WG准备好的匸作文件WD提升上來的 文件。这是ISO文档的最初形式,它由ISO内部正式训查研究和投漿表决。(3) 国际标准草案(Draft International Standard DIS):投栗成员国对CD的内容和说明满 意之后由委员会草案CD提升上来的文件。(4) 国际标准(International Standard, IS)
47、:由投栗成员国、ISO的其他部门和其他委员会 投栗通过之厉出版发布的文件。10.2NfPEG-l,-2,-4, -7, -21分别是什么标准,各自要达到的冃标是什么?MPEG-1是数字电视标准。NIPEG-1处理的是标准图像交换格式的电视,即NTSC制为 352像素乂240彳:/帧乂30帧/秒,PAL制为352像素X288彳7帧><25帧/秒,压缩的输出速率 定义在1.5 Mbit/s以卜。这个标准主耍是针对为时冇这种数据传输率的CD-ROM和网络而 开发的,用在CD-ROM上存储数字影视和在网络上传输数字影视。NIPEG-2是数7电视标准。MPEG-2标准是一个直接与数字电视广播
48、仃关的高质最图像 和声音编码标准,足MPEG-1的扩充。MPEG-2提供位速率的可变性能功能,英最克木目标 是:位速率为49 Mbit/s,最高达15 Mbit/s。NIPEG-4是视听对象编码标准。MPEG-4是为视听数据的编码和交互播放开发算法和匸 儿 是一个数据速率很低的多媒体通信标准。MPEG-4的LI标是要在异构网络环境卜能够高 度可靠地工作,并且具有很强的交互功能。MPEG-7是多媒体内容描述接I I标准。MPEG-7的名称叫做多媒体内容描述接I I,忖的 是制定一套描述符标准,用来描述各种类醴的多媒休信息及它们Z间的关系,以便更快更右 效地检索信息。这些媒体材料町包括静态图像、图
49、形、3D模型、声音、话音、电视以及在 多嫌体演示中它们Z间的组介关系。在某些情况卜,数据类型还可包括而部特性和个人特性 的表达。MPEG-21是多媒体柿荣林准。MPEG-21企图描述*媒体的元数据(metadata)1,用全 球多媒体对象的集成、创建、使用、操作、管理和传送等操作,便J:不同人群在异构网络坏 境卜使用务种多媒体资源,它的H标是为未來多媒体的应用提供一个完整的平台c MPEG-21 要解决的核心问题是资源共享、知识产权和版权的管理与保护。10.3 MPEG-A, -B, -C, -D和-E分别是什么标准?MPEG-A:多媒体应用格式标准,集成多种MPEG技术以提供专用的格式:MP
50、EG-B:为专用系统提供系统技术标准;XIPEG-C:为专用电视提供电视技术标准:】元数据(metadata)描述数据本少特性的数据,如描述包侖在数据流中的声音和视像数据的元数据,描 述文件中的标理、主题、作者和大小等的元数拥.NIPEG-D:为专用声音提供声音技术标准;MPEG-E:为应用程序提供卜域和执行功能的多媒体中间件标准10.4说明电视规格MPML和HPHL各自的含义。MPNIL (Mam Profile, Main Level)指的是只旳这种特性的电视:分辨率为720X576X 30,子采样格式为420,位速率可高达15 Mbps。HPHL (High Profile, High
51、Level)指的是JV有这种特性的电视:分辨率为 1920x1152x60,子采样格式为4:2:0或者4:2:2,位速率可高达80 Mbps.第11章MPEG声音il l列出你所知道的听觉系统的特性。响度感知,音高感知,掩蔽效应11.2什么叫做听阈?什么叫做痛阈?(1) 当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”(2) 当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“听阈”。实验表明, 如果频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感到疼痛,这个阈值称为 “痛阈”。11.3什么叫做频域掩蔽?什么叫做时域掩蔽?(1) 强纯音掩蔽在其附近同时发声的弱纯
52、音,这种特性称为频域掩蔽。(2) 在时间方向上相邻声音Z间的掩蔽,这种特性称为时域掩蔽。11.4MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性?层1:频域掩蔽特性;层2:频域掩蔽特性+时间掩蔽特性;层3:频域掩蔽特性+时间掩蔽特性+临界频带特性(声音频率与掩蔽曲线不是线性 关系);11.5MPEG-1的层1、2和3编码器的声音输出速率范用分别是多少?层 1: 384 kbps层 2: 256192 kbps层 3: 128112 kbps11 6NIPEG-1 的声音质最是:0AM DFM D 电话 Daear-CD DCD-DA AM FM 电话 VD near-CD CD-DA
53、11-7什么叫做5.1声道立体环绕声?什么叫做7.1声道立体环绕声?(1) “5.1环绕声”也称为“3/2立体声加LFE”,其中的“1”是指LFE声道。它的含 义是播音现场的前面可有3个喇叭声道(左、中、右),后面可有2个环绕声喇叭声道,LFE 是低频音效的加强声道。7.1声道环绕立体声与5.1类似。1711.8简述MPEG-2 AAC的特性。MPEG-2 AAC是MPEG2标准中的一种屮常戎舌的小W感知编码标准。它使用听觉系统 的掩蔽特性來减少声音的数据吊,并II通过把彊化噪声分散到乞个子带屮,用全局信号把噪 声掩蔽掉。AAC支持的采用频率町从8 kHz到96 kHz. AAC编码器的音源可
54、以是单声道的、立体 声的和多声道的声音。AAC标准可支持48个主声道、16个低频音效加强通道LFE、16个配 音声道或者叫做多语言声道和16个数据流。MPEG-2 AAC在压缩比为11:1,即在每个声道的数据率为(44.1X16 )/11=64 kbps,而5 个声道的总数据率为320kbps的情况卜°,很难区分还泉后的声音与原始声音之间的差别。与 1PEG-Audio层2相比,NIPEG-2 AAC的压缩率町提高1倍,而且质讹更高,与MPEG的丿丄 3相比,在质鼠相同的条件下数据率是它的70%。11.9什么叫做自然声音?什么叫做合成声音?口然声音通常是指人、动物等发出的声音、弹奏乐器或其他音源I然发出的川音。介成声音通常扌旨介成器生成的声音,如MIDI。11-10什么叫做TTS?至少列举TTS的3个潜在应用例子。通过话音合成设备口动地把垄文字的数据转换为声音输出的种技术。文语转换的垠 终目标是要使计算机像人一样输出清晰而又门然的川音,也就是说,根抑:文本的内容可以不 同的情调来朗读任意的文本。TTS是一个十分复杂的系统,涉及到语言学、语音学、信号处 理、人匸智能等诸多的学科。尽管现有的TTS系统结构各异,转换方法不同,但是妹本上可 以分成两个和对独立的部分:文本分析,通过对输入文本进行词法分析、语法分析,其至 语义分析,从文木屮抽取音素和韵律等发音信息。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中国古代文化常识与历史人物故事题目
- 施工模板与脚手架拆除方案
- 2026年商场员工安全培训与考核管理制度
- 2026年河小青护河志愿行动及净滩行动组织要求专项试题
- 2026年健康促进与健康传播试题集
- 2026年森林防火无人机巡护应用知识试题
- 2026年世界贸易组织规则实务考试
- 2026年古树名木及珍稀树木原生境保护修复技术规范试题
- 皮下囊肿并发症防治策略
- 2026年如何利用网络资源准备中国电信的远程面试
- 江苏南通市2025届高考英语三模试卷含解析
- 国家职业技术技能标准 6-29-01-01 砌筑工 人社厅发20235号
- DL∕T 2598-2023 发电厂水汽中低浓度溶解氧在线测量导则
- 2023年08月上海申康医疗卫生建设工程公共服务中心招考聘用笔试历年难易错点考题荟萃附带答案详解
- 2023年牛津上海版中考英语复习如何应对中考口语考试真题解析课件
- 中华传统文化与当代青年
- 2023年上半年教师资格证考试《高中物理专业面试》真题及答案解析
- 第四章+攀钢转炉提钒工艺
- 重庆市(2022年-2023年)初中结业考试地理试题及答案
- 蒸汽管道安装方案
- GB/T 9332-2008船舶电气装置控制和仪器回路用150/250 V(300 V)电缆
评论
0/150
提交评论