多媒体技术教程课后习题答案讲解 下载本文

内容发布更新时间 : 2024/5/14 1:47:31星期一 下面是文章的全部内容请认真阅读。

(2) 对于人来说,可以通过色调、饱和度和明度来定义颜色;对于显示设备来说,人们使用红、绿和蓝磷光体的发光量来描述颜色;对于打印或者印刷设备来说,人们使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色。

第6章 颜色空间变换

6.1 PAL制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计算机图像

显示使用什么颜色模型? (1) PAL制彩色电视:YUV (2) NTSC制彩色电视:YIQ (3) 计算机图像显示设备:RGB

6.2 用YUV或YIQ模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩色电视图

像?

(1) YUV表示法的优点:① 它的亮度信号(Y)和色度信号(U,V)是相互独立的,因此可以对这些单色图分别进行编码;② 可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。

(2) 黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。

6.3 在RGB颜色空间中,当R=G=B,且为任意数值时,问计算机显示器显示的颜色是什么颜

色? 灰色

第8章 小波图像编码

8.1 什么叫做零树

“零树”是指小波变换系数之间的一种数据结构,因为离散小波变换是一种多分辨率的分解方法,每一级分解都会产生表示图像比较粗糙(低频图像)和比较精细(高频图像)的小波系数,在同一方向和相同空间位置上的所有小波系数之间的关系可用一棵树的形式表示,如果树根和他的子孙的小波系数的绝对值小于某个给定的阈值T,那么这棵树就叫零树。

第9章 彩色数字电视基础

9.1电视是什么?电视制是什么?世界上主要的彩色电视制有哪几种?

(1) 电视是捕获、广播和接收活动图像和声音的远程通信系统;(2) 电视制(television system)是传输图像和声音的方法;(3) 目前世界上使用的彩色电视制式主要有PAL,NTSC,SECAM三种,都是模拟彩色电视制式。

9.2 隔行扫描是什么意思?非隔行扫描是什么意思?

(1) 在隔行扫描中,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,然后在第5、7、……,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。隔行扫

6

描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。

(2) 在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。

9.3 电视机和计算机的显示器各使用什么扫描方式?

电视机通常使用隔行扫描;计算机的显示器通常使用非隔行扫描。

9.6 对彩色图像进行子采样的理论根据是什么?

人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不易察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。

9.7 图像子采样是在哪个彩色空间进行的?

在YCbCr颜色空间

9.8 一幅YUV彩色图像的分辨率为720×576像素。分别计算采用4:2:2、4:1:1和4:2:0子采

样格式采样时的样本数。

(1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。

720×576×3 = 1 244 160

(2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。

720×576×2 = 829 440

(3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。

720×576×1.5 = 622 080

(4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。

720×576×1.5 = 622080

9.11 高清晰度电视(HDTV)是什么?

高清晰度电视(high definition television,HDTV)是具有正常视力的观众可得到与观看原始景物时的感受几乎相同的数字电视。通常认为,在观众与显示屏之间的距离等于3倍显示屏高度的情况下就可获得这种感受。

MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21分别是什么标准,各自要达到的目标是什么?

MPEG-1是数字电视标准,MPEG-1处理的标准图像交换格式的电视,即NTSC制为352

PAL制为352像素×288行/帧×25帧/秒,像素×240行/帧×30帧/秒,压缩的输出速率定义

在1.5Mbit/s以下。这个标准主要是针对当时具有这种数据传输速率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。

7

MPEG-2是数字电视标准。MPEG-2标准是一个直接与数字电视广播有关的高质量图像和声音编码标准,是MPEG-1的扩充。MPEG-2提供位速率的可变性能功能,其基本目标是:位速率为 4~9 Mbit/s,高达 15 Mbit/s。

MPEG-4是视听对象编码标准。MPEG-4是为视听数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。

MPEG-7是多媒体内容描述接口标准。MPEG-7的名称叫做多媒体内容描述接口,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下,数据类型还可包括面部特性和个人特性的表达。

MPEG-21是多媒体框架标准。MPEG- 21 企图描述多媒体的元数据

(metadata)1,用于全球多媒体对象的集成、创建、使用、操作、管理和传送等操作,便于不同人群在异构网络环境下使用各种多媒体资源,它的目标是为未来多媒体的应用提供一个完整的平台。MPEG-21 要解决的核心问题是资源共享、知识产权和版权的管理与保护。

第11章 MPEG声音

11.1 列出你所知道的听觉系统的特性。

响度感知, 音高感知, 掩蔽效应

11.2 什么叫做听阈?什么叫做痛阈?

(1) 当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”

(2) 当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“痛 阈”。实验表明,如果频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。

11.3 什么叫做频域掩蔽?什么叫做时域掩蔽?

(1)强纯音掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽。 (2) 在时间方向上相邻声音之间的掩蔽,这种特性称为时域掩蔽。

11.4 MPEG-1 的层 1、2 和 3 编码分别使用了听觉系统的什么特性? 层 1:频域掩蔽特性;

层 2:频域掩蔽特性 + 时间掩蔽特性;

层 3:频域掩蔽特性 + 时间掩蔽特性 + 临界频带特性(声音频率与掩蔽曲线不是线性 关系);

11.6 MPEG-1的声音质量是:?AM ?FM ?电话 ?near-CD ?CD-DA

□ AM □ FM □ 电话 √□ near-CD □ CD-DA

8

第11章 MPEG视像

12.1电视图像数据中有哪些冗余数据可去掉,目前分别采用什么方法减少冗余数据? 电视图像数据中的冗余数据可归纳成两类:人的视觉特性感觉不到的冗余数据和电视图像数据自身的冗余数据,针对不同类型的冗余采用不同方法减少冗余,详见下表。

视像压缩利用的各种冗余信息 种类 空间冗余 时间冗余 知识冗余 视觉冗余 其他 内容 像素间的相关性 时间方向上的相关性 目前用的主要方法 变换编码,预测编码 帧间预测,移动补偿 轮廓编码,区域分割 非线性量化,位分配 图像构造冗余 图像本身的构造 人的视觉特性 不确定性因素 收发两端对人物的共有认识 对象编码,知识编码

12.2 在MPEG视像数据压缩技术中,目前利用了视觉系统的哪两种特性?

人的视觉系统具有的两种特性可以用来压缩电视图像数据。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不易察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。

12.3 MPEG-1编码器输出的电视图像的数据率大约是多少?

1.15 Mbps

12.4 MPEG专家组在制定MPEG-1/-2 Video标准时定义了哪几种图像?哪种图像的压缩率最

高?哪种图像的压缩率最低?

(1) MPEG专家组定义了三种图像:帧内图像I(intra),预测图像P(predicted )和双向预测图像B (bi-directionally interpolated )。

(2) 双向预测图的压缩率最高,帧内图像的压缩率最低。

12.5 有人认为“图像压缩比越高越好”。你对这种说法有何看法?

在图像压缩算法中,为了获得比较高的压缩率,通常要采用有损压缩。如果笼统说“图像压缩比越高越好”是不严格的。因为压缩比越高,意味图像的质量损失越大,重构图像的质量将会越低。如果说“在图像质量相同的前提下,图像压缩比越高越好”是认可的。

12.6 有人说“MPEG-1编码器的压缩比大约是200:1”。这种说法对不对?为什么?

不对。“200:1”是使用子采样、降低图像分辨率和MPEG-1视像压缩技术获得的,而(1)电视图像的子采样(4:1:1)不是MPEG编码器的功能,它的压缩比为2:1;(2)电视图像画面尺寸(如PAL制720×576)的降采样(变成360×288)也不属于MPEG编码器的功能,它的压缩比为4:1。

12.7 视像的空间分辨率和时间分辨率是什么意思?

空间分辨率:图像的尺寸。例如,PAL制图像尺寸:720×576,360×288。

时间分辨率:图像的帧数每秒。例如,PAL制电视图像的时间分辨率为30帧/秒,NTSC电视图像的时间分辨率为25帧/秒,电影图像的时间分辨率为24帧/秒。

9

12.8 在MPEG-1和MPEG-2中,典型的宏块由多少个像素组成;子采样为4:2:0的宏块分成

多少个亮度图块、红色差图块和蓝色差图块,每个图块由多少个像素组成。 在MPEG-1, MPEG-2中,典型的宏块为16×16像素。

在子采样为4:2:0的宏块分成4个亮度图块、1个红色差图块和1个蓝色差图块,每个图块由8×8个像素组成。

12.9 什么叫做移动估算?

移动估算(motion estimation)是计算移动矢量的过程,也就是在参考图像中查找与当前编码图块匹配最佳的图块的过程。

12.10 什么叫做移动补偿?

计算当前编码图块与参考帧中的图块的像素值之差的过程。 在编码时,使用移动矢量表示当前帧的图块相对于过去或将来帧的图块的偏移量,使用当前帧的与过去或将来帧的像素值的差值表示图像的变化程度,这个差值在重构当前帧的图块时作为“补偿量”;在解码时,利用移动矢量确定当前帧的图块相对于过去或将来帧的图块位置,使用过去或将来帧的像素值和编码时得到的补偿量重构当前帧的图块。

10