搜索
您的当前位置:首页正文

多媒体通信技术练习题参考答案

来源:好走旅游网
第1章 多媒体通信技术概述

1. 什么是媒体?根据原CCITT的立义,媒体可划分为那几大类?它们是如何描述的? 媒体是

指信息传递和存储的最基本的技术和手段,即信息的载体。媒体的英文是Medium, 复数是media。根据原CCITT (国际电报电话咨询委员会)的泄义,媒体可划分为五大类:

(1) 感觉媒体(Perception Medium)

感觉媒体是指人类通过其感觉器官,如听觉、视觉、嗅觉、味觉和触觉器官等直接产生 感觉(感知信息内容)的一类媒体,这类媒体包括声音、文字、图像、气味和冷、热等。

(2) 表示媒体(Representation Medium)

表示媒体是指用于数据交换的编码表示,这类媒体包括图像编码、文本编码、声音编码 等。其目的是有效地加工、处理、存储和传输感觉媒体。

(3) 显示媒体(Presentation Medium)

显示媒体是指进行信息输入和输出的媒体。输入媒体包括键盘、鼠标、摄像头、话筒、 扫描仪、触摸屏等,输岀媒体包括显示屏、打印机和扬声器等。

(4) 存储媒体(Storage Medium)

存储媒体是指进行信息存储的媒体。这类媒体包括硬盘、光盘、软盘、磁带、ROM、 RAM 等。

(5) 传输媒体(Transmission Medium)

传输媒体是指承载信息、将信息进行传输的媒体。这类媒体包括双绞线、同轴电缆、光 缆和无线电链路等。

2. 如何理解多媒体技术?

多媒体技术就是汁算机交互式综合处理多媒体信息——文本、图形、图像和声音,使多 种信息建立逻辑连接,集成为一个系统并具有交互性。简而言之,多媒体技术就是计算机综 合处理声、文、图等信息的技术,具有集成性、实时性和交互性的特点。多媒体技术最简单 的表现形式就是多媒体计算机。

3. 简述多媒体通信的体系结构。

图1-1为国际电联ITU-TI.211建议为B-ISDN提出的一种适用于多媒体通信的体系结构 模式。

多媒体通信体系结构模式主要包括下列五个方面的内容:

传输网络:它是体系结构的最底层,包括LAN(局域网)、WAN(广域网)、MAN(城域网)、

ISDN、B-ISDN(ATM). FDDI(光纤分布数据接口)等髙速数据网络。该层为多媒体通信的实 现提供

了最基本的物理环境。在选用多媒体通信网络时应视具体应用环境或系统开发目标而 泄,可选

择该层中的某一种网络,也可组合使用不同的网络。

网络服务平台:该层主要提供各类网络服务,使用户能直接使用这些服务内容,而无需 知道底层传输网络是怎样提供这些服务的,即网络服务平台的创建使传输网络对用户来说是 透明的。

多媒体通信平台:该层主要以不同媒体(正文、图形、图像、语音等)的信息结构为基 础,提供其通信支援(如多媒体文本信息处理),并支持各类多媒体应用。

一般应用:该应用层指人们常见的一些多媒体应用,如多媒体文本检索、宽带单向传输、 联合编辑以及各种形式的远程协同工作等。

特殊应用:该应用层所支持的应用是指业务性较强的某些多媒体应用,如电子邮购、远 程培训、远程维护、远程医疗等。

4. 多媒体通信的特征有哪些?

多媒体通信系统必须同时兼有多媒体的集成性、计算机的交互性、通信的同步性3个主 要特征。

5. 论述多媒体通信涉及的齐种关键技术。

多媒体数据压缩技术、多媒体通信终端技术、多媒体通信网络技术、多媒体信息存储技 术、多媒体数据库及其检索技术、多媒体数据的分布式处理技术。

6. 试举岀一两种多媒体通信系统的具体应用,并从中分析多媒体通信对人类社会的影响。 略

第2章数字音频处理技术

1. 请分析音频信号的数字化方法及影响因素。

音频信号的数字化过程就是将模拟音频信号转换成有限个数字表示的禽散序列,即数字 音频序列,在这一处理过程中涉及到模拟音频信号的采样、量化和编码。对同一音频信号采 用不同的采样、量化和编码方式就可形成多种形式的数字化音频。

2. 简要说明参数编码和混合编码基本原理,并进行比较。

参数编码又称声源编码,它是通过构造一个人发声的模型,以发声机制的模型作为基础, 用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型,在发送端从模拟语 音信号中提取各个特征参疑并对这些参量进行呈:化编码,以实现语音信息的数字化。

混和编码将波形编码和参数编码结合起来,力图保持波形编码话音的髙质量与参数编码 的低速率,混合编码信号中既包含若干语音特征参量又包含部分波形编码信息。

参数编码的特点是语音编码速率较低,基本上在2~9.6kbit/s之间。可见苴压缩的比特率 较低。但是也有其缺点:首先是合成语音质量较差,英次是电路实现的复杂度比较髙。

混合编码方法就是克服了波形编码和参数编码的弱点,并且很好地结合了上述两种方法 的优点。

3. 常用的音频压缩编码有哪几种?简要说明各自的特点。

非均匀PCM (”/A律压扩方法)采用非均匀量化编码能够减少表示采样的位数,从而 达到数据压缩的目的。

增量调制与自适应增量调制,增呈:调制也称△调制(delta modulation, DM),是一种比较 简单且有数据圧缩功能的波形编码方法。自适应增量调制是能使DM的量化阶距△适应信 号变化的要求。

自适应差分脉冲编码调制,将自适应量化技术和自适应预测技术结合在一起用于差分脉 冲

编码调制中,从而实现了自适应差分脉冲编码调制。

子带编码,其基本思想是将输入信号分解为若「•子频带,然后对%子带分量根据其不同 的统计特性采取不同的压缩策略,以降低码率。

变换编码是有失貞•编码的一种重要的编码类型。在变换编码中,原始数据从初始空间或 者时间域进行数学变换,使得信号中最重要的部分(例如包含最大能量的最重要的系数)在变 换域中易于识别,并目集中出现,可以重点处理;相反使能量较少的部分较分散,可以进行 粗处理。

矢量量化编码,苴基本原理是用码书中与输入矢量最匹配的码字的索引(下标)代替输 入矢量进行传输和存储,而解码时只需简单地查表操作。矢量量化的三大关键技术是码书设 计、码字搜索和码字(下标)索引分配。

感知编码.感知编码基于人耳的听觉特性,通过消除不被感知的冗余信息来实现对音频 数据压缩的编码方法。

线性预测编码方法为参数编码方式。参数编码的基础是人类语音的生成模型,通过这个 模型,提取语音的特征参数,然后对特征参数进行编码传输。

4. 说明感知编码的基本原理。

感知编码基于人耳的听觉特性,通过消除不被感知的冗余信息来实现对音频数据压缩的 编码方法。它基于心理声学模型,利用人的听觉阈值特性和掩蔽效应,通过给不同频率处的 信号分疑分配以不同量化比特的方法来控制量化噪声,使得噪声能量低于掩蔽阈值,即把压 缩带来的失真控制在听阈以下,使人耳觉察不到失頁•的存在,从而实现更髙效率的音频压缩。 目前,在髙质量音频编码标准中,心理声学模型是一个最为有效的算法模型。在此类编码中, 以MPEG音频编码(MPEG layerl. 2, 3和AAC标准)和Dolby Digital的应用最为广泛

5. 评估一种语音编码器的性能有哪些方法?

编码速率、合成语音质量、编解码延时以及算法复杂度这4个因素是评价一个语音编码 算法性能的基本指标,这4个因素之间有着密切的联系,在具体评价某种语音编码算法的优 劣时,需要根据具体的实际情况,综合考虑4个因素进行性能评价。

6. 分析音频检索技术的应用及特点。

音频检索是通过这些自然的听觉特征来检索声音信息。需要研究一种新的技术——基于 内容的音频检索技术。

相对于日益成熟的图像与视频检索,音频检索相对滞后。在20世纪90年代末,基于内 容的音频检索才成为多媒体检索技术的研究热点。

与传统的信息检索相比,基于内容的音频信息检索有如下特点:

•对音频信息进行深层次地分析、挖掘。不拘泥于信息的外部表层特征,对信息的内 容(如对音色、音调、旋律、节奏等)进行分析,以达到更深的检索层次。

•是一种相似性匹配。以相似性作为标准,而不是以绝对的精确匹配作为标准,是一 个逐步求精的迭代过程,直到用户获得满意的査询结果为止。

•检索方式直观形象。突破了传统的基于表达式检索的局限,可为用户提供易于理解 的可视化检索方式,如:示例査询、更人性化的检索界而。

•是一种交互式检索。通常是按照与用户输入的查询信息相似程度来排列査询结果, 往往还需

要用户参与,在所给岀的査询结果中作出进一步选择,以便获得最终结果。

•数据库的结构复杂、容量大。不仅包括文字等结构化信息,而目还包括数据巨大、 种类繁多的非结构化的音频信息等。

第3章数字图像压缩技术

1. 论述数据压缩的必要性和可行性。

必要性:数字化后的图像和视频信息数据疑非常大,与当前硬件技术所能提供的计算机 存储资源和网络带宽之间有很大差距。这样,就对图像信息的存储和传输造成了很大困难, 成为阻碍人们有效获取和利用信息的一个瓶颈问题。不对图像数据进行有效的压缩,就难以 保证通信的顺利进行。

可行性:冗余是图像压缩的着眼点。冗余主要包括数据间冗余、信息燔冗余以及视觉冗 余。

2. 图像信息数字化过程主要包括哪些步骤?它与音频信息数字化有何区别?

图像信号数字化主要包括两方面的内容:取样和量化。与音频的主要区别在于图像是二 维信号,取样和虽化要在二维信息上进行。

3. 图像压缩方法按所采用的技术可分为为哪几类?简述务种图像压缩方法的基本原理。 按采用

技术主要的压缩方法包括信息嫡编码、预测编码、变换编码、子带编码、统讣编 码、基于模型的压缩编码、神经网络编码、分形编码和小波编码等。

4. 设一幅图像有6个灰度级W={W,, W2, W. W4, W5, W6},对应各灰度级岀现的槪 率P={0・3, 0.25,

0.2, O.hO.L 0.05},试对此图像进行哈夫曼编码并il•算其编码效率。

wi

0

0.30

W2

0.25

W3

0.20

W4

0.10

W5

0.10

W6

0.05

Wi 00, W2OI, W3II, W4 10h

6

W5, 1000, W6 1001

》Pj log2P = i=l 2・365j

6

》0iR = 2.4

i = l

编码效率=98.5%

5. 比较预测编码和变换编码的抗误码性能并说明英原因。

变换编码的抗误码能髙于预测编码。

预测编码是对真实值与预测值之间的差值信号进行编码处理和传输,达到压缩的目的。 在预测编码中,接收端是以所接收的前川个样本为基准来预测当前样本,因而如果信号传 输过程中一旦岀现误码,就会影响后续像素的正确预测,从而出现误码扩散现象。

变换编码不直接对原图像信号压缩编码,而首先将图像信号映射到另一个域中,产生一 组变

换系数,然后对这些系数进行虽:化、编码、传输。在空间上具有强相关性的信号,反映 在频域上是能量常常被集中在某些特定的区域内,或是变换系数的分布具有规律性,因此变 换编码抗误码性能较强。

6. 分析并比较算数编码与哈夫曼编码。

算术编码和哈夫曼编码都是爛编码,都可以实现无失真编码。

哈夫曼编码的编码效率与信源符号概率分布相关,编码不唯一,抗误码性差,只能用近 似的整数位来表示单个符号。

在信源概率分布比较均匀情况下,哈夫曼编码的效率较低,而此时算术编码的编码效率 要高于哈夫曼编码,同时又无需像变换编码那样,要求对数据进行分块,因此在JPEG扩展 系统中以算术编码代替哈夫曼编码。

7. 介绍运动补偿的概念,并说明在预测编码中使用此概念的原因。

运动补偿:利用运动矢量建立处于前后帧的同一物体的空间位程对应关系,即用运动矢 量进行运动补偿预测。

在帧间预测编码中,为了达到较髙的压缩比,最关键的就是要得到尽可能小的帧间误差。 在普通的帧间预测中,实际上仅在背景区进行预测时可以获得较小的帧间差。如果要对运动 区域进行预测,首先要估计出运动物体的运动矢MV,然后再根据运动矢量进行补偿,即找 出物体在前一帧的区域位置,这样求岀的预测误差才比较小。总而言之,就是利用运动补偿 减小帧间预测误差,提髙编码效率。

8. 解释小波变换编码的基本思想。

小波变换图像编码的主要工作是选取一个固立的小波基,对图像作小波分解,在小波域 内研究合理的量化方案、扫描方式和炳编码方式。关键的问题是怎样结合小波变换域的特性, 提出有效的处理方案。

小波变换对图像进行压缩的原理与子带编码方法是十分相似的,是将原图像信号分解成 不同的频率区域(在对原图像进行多次分解时,总的数据量与原数据量一样,不增不减),然 后根据HVS(A眼的视觉特性)及原图像的统计特性,对不同的频率区域采取不同的压缩编码 手段,从而使图像数据量减少,任保证一泄的图像质量的前提下,提高压缩比。

9. 试述H.263与H.261的区别。

H.26X是ITU-T(国际电信联盟)及英前身CCITT(国际电报电话咨询委员会)研究和制定 的

一系列视频编码的国际标准。H.261是ITU-T制泄的视频压缩编码标准,也是世界上第一 个得到广泛承认的、针对动态图像的视频压缩标准,而且其后出现的MPEG系列标准、H.262 以及H.263等数字视频压缩标准的核心都是H.261。

H.263在H.261基础上做了很多改进。H.263能够支持更多图像格式,H.263建议的两 种运

动估值,H.263采用半精度像素的预测值和髙效的编码,H.263提高数拯压缩效率。

10. 査阅相关资料,阐述图像压缩方法的最新进展。

第4章多媒体信息输入输出及存储技术

1.简述声卡的工作原理。

音频信息的输入输岀主要是由声卡来完成的。声卡或音频卡(audiocard)是负责录音、

因篇幅问题不能全部显示,请点此查看更多更全内容

Top