版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一数字媒体概念:以二进制数形式存放、处理、传输、获取信息媒体,这些媒体包含数字化文字、图形、图像、声音、视频、化文字、图形、图像、声音、视频、动画及其编码和存放、传输、分发、显示物理媒体。.新媒体、多媒体、超媒体、全媒体、融媒体……2.数字媒体系统从数字媒体策划、制作、传输到用户消费全过程来看,数字媒体系统是由媒体机构、媒体产品、媒体技术、媒体内容、媒体网络和媒体终端6个方面组成一个数字媒体系统。【数字媒体机构:负责监管媒体产业政府部门以及从事数字媒体信息采集、加工、制作和传输社会组织。如政府、企业等。2.数字媒体产品:又称数字媒体服务,向用户提供文化、艺术、商业等各领域服务产品。如视频节目、网络游戏、手机报等。3.数字媒体技术:指数字媒体信息获取、处理、存放、生成、输出等技术,使抽象信息变成可感知、可管理和交互技术,主要包含存放技术、数字音频处理技术、数字图像处理技术、数字影视剪辑技术等。4.数字媒体内容:又称数字媒体艺术,是指以计算机技术和当代网络技术为基础,将人理性思维和艺术感性思和当代网络技术为基础,将人理性思维和艺术感性思维融为一体新艺术形式。5.数字媒体网络:服务于数字媒体产品传输。按照依靠网络不一样,主要包数字广播电视网、Internet、移动互联网等网络。6.数字媒体终端:数字媒体产品承载设备,是用户享受数字媒体产品,感受数字媒体内容有形载体。如笔记本电脑、智能电视机、手机等。】3.传统媒体和数字媒体关系传统媒体和数字媒体关键区分在于媒体传输渠道是否具备数字化、网络化、信息化特征,而不是媒体存在形式。//传统媒体和数字媒体之间不是代替关系,而是相互补充、竞争合作关系。//数字媒体时代到来会造成媒体市场发生本质改变,不转型、依然按照原有方式运作传统媒体必定越来越经营困难甚至被淘汰。4.数字媒体时代“渠道为王”“内容为后”“商务飞妃”////“渠道”就是数字化信息传输方式,“商务”实现依靠于数字媒体产品,而“内容”就是用户切实感受到数字媒体产品表现形式。5.传媒产业科技新热点大传媒时代传媒产业之“变”大传媒产业出现移动互联上大传媒平台网络与受众环境改变多屏融环境合、三网融合与产业融合传媒企业成长与资本运行6.三网融合8月25日,国务院办公厅印发《三网融合推广方案》8月20日,浙江省人民政府办公厅公布《关于加紧推进无线宽带网络建设实施意见》7.、传媒产业科技新热点NGB(下一代广播电视网)/以有线数字电视网和移动多媒体广播网络为基础,以高性能宽带信息网关键技术为支撑,将有线和无线相结合,实现全程全网广播电视网络。/NGB要求全程全网、互联互通、可管可控OTTTV专网OTTTV、公网OTTTVAppleTV、谷歌TV中国可管可控模式,颁发互联网电视7大牌照:CNTV(中央电视台为申请主体)、杭州华数(浙江、杭州电视台联合申请)、上海文广——百视通(上海电视台为申请主体)、南方传媒(广东电视台为申请主体)、湖南广电、中国国际广播电台以及中央人民广播电台。电视盒子小米盒子乐视盒子红雷盒子华为秘盒等TVOS智能电视操作系统/6月6日,在北京国际电视技术研讨会上,国家广电总局公布了智能电视操作系统TVOS1.0。TVOS1.0。/12月26日,国家新闻出版广电总局公布了TVOS2.0。华为主要负担是TVOS2.0开发工作,阿里主要负责TVOS2.0内置电视购物商城。/具备我国自主知识产权。8.OTTTV与IPTV区分网络:IPTV电视内容传输基于电信运行商搭建专用网络(IP城域网);OTTTV传输是以公共宽带互联网或运行商专网作为基础。终端:IPTV终端为运行商集成STB+普通家庭电视;OTTTV终端为OTT机顶盒+显示器(电视、电脑、Pad、手机等),机顶盒甚至能够置于电视机内。9.3D技术3D成像是靠人两眼视觉差产生。人两眼(瞳孔)之间通常会有8厘米左右距离。要让人看到3D影像,就必须让左眼和右眼看到不一样影像,使两副画面产生一定差距,也就是模拟实际人眼观看时情况。3D立体感觉就是如此由来人眼经过两眼看到图像差异感知立体效果,称作双眼立体视觉。正视差:物体看起来在屏幕后方负视差:物体看起来在屏幕后面真3D电影阿凡达、少年派、美人鱼伪3D电影(2D立体转制)泰坦尼克、钢铁侠、画皮2、太极3D动画电影三维动画软件:熊出没2D转制:狮子王、大闹天宫3D显示技术——红蓝技术红蓝3D:经过不一样颜色眼镜过滤不一样颜色而看到不一样影像3D显示技术——偏振式3D利用光线有“振动方向”原理来分解原始图像,经过在显示器幕上加放偏光板,能够向观看者输送两幅偏振方向不一样3.83D技术两幅画面,当画面经过偏振眼镜时,因为偏振式眼镜每只镜片只能接收一个偏振方向画面,这么人左右眼就能接收两组画面,再经过大脑合成立体影像。3D显示技术——快门式3D/经过提升画面快速刷新率(最少要达成120Hz)来实现3D效果,属于主动式3D技术。/当3D信号输入到显示设备(诸如显示器、投影机等)后,120Hz图像便以帧序列格式实现左右帧交替产生,经过红外发射器将这些帧信号传输出去;/负责接收3D眼镜刷新同时实现左右眼观看正确图像,而且保持与2D视像相同帧数,观众两只眼睛看到快速切换不一样画面,而且大脑中产生错觉,便观看到立体影像。3D显示技术——全息投影/全息投影3D是一个利用干涉和衍射原理统计并再现物体真实三维图像,是一个无需佩戴眼镜、观众就能够看到立体虚拟人物3D技术。/3D全息立体投影设备不是利用数码技术实现,而是投影设备将不一样角度摄像投影至MP全息投影膜上,让你看到不属于你本身角度其它图像,因而实现了真正3D全新立体影像。二1.传声器和扬声器把声音信号转换成电信号,或把电信号转换成声音信号换能器,称为电声器件。2.传声器:一个将声音信号转变为对应电信号换能器件,又称话筒或麦克风。传声器分类:按接收声波原理分:声压式和压差式。按能量转换方式分:动圈式、电容式、压电式等。按指向性分:无指向性,单指向性,双指向性。现在使用最广泛传声器是动圈式传声器和电容式传声器。无线传声器:无线传声器能把换能后声频电信号调制在一个载波上,经天线辐射到附近接收点。3.传声器指向性特征和特点无指向性:全指向性,传声器在全部方向上灵敏度相同。双指向性:8字形,传声器在相正确两个方向上有较高灵敏度,而在与之垂直方向上灵敏度为零。单指向性:心形,传声器只在一个主方向上有较高灵敏度,而在与之相反方向上灵敏度靠近于零。强指向性:超指向性,传声器在一个很窄范围内有很高灵敏度,而在其它方向上则灵敏度靠近于零。4./扬声器:将按声音改变电信号转换成声信号换能器件。/扬声器有电动式、压电式、舌簧式等。/电动式扬声器又可分为纸盆式扬声器、球顶式扬声器和号筒式扬声器。顶式扬声器和号筒式扬声器。扬声器箱(音箱)1.敞开式音箱2.封闭式音箱3.倒相式音箱3.倒相式音箱4.组合音箱5.立体声(Stereo)概念聆听者借助双耳听觉特征,经过对电声系统重放声场深度感声系统重放声场听觉感受,重新取得关于原声场空间信息听觉印象6.立体声概念单声道系统使用一个声道进行录音和重放声音。特点:声音都来自一个方向或是一个点,听起来贫乏无味。双声道立体声系统使用两个声道,而且两个声道再录音再放音过程中是相互独立、不相互干扰,但两个声道信号又有声学上关联。多声道围绕立体声系统在双声道立体声基础上增加了数量不等围绕声道,组成全景立体声。7.围绕立体声围绕声除了能使节目产生生动临场感和渲染力以外,还有一个最大特点是扩大了听音范围。中间声像准确定位,加大了有效听音范围。尤其在电视节目制作中,防止了因为声像偏移造成声画脱节现象。围绕声制作硬件要求:监听音箱摆放;控制台要求;多声道统计载体;房间声学条件8.声道立体围绕声*以最好听音点正面为轴线摆放中置音箱;*左右音箱到最好听音点连线与轴线分别形成30度连线与轴线分别形成30度夹角;*左右围绕音箱与轴线夹角分别为110度左右*低音效果音箱摆放要偏离轴线。9.拾音技术(1)强度差(声级差)X-Y式、M-S式(2)时间差*大间距:A-B式、DECCA树等*小间距:ORTF、DIN等*人头方法:人工头(仿真头)、真人头拾音等10.立体声拾音技术(1)强度差拾音方式X-Y式:两只指向特征完全相同传声器按一定角度紧靠排列M-S式:Middle–SideM传声器能够采取任何一个指向性,传声器轴向指向声源,拾取前方声源总声音信号,即声源左右方向和信号;即声源左右方向和信号;S传声器则必须采取8字形指向性,传声器轴向指向左边,与M传声器轴向垂直,主要拾取是两边混响成份百分比较高声音信号,即声源左右方向差信号。(2)时间差拾音方式是以时间差为主,也有强度差、相位差、音色差复合拾音方式。通常采取两只(或三只)传声器,间距十几厘米到几米,平行或设置一定夹角,于声源正前方。*A-B式:两个型号、指向特征完全相同传声器以一定间距并排摆放。*STRAUSS组合拾音制式:在每一个声道使用指向特征不一样两只传声器来取得不一样音色特征以提升声音品质,使音色愈加丰满。*人头拾音制式:在“人头立体声方法”中,除拾取“时间差”、“强度差”和“相位差”外,加强了“音色差”信息作用,使立体声信号愈加靠近人在自然听音状态下听到声音。///*录音人在耳道口佩戴两只微型传声器,就同人戴耳塞机一样;*录音时人头不可晃动,不然重放声像就会混乱;*录音时不能出噪声,尤其注意不能出现衣服磨擦声;*另外,录音时,录音人应该选择厅堂最好听音位置录音。*人工头(仿真头)拾音制式:为了逼真再现人耳听到声音,人们创造了人工头拾音制式,也称仿真头拾音制式。人工头拾音制式是用木料和塑料制成假人头形状,直径17-21cm,在耳道末端分别装有两只全方向指向特征传声器,两传声器输出分别馈送到立体声左右通道。11.音频数字化●采样人耳听觉频率上限在20kHz,为了确保声音不失真,采样频率应大于40kHz。实际使用CD标准采样频率为44.1kHz,这么人耳能够听到声音频率成份均可恢复。因为不一样质量声音其频率覆盖范围不一样,在实际应用中,可依照声音类型和质量要求,选择采样频率。惯用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz、48kHz、96kHz●量化【将采样值离散化,即量化成一个有限个幅度值集合x(nT)】量化级数M量化位数(比特数)nM=2^n依照对人类听觉响度感觉测定:8位量化位数可满足于电话通信要求;16位量化位数可从好家用立体声中重现理想效果,相当于CD音质。●编码【音频模拟信号经过采样与量化之后,为把数字化音频存入计算机,需对其编码,即用二进制数表示每个采样量化值】PCM编码:一个最方便简单编码方法是脉冲编码调制,常称为PCM(PulseCodeModulation)编码。它是一个未经压缩数字音频信号,常作为一个参考信号,方便其余编码方法与之比较,或在此基础上作深入压缩编码总结音频数字化步骤:采样:时间离散化量化:幅度离散化编码:数值二值化12.数字音频音质与数据量音质基本概念:音质是指声音质量,与频率范围成正比;频率范围越宽,音质越好影响音质原因:数据采样频率及量化位数。采样频率越低,量化位数越少,音质越差音频数据大小:数字化文件数据量(字节/秒)=采样频率(Hz)(量化位数(bit)/8)*声道数影响数据量原因:数据采样频率及量化位数。采样频率越高,量化位数越多,数据越大13.音频压缩编码技术与标准(67)*必要性:音频压缩和编码对音频加工、存放和传输有着主要意义;*可行性:对数字音频信息压缩主要是依据音频信息本身相关性以及人耳对音频信息听觉冗余度。*依照压缩后音频能否完全重构出原始声音能够将音频压缩技术分为无损压缩及有损压缩两大类。*音频数据压缩方法很多,不一样压缩技术,其算法复杂程度、音频质量、算法压缩效率以及编解码延时等都有很大不一样。14.数字音频压缩编码标准MPEG数字音频压缩技术MPEG(MovingPictureExpertsGroup,动态图像教授组)是ISO(国际标准化组织)与IEC(国际电工委员会)于1988年成立专门针对运动图像和语音压缩制订国际标准组织。MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG-1数字音频压缩技术在音频压缩标准化方面取得巨大成功是MPEG-1音频,也是国际上第一个高保真声音数据压缩国际标准。在MPEG-1中,对音频压缩按复杂程度要求了三种模式,即层Ⅰ、层Ⅱ(即MUSICAM掩蔽型自适应子带编码和复用,又称MP2),层Ⅲ(又称MP3)。MPEG-1层Ⅰ应用:VCD中使用音频压缩,经典码流为每通道192kbit/s;MPEG-1层Ⅱ应用:数字演播室、DAB、DVB等数字节目标制作、交换、存放、传送,经典码流为每通字节目标制作、交换、存放、传送,经典码流为每通道128kbit/s;MPEG-1层Ⅲ应用:MP3复杂度显得相对较高,编码不利于实时,但因为MP3在低码率条件下高水准声音质量,广泛应用于软解压及网络广播。经典码流为每通道64kbit/s。MPEG-1数字音频参数概述:采样频率:32kHz、44.1kHz、48kHzMPEG-14音频码率:32-192Kbps单声道、64-384Kbps立体声MPEG-2数字音频压缩技术在MPEG-1基础上增加了几个方面内容:增加了低采样率和低码率:保持MPEG-1声音单声道和立体声原有采样率情况下,MPEG-2又增加了3种采样率,方便提升码率低于64kbit/s时每个声道声音质量。支持5.1路围绕声:能提供5个全带宽声道(左、右、中和两个围绕声道),外加一个低频效果增强声道。支持多达8种语言或讲解。MPEG-2AACMPEG-1和MPEG-2音频参数比较MPEG-4数字音频压缩技术1.MPEG于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于年初正式成为国际标准。2.与MPEG-1和MPEG-2相比,MPEG-4特点是其更适于交互服务以及远程监控。3.共包含27个部分。MPEG-4AAC(先进音频编码)MPEG-4CLEP(代码激励线性预测)MPEG-4HVXC(谐波矢量激励编码)等4.MPEG-4AAC(先进音频编码)杜比试验室结论:①128KbpsAAC立体声音乐被教授认为不易觉察到与原来未压缩音源区分;②AAC格式在96kbps码率表现超出了128kbpsMP3格式;③AAC是唯一一个,能够在全部EBU试听测试项目取得“优异”网络广播格式(4)杜比AC-3音频压缩技术DOLBY企业研究开AC-3技术标准是现在为止在广播电视领域应用最为广泛数字音频压缩技术标准。它最多能够对6个比特率最高为448kbps单独声道进行编码,具备5.1围绕声功效,在数字电视、DVD、影院系统等多方面得到广泛应用。现在美国ATSC、欧洲DVB、澳大利亚等国家数字电视纷纷采取DOLBYAC-3作为数字电视伴音标准,使其应用更为广泛,得到业界共同认可。(5)DTS标准1.DTS是数字影院系统DTS(DigitalTheatreSystem)缩写,其系统设计目标是给电影院系统提供围绕立体声音频编码技术方案。2.现在在美国有超出百座DTS影院,其围绕声效果与AC-3相同。(6)DRA1.DRA是DigitalRiseAudio缩写,是广州广晟数码技术有限企业开发一项数字音频编码技术,现在是音频编码国家标准。1月被同意成为中国电子行业标准(标准号SJ/T11368-)。2.DRA音频标准可应用于数字电视、数字音频广播、数字电影院、激光视盘机、网络流媒体、IPTV及移动多媒体等领域。14.数字音频文件格式(P63)PCM●数字音频文件●定义:模拟音频信号经过模数转换(转换)直接形成二进制数字序列,该文件没有附加文件头和文件结束标志。●特点:音源信息完整,但冗余度过大;音源信息保留完整,音质好。●应用:因为能够达成最高保真水平就是,所以被广泛用于素材保留及音乐观赏。比如AudioCD(72min/650MB).MP3●压缩音频文件●定义:采取MPEG-1标准音频数据压缩编码中层标准音频数据压缩编码中层Ⅲ技术压缩之后数字音频文件●特点:压缩比高、数据量小、音质好,压缩百分比有10:1、17:1甚至70:1;数据率能够是64kbps,也能够是320kpds●应用:能够在个人计算机、MP3半导体播放机和上进行播放;适适用在互联网和各个领域,是现在最为流行音频格式文件。WAV●波形音频文件●定义:微软企业开发一个声音文件格式,也叫波形声音文件,是最早数字音频格式,被Windows平台及其应用程序广泛支持。●特点:声音层次丰富、还原性好、表现力强;假如采样率高,其音质极佳;但数据量大。●应用:电子幻灯片POWERPOINT软件、各种算法语言及多媒体平台软件可直接使用,适合多媒体系统、音乐光盘制作等CDA●CD-DA音频文件●定义:标准激光盘文件,44.1KHZ、16Bit量化、双声道。●特点:音质好,但数据量大;在Windows环境中,用CD播放器播放。●使用:一些计算机算法语言支持该格式,比如VisualBasic语言。WMA●流式音频文件●定义:Microsoft研制一个压缩离散文件或流式文件,它提供了一个MP3之外选择机会。●特点:相对于MP3具备较高压缩率和良好音质。当小于128KBPS时最为出众且编码后音频文件很小;当大于128KBPS时音质损失过大。●应用:支持WMA格式MP3随身听,Internet,以及VOIP网络电话RA●流式音频文件●定义:Realnetworks推出一个音乐压缩格式,其压缩比可达成96:1,所以在网上比较流行。●特点:经过压缩音乐文件能够在经过速率为14.4kbpsModem上网计算机中流畅回访。●应用:互联网,采取流媒体方式能够实现网上实时播放,即边下载边播放。MID●MIDI音频文件●定义:一个计算机数字音乐接口生成数字描述音频文件,文件中包含音符、定时和多达16个通道乐器定义。●特点:文件不记载声音本身波形数据,用数字形式统计声音特征,演奏MIDI乐器或重放时,将数字描述与声音对位处理;数据量小。●应用:主要用于计算机声音重放和处理。文件格式与说明63页15.16.语音增强技术语音增强:从带噪声信号中提取尽可能纯净原始语音。因为干扰通常是随机,从带噪声语音中提取完全纯净语音几乎是不可能。语音增强主要是两方面目标:一是改进语音质量,消除背景噪声,使听者乐于接收不觉疲劳;二是提升语音可懂度。*语音增强不但与语音信号数字处理关于,且包括人听觉感知和语音学。经典语言增强方法:通常滤波法/梳状滤波法/维纳滤波法/自适应滤波法语音增强应用:日常生活中噪声干扰军事通信中窃听技术中语音识别技术也需要语音增强17.语音识别技术:*语音识别是研究怎样采取数字信号处理技术自动提取以及决定语音信号中最基本、最有意义信息一门新兴边缘学科。*语音识别所包括学科领域:信号处理、物理学(声学)、模式匹配、通信及信息物理学(声学)、模式匹配、通信及信息理论、语言语音学、生理学、计算机科学(研究软硬件算法方便更有效地实现用于识别系统中各种方法)、心理学等。语音识别系统基本原理:语音识别是一个模式识别匹配过程,即从经预处理后语音波形中提取语音信号特征,特征提取是模式识别关键,然后与经过训练建立模式库进行比对(模式匹配)按摄影应准则得出最好识别输出。语音识别技术难点:1.对自然语言识别和了解。首先必须将连续讲话分解为词、音素等单位,其次要建立一个了解语义规则。2.语音信息量大。语音模式不但对不一样说话人不一样语音信息量大。语音模式不但对不一样说话人不一样,对同一说话人也是不一样。3.语音含糊性。说话者在讲话时,不一样词可能听起来是相同。这在英语和汉语中常见。4.环境噪声和干扰对语音识别有严重影响,致使识别率低。国外应用一直以苹果Siri、谷歌谷歌Now为代表。国内方面,科大讯飞、云知声、盛大、捷通华声、搜狗语音助手、紫冬口译、baidu深度语音等系统都采取了最新语音识别技术,市面上其余相关都采取了最新语音识别技术,市面上其余相关产品也直接或间接嵌入了类似技术。18.语音合成技术TTS作用:将文本状态文字信息转化为可听声音信息。语音合成最基本目标是让机器模仿人类语言发音来传送信息。用语音合成来传递语音有以下特点:1.不用尤其注意,任何人都能够了解;2.能够直接使用电话网和电话机;3.能够直接使用电话网和电话机;4.无须消费纸张等资源。应用领域:自动报时、报警、公共汽车报站、电话查询业务、语音咨询应答系统等。语音合成:是一个分析——存放——合成过程:分析——存放:选择适当语音单元(最小合成单元),用一定参数编码方式或波形方式进行存放,形成语音库。行存放,形成语音库。合成:从语音库中找出对应基本单元进行拼接,合成出语音。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地缘冲突或彰显中国能化供应链韧性
- 2026年三类人员继续教育考试(题库及答案)
- 2026年高考北京卷文综数学考试全国模拟试卷
- 2026年保密教育线上培训考试真题
- 2026年安徽省六安市中小学教师招聘考试试题题库及答案
- 高中数学人教版新课标A必修2第四章 圆与方程4.2 直线、圆的位置关系教学设计
- 第3节 神经调节与体液调节共同维持稳态教学设计高中生物沪科版2020选择性必修1 稳态与调节-沪科版2020
- 山东省郯城第三中学高一体育 排球比赛规则二教学设计 新人教版
- 2026年土地征用没给合同(1篇)
- 第4课 画方形和圆形教学设计-2025-2026学年小学信息技术(信息科技)第三册黔教版
- 新中式茶饮培训课件
- 艺术课程标准(2022年版)
- 妇幼健康服务工作评分细则
- JJG 968-2002烟气分析仪
- GB/T 2522-2017电工钢带(片)涂层绝缘电阻和附着性测试方法
- GB/T 193-2003普通螺纹直径与螺距系列
- GB/T 1149.3-2010内燃机活塞环第3部分:材料规范
- 七年级语文部编版下册第单元写作抓住细节课件
- 高校教师培训高等教育法规概论课件
- 基坑钢板桩支护计算书计算模板
- 【精品】东南大学逸夫建筑馆施工组织设计
评论
0/150
提交评论