大学计算机基础教程第6章计算机前沿_第1页
大学计算机基础教程第6章计算机前沿_第2页
大学计算机基础教程第6章计算机前沿_第3页
大学计算机基础教程第6章计算机前沿_第4页
大学计算机基础教程第6章计算机前沿_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机前沿第六章学习目标1.了解人工智能的内涵与商业价值。2.掌握大数据、云计算、深度学习和物联网技术。3.了解流媒体的基本概念、技术原理和应用。6.1.1人工智能的内涵与商业价值

1.什么是人工智能人工智能(Artificial

Intelligence),英文缩写为AI。它是计算机科学的一个分支,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,目前应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

2.人类智能和人工智能学习区别从学习的主体来讲可分为动物学习、人类学习和机器学习。人类学习中学习者主动地获取知识并通过把新获得的知识和已有的认知结构联系起来,积极地建构其知识体系,学习包括获得、转化和评价等过程。人类学习是有目的的,期望获得。即人类学习是一种有目的的、自觉的、积极主动的过程。人有主观能动性,可以积极主动地构建自己的知识结构。这是人类学习与动物学习区别的主要标志。人类学习是由学习、实践、再学习、再实践四个基本训练的过程组成的,这四个过程可分为动机阶段、了解阶段、获得阶段、保持阶段、回忆阶段、概括阶段、操作阶段、反馈阶段等八个阶段。机器学习是模拟人的思维模式,分为数据收集、数据预处理、模型构建、模型调优、模型验证和模型使用六个过程,这六个过程实际上可分为训练、测试和应用等三个阶段。机器学习主要分为监督学习、强化学习和无监督学习三大类。由此可见,人类学习与机器学习的目标都是一样的,都是为了正确的预测。有了正确的预测,就能做出正确的行动,就能得到想要的结果。不同的是,一个使用人脑神经网络实现,另一个使用计算机算法实现。即机器学习的本质就是建立相应的模型,并获取到适当的参数,使之能对未来的样本做出正确的预测。

3.人工智能的商业价值(1)人工智能对医疗保健行业的影响(2)人工智能对交通行业的影响(3)人工智能对金融服务行业的影响(4)人工智能对零售行业的影响(5)人工智能对科技、通信和媒体行业的影响(6)人工智能对制造业的影响(7)人工智能对能源行业的影响(8)人工智能对运输和物流行业的影响6.1.2人工智能AI工具案例

1.人脸识别人脸识别也称人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别涉及的技术主要包括计算机视觉、图像处理等。人脸识别系统的研究始于20世纪60年代,之后,随着计算机技术和光学成像技术的发展,人脸识别技术水平在20世纪80年代得到不断提高。在20世纪90年代后期,人脸识别技术进入初级应用阶段。目前,人脸识别技术已广泛应用于多个领域,如金融、司法、公安、边检、航天、电力、教育、医疗等。比如,“刷脸”进出、“刷脸”支付、“刷脸”打卡等,如图所示。人脸识别打卡语音识别转文字

2.语音识别通过声音的数字化,计算机能“感知到”声音,语音识别实施下的人机交互是把人说的话转化为文字或机器可以理解的指令,从而实现人与机器的语音交流,如图所示。

3.智能音箱智能音箱是语音识别、自然语言处理等人工智能技术的电子产品类应用与载体,随着智能音箱的迅猛发展,其也被视为智能家居的未来入口。究其本质,智能音箱就是能完成对话环节的拥有语音交互能力的机器。通过与它直接对话,消费者能够完成自助点歌、控制家居设备和唤起生活服务等操作。

4.无人驾驶汽车无人驾驶汽车是智能汽车的一种,也称为轮式移动机器人,主要依靠车内以计算机系统为主的智能驾驶控制器来实现无人驾驶。无人驾驶中涉及的技术包含多个方面,例如计算机视觉、自动控制技术等。百度翻译

5.机器翻译机器翻译是计算语言学的一个分支,是利用计算机将一种自然语言转换为另一种自然语言的过程。机器翻译用到的技术主要是神经机器翻译技术(NeuralMachineTranslation,NMT),该技术当前在很多语言上的表现已经超过人类。随着经济全球化进程的加快及互联网的迅速发展,机器翻译技术在促进政治、经济、文化交流等方面的价值凸显,也给人们的生活带来了许多便利。例如,我们在阅读英文文献时,可以方便地通过有道翻译、百度翻译和Google翻译等网站将英文转换为中文,免去了查字典的麻烦,提高了学习和工作的效率,如图所示。银行智能客服机器人

6.智能客服机器人智能客服机器人是一种利用机器模拟人类行为的人工智能实体形态,它能够实现语音识别和自然语义理解,具有业务推理、话术应答等能力,如图所示。智能客服机器人广泛应用于商业服务与营销场景,为客户解决问题、提供决策依据。同时,智能客服机器人在应答过程中,可以结合丰富的对话语料进行自适应训练,因此,其在应答话术上将变得越来越精确。

7.生成型预训练变换模型ChatGPT

ChatGPT是美国人工智能研究实验室OpenAI推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求说“不”。一旦发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,都会拒绝提供有效答案。6.2.1大数据

1.大数据的概念大数据(BigData)是指通过算法对来自不同渠道和不同格式的海量数据进行直接分析,从中找到数据之间的相关性。也就是说,大数据更偏重于发现,以及猜测并印证的循环逼近过程。

(1)大数据的来源①结构化数据,如各种数据库、各种结构化文件、消息队列和应用系统数据等。②非结构化数据,可以细分为两部分,一部分是社交媒体如Twitter、Facebook、博客等产生的数据,包括用户点击的习惯/特点、发表的评论、评论的特点、网民之间的关系等,这些都构成了大数据的来源。另外一部分数据,也是数据量比较大的,是机器设备及传感器所产生的数据。

(2)大数据的作用和意义现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在于“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大数据是赢得竞争的关键。

2.大数据技术体系大数据技术可以分为两个大的层面,即大数据平台技术(其架构如图所示)与大数据应用技术。要使用大数据,必须先有计算能力,大数据平台技术包括数据的采集、存储、流转、加工所需要的底层技术,如Hadoop生态圈。大数据应用技术是指对数据进行加工,把数据转化成商业价值的技术,如算法以及算法衍生出来的模型、引擎、接口和产品等。大数据平台技术架构

3.大数据技术

(1)大数据分析和挖掘技术大数据分析的理论核心是数据挖掘算法,各种数据挖掘算法基于不同的数据类型和格式才能更加科学地呈现出数据本身具备的特点,也正是因为目前流行的统计方法才能深入数据的内部,挖掘出公认的价值。数据挖掘的一般流程主要分为如下几个步骤。①定义问题:清晰地定义出业务问题,确定数据挖掘的目的。②数据准备:选择数据———在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理———进行数据再加工,包括检查数据的完整性与一致性、去噪声、填补丢失的域、删除无效数据等。③数据挖掘:根据数据功能的类型和数据的特点选择相应的算法,在完成预处理过程的数据集上进行数据挖掘。④结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。数据挖掘的方法有很多,同时也应用到很多场景当中,如商品推荐、电影个性化推荐、消费推荐等,如图所示为大数据技术在消费者方面的相关应用。大数据技术在消费者方面的相关应用在不同的应用场景下,不同的算法均会取得不同层次的使用效果。为了让读者大致了解大数据技术相关的算法,先对几种比较主流的算法进行简单介绍。常见的数据分析方法和应用场景如图所示。常见的数据分析方法和应用场景①神经网络方法人工神经网络(ArtificialNeuralNetwork,ANN)系统是20世纪40年代期后出现的。它是由众多的神经元可调的连接权值连接而成的,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。BP(BackPropagation)算法又称为误差反向传播算法,是人工神经网络中的一种监督式的学习算法。BP算法在理论上可以逼近任意函数,基本结构由非线性变化单元组成,具有很强的非线性映射能力。而且网络的中间层数、各层的处理单元数及网络的学习系数等参数可根据具体情况设定,灵活性很大,在优化、信号处理与模式识别、智能控制、故障诊断等许多领域都有着广泛的应用前景。②遗传算法遗传算法是一种基于“适者生存”的高度并行、随机和自适应的优化算法,通过复制、交叉、变异将问题解编码表示的“染色体”群一代代不断进化,最终收敛到最适应的群体,从而求得问题的最优解或满意解,它是一种仿生全局优化方法,其优点是原理和操作简单、通用性强、不受限制条件的约束,且具有隐含并行性和全局解搜索能力,在组合优化、数据挖掘问题中得到广泛应用。5.2.2TCP/IP参考模型

Internet上所使用的网络协议是TCP/IP(TransmissionControlProtocol/InternetProtocol,传输控制协议/网际协议)。目前,众多的网络产品厂家都支持TCP/IP,TCP/IP已成为一个事实上的工业标准。

TCP/IP通常指的是整个TCP/IP协议族,它包含了从网络层到应用层的许多协议,如支持超文本传输的HTTP、支持文件下载的FTP等,其中最重要的两个协议是TCP和IP。对应于TCP/IP的网络体系结构就是TCP/IP参考模型。如图给出了OSI参考模型与TCP/IP参考模型的层次对应关系。按照层次结构的思想,TCP/IP按照从上到下的单向依赖关系构成协议栈。如图给出了TCP/IP参考模型与TCP/IP协议栈的关系。TCP/IP参考模型与TCP/IP协议栈的关系

TCP/IP参考模型分为以下4个层次。

1.网络层网络层是TCP/IP参考模型的最低一层,包括多种逻辑链路控制和媒体访问协议,主要负责通过网络发送和接收IP数据报。允许主机连入网络时使用多种现成的与流行的协议,这些系统大到广域网、小到局域网或点对点连接等。这也正体现了TCP/IP与网络的物理特性无关的灵活性特点。

2.互联层互联层也被称为IP层、网际层,是TCP/IP参考模型的关键部分。该层负责相同或不同网络中计算机之间的通信,主要处理数据报和路由。该层包括的协议有IP、ARP(AddressResolutionProtocol,地址转换协议)以及RARP(ReverseAddressResolutionProtocol,反向地址转换协议)。互联层最重要的协议是IP,它将多个网络连成一个互联网,可以把高层的数据以多个数据报的形式通过互联网分发出去。它把传输层送来的消息组装成IP数据报,并把IP数据报传递给网络层。IP制定了统一的IP数据报格式,以消除各通信子网的差异,从而为信息发送方和接收方提供透明的传输通道。

3.传输层传输层负责在互联网中源主机与目的主机的应用进程间建立用于会话的端到端连接。该层提供了TCP和UDP(UserDatagramProtocol,用户数据报协议)两个协议,都建立在IP的基础上。其中,TCP提供可靠的面向连接服务,它处理了IP中没有处理的通信问题,向应用程序提供可靠的通信连接。这种可靠性主要使用确认和重传两种策略来达到。确认是指当接收方收到一个IP数据报后,向发送方发出一个确认信息以表明自己已经收到该IP数据报。若发送方等待多时仍未收到确认信息,则该IP数据报可能已经丢失,此时发送方再发一次该IP数据报,如此直到成功。通过这一方式实现了在不可靠的线路上达到可靠的传输。

4.应用层

TCP/IP的应用层相当于OSI模型的会话层、表示层和应用层。TCP/IP向用户提供一组常用的应用层协议,为用户解决所需要的各种网络服务,如远程登录协议(TelnetProtocol)、文件传输协议(FTP)、邮件传输协议(SMTP)、域名系统(DNS)、简单网络管理协议(SNMP)、超文本传输协议(HTTP),并且总是不断有新的协议加入。5.2.3IP地址与域名机制

1.IP地址打电话需要电话号码才能拨通对方电话,同样,在Internet上为了实现不同计算机之间的数据交换,也需要为每台计算机分配一个通信地址,这个地址就是IP地址。每个IP地址在全球是唯一的,这一地址可用于与该计算机有关的全部通信。

(1)IP地址组成

IP地址由网络地址和主机地址两部分组成。网络地址标明该主机在哪个网络,主机地址则指明具体是哪一台主机。

IP地址的长度为32位(4字节)。Internet是一个网际网络,每个网络所含的主机数目各不相同。有的网络拥有很多主机,而有的网络主机数目则很少,网络规模大小不一。为了便于对IP地址进行管理,充分利用IP地址以适应主机数目不同的各种网络,对IP地址进行了分类,共分为A、B、C、D、E5类地址。目前,大量使用的地址是A、B、C3类,这3类主要根据网络大小进行区别,A类网络最大,C类最小。不同类型的IP地址,其网络地址和主机地址的长度不同,如图所示。IP地址类型格式

A类地址中表示网络地址的部分有8位,其最左边的一位是“0”,主机地址有24位。第一字节对应的十进制数范围是0~127。由于地址0或127有特殊用途,因此有效的地址范围是1~126,即有126个A类网络。

B类地址中表示网络地址的部分有16位,最左边的2位是“10”,第一字节地址范围在128~191(10000000B~10111111B),主机地址也是16位。

C类地址中表示网络地址的部分为24位,最左边的3位是“110”,第一字节地址范围是192~223(11000000B~11011111B),主机地址有8位。由于网络地址和主机地址的长度不一样,因此这3类IP地址的容量不同,它们的容量如表所示。由于用32位二进制表示的IP地址很难记忆与书写,因此在使用时采用“点分十进制”的表示方法:将32位的IP地址分为4段,每段8位,每段用等效的十进制数字表示,并且在这些数字之间加上一个圆点,其形式如下。×××.×××.×××.×××例如,有IP地址“00111011101011111011001010000100”,利用上面的方法可记为“32”点分十进制表示法在书写与记忆上显然要比32位二进制容易得多。采用点分十进制编址方式可以很容易通过第一字节值识别Internet地址属于哪一类。例如,6是C类地址。表5-1IP地址容量表类型最大网络数第一个可用网络号最后一个可用网络号每个网络中最大主机数A

126112616777214B16382

128.1191.254

65534C2097150192.0.1223.255.254254①静态IP地址分配。它是使用手工的方式为每一台主机分配一个该网络的唯一的IP地址,通常分配给该主机的IP地址不做改变。假设该机构申请到一个C类地址,原则上只能分配给254台主机。②动态IP地址分配。它需要在网络上设置一台用于IP地址分配的DHCP(DynamicHostConfigurationProtocol,动态主机配置协议)服务器。当主机与网络连接后,网络上的DHCP服务器从其IP地址集中找到一个未使用的IP地址分配给该主机,这一个IP地址是根据当时网络所连接的主机而定的,因而可能每次这台主机上网所获得的IP地址是不同的。当这台主机不连接网络后,DHCP服务器再收回该IP地址,收回后的IP地址还可以分给另外上网的主机。通常拨号上网所采用的IP地址分配的方法就是这种方式。动态IP地址分配提高了IP地址的利用率,它可以分配给更多的主机,但同一时刻与静态IP地址分配一样,只能分配给254台主机。

(2)子网与子网掩码一个单位分配到的IP地址实际上是IP地址的网络地址,而后面的主机地址则由本单位进行分配。本单位所有主机使用同一个网络地址。当一个单位的主机很多且分布在很大的地理范围时,往往需要用一些网桥将这些主机互连起来。但网桥的缺点有很多,如容易引起广播风暴,同时当网络出现故障时也不太容易隔离和管理。为了使本单位的主机便于管理,可以将本单位所属主机划分为若干子网,将IP地址的主机部分再次划分为子网号与主机号两部分,这样做就可以在本单位的各个子网之间用路由器互连,因而便于管理。需要注意的是,子网的划分纯属于本单位内部的事,在本单位以外是看不到这样的划分的。从外部来看,这个单位仍只有一个网络地址。只有当外面的数据分组进入本单位范围时,本单位的路由器再根据子网地址进行选择,最后送到目的主机。如图所示,说明了在划分子网时要用到的子网掩码的意义。图5-2-5(a)表示将本地控制部分增加一个子网地址;图(b)列出了图(a)所示IP地址使用的子网掩码。该子网掩码为。子网掩码的意义

2.域名系统

Internet使用IP地址作为网上的通信地址,但对于众多的IP地址用户来讲,IP地址用数字表示是难以记忆的。另外,从IP地址上看不出拥有该地址的组织名称或性质,同时也不能根据公司或组织名称、类型猜测其IP地址。由于这些缺点,Internet引入了域名系统(DomainNameSystem,DNS),域名系统使用域名指代IP地址。例如,中国教育科研网的Web服务器IP地址是6,域名为,当要访问中国教育科研网的Web服务器时,只需记住其域名而不必记住其IP地址即可,显然域名要容易记得多。域名采用分层次的方法命名,其方式如下:如前面的域名,顶级域名为cn,二级域名为edu,三级域名为www,其级别按从高到低,从右到左排列。一个完整的域名不超过255个字符。在域名系统中既不规定一个域名下需要包含多少个下级域名,也不规定每一级域名代表什么意思。各级域名由其上一级域名管理,最高域名由Internet的有关机构管理。这种方法可使每一个名字都是唯一的。我国则将二级域名划分为类别域名和行政区域名两大类。其中,类别域名有6个,如表所示;行政区域有34个,适用于我国各省、自治区、直辖市。例如,bj表示北京市;sh表示上海市;hb表示湖北省。表5-2中国互联网二级类别域名域名意义域名意义域名意义ac科研机构edu教育机构net网络机构com工商金融

gov政府部门

org非营利组织在我国,在二级域名下可申请注册三级域名。在二级域名edu下申请注册三级域名则由中国教育和科研计算机网网络中心负责。在其他二级域名下申请注册三级域名的,则应向中国互联网络信息中心(CNNIC)申请。5.2.4Internet的接入方式

常见的Internet接入方式有以下几种。

1.PSTN拨号接入

PSTN(PublicSwitchedTelephoneNetwork,公用电话交换网)技术是利用PSTN通过调制解调器拨号实现用户接入的方式。这种接入方式的最高速率为56Kbit/s,已经达到香农(Shannon)定理确定的信道容量极限,拨号上网的网速一般为9.6~56Kbit/s,这种速率远远不能满足宽带多媒体信息的传输需求。

2.ISDN拨号接入

ISDN(IntegratedServiceDigitalNetwork,综合业务数字网)接入技术,俗称“一线通”,采用数字传输和数字交换技术,将电话、传真、数据、图像等多种业务综合在一个统一的数字网络中进行传输和处理。用户利用一条ISDN用户线路,可以在上网的同时拨打电话、收发传真,就像拥有两条电话线一样。ISDN的基本速率接口有两条64Kbit/s的数据信道和一条16Kbit/s的控制信道,简称2B+D。当有电话拨入时,它会自动释放一个B信道来进行电话接听。

3.DDN专线接入

DDN(DigitalDataNetwork,数字数据网)是随着数据通信业务发展而迅速发展起来的一种新型网络。DDN的主干网传输介质有光纤、数字微波、卫星信道等,用户端使用普通电缆和双绞线。DDN将数字通信技术、计算机技术、光纤通信技术、数字交叉连接技术有机地结合在一起,提供了高速度、高质量的通信环境,可以向用户提供点对点、点对多点透明传输的数据专线出租线路,为用户传输数据、图像、声音等信息。DDN的通信速率可根据用户需要在N×64Kbit/s(N=1~32)之间进行选择,当然速率越高租用费用也就越高。

4.ADSL接入

ADSL(AsymmetricDigitalSubscriberLine,非对称数字用户环路)是一种能够通过普通电话线提供宽带数据业务的技术,也是目前极具发展前景的一种接入技术。ADSL素有“网络快车”之美誉,因其下行速率高、频带宽、性能优、安装方便、不需交纳电话费等特点而深受广大用户喜爱,成为继调制解调器、ISDN之后的又一种全新的高效接入方式。

5.VDSL接入

VDSL(Very-high-bit-rateDigitalSubscriberLoop,超高速数字用户环路)的最大特点是可以在相对较短的距离(0.3~1.5km)内以最高52Mbit/s的速率提供对称或者非对称数据传输。VDSL比ADSL速度快,短距离内的最大下载速率可达55Mbit/s,上传速率可达19.2Mbit/s,甚至更高。VDSL的设计目的是提供全方位的宽带接入,用于音频、视频和数据的快速传输。由于VDSL传输距离短、码间干扰小、对数字信号处理要求大为简化,其设备成本比ADSL低。

6.Cable-Modem接入

Cable-Modem(电缆调制解调器)是通过有线电视(CATV)网络进行高速数据接入的设备,终端用户安装Cable-Modem后即可在有线电视网络中进行数据双向传输。它具备较高的上、下行传输速率,用Cable-Modem开展宽带多媒体综合业务,可为有线电视用户提供宽带高速Internet的接入、视频点播、各种信息资源的浏览、网上多种交易等增值业务。

7.PON

PON(PassiveOpticalNetwork,无源光纤网络)技术是一种一点对多点的光纤传输和接入技术,下行采用广播方式,上行采用时分多址方式,可以灵活地组成树状、星状、总线型等拓扑结构,在光分支点不需要节点设备,只需要安装一个简单的光分支器即可。因此,其具有节省光缆资源、带宽资源共享、节省机房投资、设备安全性高、建网速度快、综合建网成本低等优点。

8.LMDS接入

LMDS(LocalMultipointDistributionService,区域多点传输服务)是一种无线接入Internet的方式。在该方式中,一个基站可以覆盖直径20km的区域,每个基站可以负载2.4万个用户,每个终端用户的带宽可达到25Mbit/s。但是,它的带宽总容量为600Mbi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论