专题02 数据采集、编码与分析(知识梳理+考点精讲精练+实战训练)(原卷版及全解全析)_第1页
专题02 数据采集、编码与分析(知识梳理+考点精讲精练+实战训练)(原卷版及全解全析)_第2页
专题02 数据采集、编码与分析(知识梳理+考点精讲精练+实战训练)(原卷版及全解全析)_第3页
专题02 数据采集、编码与分析(知识梳理+考点精讲精练+实战训练)(原卷版及全解全析)_第4页
专题02 数据采集、编码与分析(知识梳理+考点精讲精练+实战训练)(原卷版及全解全析)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题02数据采集、编码与分析目录目录第一部分明晰学考要求·精准复习第二部分基础知识梳理·全面提升第三部分考点精讲精练·对点突破考点01大数据考点02数据采集考点03数据编码考点04数据可视化考点05数据分析报告考点06数据保护(加密、解密)第四部分实战能力训练·满分必刷专题考试内容要求对应学业质量水平数据采集、编码与分析1.了解数据采集的基本方法,了解大数据的基本知识。2.知道数据编码的基本方式。3.了解数据分析和可视化表达的基本方法。4.熟悉数据分析报告的组成和作用。5.理解对数据进行保护的意义。1.知道数据编码的基本方式。2.通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法,理解对数据进行保护的意义。3.根据任务需求,选用恰当的软件工具或平台处理数据,完成分析报告。一、大数据1.大数据:是以、、、、为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。【注意】这里的“大”是一个相对概念,没有具体标准,通常10TB~100TB为大数据的门槛,实际应用中已经形成了PB级别的数据量。其中1TB=1024GB,1PB=1024TB。【归纳】例如:网络日志、音视频、图片以及地理位置信息等体现出大数据类型多的特点。2.大数据意义:我们有可能从如此庞大的数据中出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。【归纳】大数据它涉及对大量、来源分散、格式多样的数据进行采集、存储和关联分析,目的是从中发现新知识,创造新价值、提升新能力。【注意】关注不同领域内大数据的案例。零售行业,大数据分析帮助商家了解消费者行为,优化库存管理和个性化营销策略。交通管理领域,大数据技术被用来分析交通流量和模式,以减少拥堵和提高道路安全。医疗保健领域,大数据的应用正在改变疾病诊断和治疗的方式。金融行业,大数据分析帮助金融机构进行风险管理和欺诈检测。二、数据采集数据采集是指:从各种来源和渠道收集数据的过程。包括但不限于传感器数据、日志文件、交易记录、社交媒体、网络爬虫以及各种在线和离线的数据库。数据采集的目的:是为了获取原始数据,这些数据随后可以被清洗、处理和分析,以提取有用的信息和知识。采集的方法主要有两类:(1)(2)(华师版)【归纳】对数据采集的渠道要进行甄别,尤其是网络上搜集的数据三、数据编码编码的含义:是信息从一种形式或格式转换为的过程,是一种用预先规定的方法将文字、数字或其他对象编成可以存储在中的数值。(1)按照取值特征:可将信号分为和。传感器获取的一般是模拟信号。模拟信号是值随着时间的变化是连续的信号,波形光滑。模拟信号的值称为模拟数据。数字信号是值随时间的变化是的信号,数字信号可以由转换得来。【归纳】声音、温度、压强等都是模拟信号;数字信号的值即数字数据。(2)声音的编码:将模拟声音数据转换为数字数据的过程。将模拟声音信号转化为数字声音信号的这一过程,我们称为声音的数字化。步骤:采样——量化——编码第一步:在t上按一定的时间间隔从信号中取一个瞬时振幅值,这个过程称为。在一定时间内,采集的信号样本越多、纵轴刻度划分越细密,对信号波形的表示就越精确。常见的CD的采样频率是44.1KHz。第二步:将信号波形的纵轴划分为若干区,落到某一区的采样点按四舍五入的规则取整选值,这个过程称为。第三步:将样本值用计算机能够和的数值表示的过程称为。(3)计算机存储单位计算机存储数据的最小单位是二进制位,用表示,只有两种状态即或。计算机存储数据的基本单位是,个比特构成个字节。【注意】区分最小单位和基本单位(4)声音文件容量计算未压缩音频文件容量计算公式:时长*采样频率*位数*声道数/8(B) 计算结论单位是字节。一段时长为1分钟,采样频率为44.1KHz,量化位数为16位,双声道立体声的无压缩音频,占用的存储空间是10.1MB(精确到0.1),计算过程如下:60*44.1*1000*16*2/8/1024/1024≈10.1MB【注意】时长是秒为单位,频率是赫兹为单位。(5)进制及其转换1.进制:是一种数制表示方法,它规定了数的基数和每一位数的取值范围。在不同的进制中,基数不同,基数决定了每一位数可以使用的数字的个数。例如二进制的基数是2,每一位数只能取0或1。常见的进制包括二进制、、十进制和。计算机中存放的数据最终都是以进制的形式。2.进制转换:十进制转二进制,;二进制转十进制,。3.八进制:每一位数的取值范围为:。4.十六进制:每一位数的取值范围为:,,对应十进制的0-15。【注意】计算器是进制转换的绝佳数字化工具,程序员功能下,BIN是二进制,OCT是八进制,DEC是十进制,HEX是十六进制。(6)文本编码文本数据是用来表示一定意思的一系列字符,包括字母、数字、标点符号、汉字等。1.ASCII码:,用7位(标准ASCII码),表示个字符。还可用8位(扩展ASCII码)二进制表示一个字符。例如A的ASCII码为01000001,即65。2.Unicode码:为了解决传统字符编码方案的局限性而产生的。Unicode是全球可以共享的编码字符集,涵盖了全世界的主要文字的字符。Unicode码至少有16位二进制数据构成。计算机要处理汉字,必须对汉字进行Uncode编码,显然每个汉字至少需要两个字节。在Python中,函数返回的是字符的Unicode码值,函数返回Unicode码对应的字符。3.汉字编码:我国先后制定了多个汉字编码方案:GB2312-1980字符集(国标码,GB码)、GBK字符集(兼容GB码)、GB18030-2000字符集等,Unicode中包含了汉字的编码。【归纳】会分析出所给图中的编码方式,并对对应的内容写出正确的编码。四、数据分析与可视化1.数据分析:用恰当的对收集来的大量数据进行、和,提取有用信息,并形成结论的过程。(1)数据分析的一般过程:根据分析的目标,然后,选用恰当的分析方法进行,是否正确,继而。(2)数据分析的基本方法:和。对比分析是指将的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。对比分为横向对比和纵向对比。横向对比指的是或者之间进行比较;纵向对比指的是和相同事物的进行比较。平均分析就是运用计算的方法,来反映总体在一定时间、地点条件下某一数量特征的一般水平。(3)数据分析的目的:、和。2.数据可视化表达:以、和等方式更加直观生动地呈现数据及数据分析结果,数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。图表是数据分析可视化的常用方法,柱状图、饼图和折线图是基本图表类型。【归纳】对比分析和平均分析经常结合使用,图表主要掌握WPS表格软件的应用。五、数据分析报告数据分析报告:是项目研究结果的,也是数据分析结论的有效。数据分析报告包含数据分析的、、及完整的展现出来,更为决策者提供科学、严谨的决策依据。数据分析报告过程:①首先需要明确数据分析的,阐述目前存在的问题及通过分析希望解决的问题;②其次需要描述数据来源和数据分析的、和;③最后需要重点呈现数据分析的、。【归纳】数据分析报告应注重逻辑性和条理性,确保报告的每一部分都紧密相连,形成一个完整的叙述。此外,报告的格式和风格应保持一致,以增强报告的专业性和可读性。六、数据保护(加密、解密)1.密码保护:指用来核对用户ID以验证用户就是本人的一组字符。(1)安全密码规则:①长度不少于位;②含、、;③电话、身份证、出生日期不作为密码;④字典中的内容不作为密码。(2)破解密码的方式:肩窥、字典和暴力【注意】区分密码和验证码的作用2.加密:将原始信息(数据)隐匿起来,使之在缺少特殊信息(数据)时不可读。原始信息(数据)称为,加密后的信息(数据)称为。将密文还原成明文的过程称为。3.加密方法:(恺撒加密)依次将明文中的字母按照表格中的顺序向后或向前移动固定的数目取得的字符形成的新的序列,即为加密后的密文。【归纳】能用Python语言中的chr()函数和ord()函数完成加密算法的设计和实施。练考点01大数据【典型例题1】(2024-全国)关于数据、信息和大数据的说法,下列描述不正确的是()A.单纯的数据没有明确含义,放到具体环境中产生的内涵就是信息B.信息的价值是相对的C.同一信息只能依附于同一载体D.对于大数据,不一定强调对事物因果关系的探求,而是更加注重它们的相关性【典型例题2】(2023-江苏)市交通智能化大数据分析平台的实时数据来源于交通部门、电信、相关企业等服务器中。该事例主要体现的大数据的特征是()A.价值密度低 B.数据类型繁多 C.变化速度快 D.分布式存储对点专攻1.下列关于大数据(Bigdata)特点的叙述,错误的是()A.数据体量巨大B.数据种类繁多 C.商业价值高D.处理速度慢2.以下选项中不属于医疗健康大数据的是()A.健康档案数据 B.公共安全数据 C.诊疗数据 D.个人健康管理数据考点02数据采集【典型例题1】(2023-贵州)以下数据采集的方法,不可取的是()A.利用问卷星发放调查问卷采集数据 B.利用木马程序收集数据C.通过走访调查采集数据 D.通过实验操作采集数据【典型例题2】(2024-江苏)同学们到图书馆借书需要刷卡或刷脸,这个“刷”的过程属于()A.数据分析 B.数据分类 C.数据采集 D.数据可视化表达对点专攻1.()是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息,并形成结论的过程。A.数据分析 B.数据采集 C.数据处理 D.数据存储2.下列选项中,不属于人工数据采集方法的是()A.访谈B.观察 C.视频监控D.实验考点03数据编码【典型例题1】(2024-全国)交通控制中心对信号灯状态进行数据编码,如图1所示。若只允许左转一个车道通行,对应的编码是110101,如图2所示。若不允许车辆左转,只允许车辆直行和右转,对应的编码是()A.010111 B.111111 C.011111 D.100101【典型例题2】(2024-江苏)关于数据编码,下列说法正确的是()A.数据编码是指按规定的方法将数据组合成可存储的数值 B.数据编码就是将模拟信号转换为数字信号C.数据编码就是对数据进行压缩管理 D.数据编码就是将数据计算后重新组织对点专攻1.声音信号的数据编码采用的二进制位数越多,数据量越大,占用存储空间越大。其存储空间遵循如下公式:声音存储空间=采样频率*量化位数*声道数*时间/8。例如:录制一段时长为1秒、采样频率为44.1kHz、量化位数为16位、双声道、WAVE格式的音频,所需要的字节数为:44.1*1000*16*2*1/8=176400(B)。请问录制一段时长为1分钟、采样频率为44.1kHz、量化位数为16位、双声道、WAVE格式的音频,该音频的存储容量约为()A.10.3KBB.172KB C.10.1MBD.80.7MB2.下列有关数据编码的说法正确的是()A.声音、图片、文字等数据存储在计算机中,不一定转为二进制B.编码是信息按某种规律与格式,从一种形式转换为另一种形式的过程C.解码是编码的另一种形式D.声音数字化过程不需要编码考点04数据可视化【典型例题1】(2024-安徽)学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并做出分析,得出结论。以下说法错误的是()A.《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识B.可以借助多种数字化学习工具完成该项目,如网络调查问卷、查阅电子资料、思维导图、搜索引擎等C.通过调查问卷收集的是数据,可以用图表对其进行可视化表达D.网络调查平台已经提供了分析功能,用户无需再对数据进行分析【典型例题2】(2023-全国)下表为某同学高一上学期四次考试成绩,他通过图表对成绩进行数据可视化表达并分析。通过对四次考试成绩分析比较,发现语文科和数学科进步明显,英语科有退步的迹象,该分析方法属于()A.平均分析法 B.对比分析法 C.结构分析法 D.水平分析法对点专攻1.市场部门需要呈现每月鲜果消费价格的变化趋势,下列最适合的数据可视化表达方式是()A.散点图 B.面积图 C.雷达图 D.折线图2.数据可视化的重要性,它可以帮助我们更直观地理解数据。以下哪个选项不是数据可视化的一种常见形式?()A.条形图 B.折线图 C.饼图 D.表格考点05数据分析报告【典型例题1】(2023-江苏)数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。下列关于数据分析报告的说法中,不正确的是()A.数据分析报告中要明确数据分析的目的和背景B.数据分析报告要阐述目前存在的问题及通过分析希望解决的问题C.数据分析报告中的数据必须全部用文字的形式进行呈现D.数据分析报告要呈现数据分析的过程、结论和建议(2024-江苏)数据分析报告是整个数据分析过程的成果。对数据分析报告的要求不包括()A.数据分析必须全部基于权威部门公开发布的数据B.数据分析的推理要有很强的逻辑性和严谨性C.数据分析报告要有数据分析的结论D.分析报告要有较强的可读性对点专攻1.下列关于数据分析报告的说法不正确的是()A.数据分析报告中只能体现出数据分析结果,不能展示数据分析的起因和过程B.数据分析报告是项目研究结果的展示C.数据分析报告可以为决策者提供科学、严谨的决策依据D.数据分析报告中的数据可以用文本、表格、图形等多种形式呈现2.一份有效的数据分析报告,能够帮助用户()A.了解事物发展现状,预判事物发展趋势 B.有效判断所需解决问题的影响因素C.有针对性地选择解决问题的方案 D.以上都是考点06数据保护(加密、解密)【典型例题1】(2024-贵州)数据保护的方法有数据备份和数据加密,下列关于数据加密说法错误的是()A.只要不访问互联网就可以防止木马的入侵B.连接可信的无线网络C.合理设置智能终端的数据采集功能,保护个人隐私数据D.连接其他设备时,认真阅读操作提示和安全事项(2023-内蒙古)数据安全防护的手段有()A.异地容灾 B.数据加密、脱敏 C.访问控制 D.数据备份对点专攻1.下列有关数据加密和数据校验的说法,正确的是()A.数据加密是通过加密算法和加密钥匙将明文转变为密文B.数据加密保证了数据的完整性C.数据校验提高了数据的保密性D.常有的数据保密方法有MD5、CRC、SHA-1等2.人们常采用数据加密技术来防止信息系统中的数据被破坏,下列说法错误的是()A.数据加密是通过加密算法和加密密钥将明文转变为密文B.数据解密是通过解密算法和解密密钥将密文转换为明文C.为了确保加密与解密可逆,加密与解密的密钥必须相同D.量子密钥是目前人类最安全的加密方式1、下列关于大数据的描述错误的是()A.大数据不一定强调对事物因果关系的探求,而是更加注重它们的相关性B.大数据可以让决策更加精准,是因为对数据的要求更加精确C.大数据可以带来新的就业需求D.大数据带来了新的社会问题,如信息的泄露和数据安全2、大数据从产生的角度看,具有4V特征,以下不能体现4V特征的是()A.大数据需要采用分布式并行计算处理海量数据B.数据体量巨大,从TB级别跃升到PB级别C.价值密度低D.变化速度快,且大数据必须得到高效、迅速的处理才具有价值3、数据采集有多种的方法下列属于数据采集方法的是()①汇总法 ②调查法 ③实验法 ④分类法A.②④ B.①③ C.①② D.②③4、学校需要统计高中一年级新生对冬装、夏装校服的需求量并进行订购,下列数据采集方式不恰当的是()A.政教处到各班级现场统计 B.各班班主任班会课统计后汇总C.学生家长填写学校发放的在线问卷 D.咨询其他学校5、下列属于直接数据采集方法的是()①设计调查问卷,收集学生对食堂满意度调查②通过网络,亲自到招生部门网站收集近三年高考录取情况③雨后,到观测站测量本次降雨量④到图书馆统计本学期同学们借书数量A.②③④ B.①②③ C.①③④ D.①②④6、对声音进行数据编码不需要经过哪个阶段()A.采样 B.量化 C.编码 D.传输7、关于数据编码的说法,错误的是()A.便于存储、加工 B.是一种形式上的转换C.是计算机处理信息的关键 D.就是十进制数转化成二进制数8、下列数据编码方案中,不包含汉字编码的方案是()A.ASCII B.GB2312-1980 C.GBK D.GB18030-20009、下列选项中,不属于数据可视化应用的是()A.滴滴出行 B.掌上公交 C.高德地图 D.百度网盘10、数据可视化在信息系统中的作用不包括以下哪项?()A.提高数据的可读性 B.增强数据的解释性C.降低信息的透明度 D.帮助用户发现数据模式11、下列关于数据可视化的描述不恰当的是()A.通过图形化手段能够清晰有效地传达与沟通信息 B.选择合适的图表类型才有助于对信息的理解C.数据可视化有利于推动数据思维提升并发现业务逻辑D.尽量从视觉设计的角度制作数据可视化图表12、随着时代的发展我们发现空气污染情况也在逐渐加重,作为一名时刻关注国家和城市发展的新时代少年,我决定利用自己学过的python编程爬取各城市的空气状况数据,然后进行数据分析并撰写成报告,在撰写数据分析报告时应注意的问题不包括()A.引用资料可不加注释 B.考虑报告使用者C.行文流畅,通俗易懂,简明扼要 D.内容客观,分析准确13、网格员准备做一份关于社区老龄化的数据分析报告。下列说法正确的是()A.该报告要有社区老龄化数据分析的结论与建议 B.老龄化数据分析的目的与背景在报告中可以忽略C.报告中数据来源、质量可以不用说明 D.报告中关于数据分析的思路与方法可以略写或不写14、在数据加密处理过程中,需要保密的信息称为“明文”,经加密处理后的信息称为“密文”。现将0-9这10个数字按图示排成一圈,并设置一种信息加密规则——密钥为“n@2”,“n@2”表示把明文n换成图中从它开始逆时针跳过2个数字后的那个数字,例如明文是5时,它对应的密文是0。若收到的密文是3682,那么通过解密,它对应的明文是()A.8945 B.0247 C.8925 D.913815、下列关于数据加密的说法不正确的是()A.数据只在传输时需要保护,在存储时不需要保护B.不管数据形式如何,一旦数据进入不安全的通信信道便容易受到攻击C.数据加密同时使用加密算法和加密密钥来呈现数据D.加密密钥是加密算法中使用的附加变量

专题02数据采集、编码与分析目录目录第一部分明晰学考要求·精准复习第二部分基础知识梳理·全面提升第三部分考点精讲精练·对点突破考点01大数据考点02数据采集考点03数据编码考点04数据可视化考点05数据分析报告考点06数据保护(加密、解密)第四部分实战能力训练·满分必刷专题考试内容要求对应学业质量水平数据采集、编码与分析1.了解数据采集的基本方法,了解大数据的基本知识。2.知道数据编码的基本方式。3.了解数据分析和可视化表达的基本方法。4.熟悉数据分析报告的组成和作用。5.理解对数据进行保护的意义。1.知道数据编码的基本方式。2.通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法,理解对数据进行保护的意义。3.根据任务需求,选用恰当的软件工具或平台处理数据,完成分析报告。一、大数据1.大数据:是以容量大、类型多、存取速度快、应用价值高、价值密度低为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。【注意】这里的“大”是一个相对概念,没有具体标准,通常10TB~100TB为大数据的门槛,实际应用中已经形成了PB级别的数据量。其中1TB=1024GB,1PB=1024TB。【归纳】例如:网络日志、音视频、图片以及地理位置信息等体现出大数据类型多的特点。2.大数据意义:我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。【归纳】大数据它涉及对大量、来源分散、格式多样的数据进行采集、存储和关联分析,目的是从中发现新知识,创造新价值、提升新能力。【注意】关注不同领域内大数据的案例。零售行业,大数据分析帮助商家了解消费者行为,优化库存管理和个性化营销策略。交通管理领域,大数据技术被用来分析交通流量和模式,以减少拥堵和提高道路安全。医疗保健领域,大数据的应用正在改变疾病诊断和治疗的方式。金融行业,大数据分析帮助金融机构进行风险管理和欺诈检测。二、数据采集数据采集是指:从各种来源和渠道收集数据的过程。包括但不限于传感器数据、日志文件、交易记录、社交媒体、网络爬虫以及各种在线和离线的数据库。数据采集的目的:是为了获取原始数据,这些数据随后可以被清洗、处理和分析,以提取有用的信息和知识。采集的方法主要有两类:(1)传感器采集(2)网络采集(华师版)【归纳】对数据采集的渠道要进行甄别,尤其是网络上搜集的数据三、数据编码编码的含义:是信息从一种形式或格式转换为另一种形式或格式的过程,是一种用预先规定的方法将文字、数字或其他对象编成可以存储在计算机中的数值。(1)按照取值特征:可将信号分为模拟信号和数字信号。传感器获取的一般是模拟信号。模拟信号是值随着时间的变化是连续的信号,波形光滑。模拟信号的值称为模拟数据。数字信号是值随时间的变化是非连续的信号,数字信号可以由模拟信号转换得来。【归纳】声音、温度、压强等都是模拟信号;数字信号的值即数字数据。(2)声音的编码:将模拟声音数据转换为数字数据的过程。将模拟声音信号转化为数字声音信号的这一过程,我们称为声音的数字化。步骤:采样——量化——编码第一步:在时间轴t上按一定的时间间隔从信号中取一个瞬时振幅值,这个过程称为采样。在一定时间内,采集的信号样本越多、纵轴刻度划分越细密,对信号波形的表示就越精确。常见的CD的采样频率是44.1KHz。第二步:将信号波形的纵轴划分为若干区,落到某一区的采样点按四舍五入的规则取整选值,这个过程称为量化。第三步:将样本值用计算机能够存储和处理的二进制数值表示的过程称为编码。(3)计算机存储单位计算机存储数据的最小单位是二进制位,用比特(byte)表示,只有两种状态即1或0。计算机存储数据的基本单位是字节(KB),8个比特构成1个字节。【注意】区分最小单位和基本单位(4)声音文件容量计算未压缩音频文件容量计算公式:时长*采样频率*位数*声道数/8(B) 计算结论单位是字节。一段时长为1分钟,采样频率为44.1KHz,量化位数为16位,双声道立体声的无压缩音频,占用的存储空间是10.1MB(精确到0.1),计算过程如下:60*44.1*1000*16*2/8/1024/1024≈10.1MB【注意】时长是秒为单位,频率是赫兹为单位。(5)进制及其转换1.进制:是一种数制表示方法,它规定了数的基数和每一位数的取值范围。在不同的进制中,基数不同,基数决定了每一位数可以使用的数字的个数。例如二进制的基数是2,每一位数只能取0或1。常见的进制包括二进制、八进制、十进制和十六进制。计算机中存放的数据最终都是以二进制的形式。2.进制转换:十进制转二进制,除2取余法;二进制转十进制,位权展开法。3.八进制:每一位数的取值范围为:0-7。4.十六进制:每一位数的取值范围为:0-9,A-F,对应十进制的0-15。【注意】计算器是进制转换的绝佳数字化工具,程序员功能下,BIN是二进制,OCT是八进制,DEC是十进制,HEX是十六进制。(6)文本编码文本数据是用来表示一定意思的一系列字符,包括字母、数字、标点符号、汉字等。1.ASCII码:美国信息交换标准码,用7位(标准ASCII码),表示128个字符。还可用8位(扩展ASCII码)二进制表示一个字符。例如A的ASCII码为01000001,即65。2.Unicode码:为了解决传统字符编码方案的局限性而产生的。Unicode是全球可以共享的编码字符集,涵盖了全世界的主要文字的字符。Unicode码至少有16位二进制数据构成。计算机要处理汉字,必须对汉字进行Uncode编码,显然每个汉字至少需要两个字节。在Python中,函数ord()返回的是字符的Unicode码值,函数chr()返回Unicode码对应的字符。3.汉字编码:我国先后制定了多个汉字编码方案:GB2312-1980字符集(国标码,GB码)、GBK字符集(兼容GB码)、GB18030-2000字符集等,Unicode中包含了汉字的编码。【归纳】会分析出所给图中的编码方式,并对对应的内容写出正确的编码。四、数据分析与可视化1.数据分析:用恰当的统计分析方法对收集来的大量数据进行计算、处理和分析,提取有用信息,并形成结论的过程。(1)数据分析的一般过程:根据分析的目标提出假设,然后收集数据,选用恰当的分析方法进行分析,验证假设是否正确,继而得出结论。(2)数据分析的基本方法:对比分析和平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。对比分为横向对比和纵向对比。横向对比指的是类似的事物或者同类的事物之间进行比较;纵向对比指的是和相同事物的不同时期进行比较。平均分析就是运用计算平均值的方法,来反映总体在一定时间、地点条件下某一数量特征的一般水平。(3)数据分析的目的:现状分析、原因分析和预测分析。2.数据可视化表达:以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。图表是数据分析可视化的常用方法,柱状图、饼图和折线图是基本图表类型。【归纳】对比分析和平均分析经常结合使用,图表主要掌握WPS表格软件的应用。五、数据分析报告数据分析报告:是项目研究结果的展示,也是数据分析结论的有效承载形式。数据分析报告包含数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。数据分析报告过程:①首先需要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;②其次需要描述数据来源和数据分析的思路、方法和模型;③最后需要重点呈现数据分析的过程、结论和建议。【归纳】数据分析报告应注重逻辑性和条理性,确保报告的每一部分都紧密相连,形成一个完整的叙述。此外,报告的格式和风格应保持一致,以增强报告的专业性和可读性。六、数据保护(加密、解密)1.密码保护:指用来核对用户ID以验证用户就是本人的一组字符。(1)安全密码规则:①长度不少于8位;②含数字、字母、特殊符号;③电话、身份证、出生日期不作为密码;④字典中的内容不作为密码。(2)破解密码的方式:肩窥、字典和暴力【注意】区分密码和验证码的作用2.加密:将原始信息(数据)隐匿起来,使之在缺少特殊信息(数据)时不可读。原始信息(数据)称为明文,加密后的信息(数据)称为密文。将密文还原成明文的过程称为解密。3.加密方法:移位加密(恺撒加密)依次将明文中的字母按照表格中的顺序向后或向前移动固定的数目取得的字符形成的新的序列,即为加密后的密文。【归纳】能用Python语言中的chr()函数和ord()函数完成加密算法的设计和实施。练考点01大数据【典型例题1】(2024-全国)关于数据、信息和大数据的说法,下列描述不正确的是()A.单纯的数据没有明确含义,放到具体环境中产生的内涵就是信息B.信息的价值是相对的C.同一信息只能依附于同一载体D.对于大数据,不一定强调对事物因果关系的探求,而是更加注重它们的相关性【答案】C【解题技巧】载体依附性的多样性【解析】本题考查数据、信息与大数据相关内容。数据可以是文字、数字、符号、表格、图像、语音、视频等,它直接来源于事实的记录,可以通过原始的观察或者度量获得。信息是有意义的数据,是对数据进行解释、整理、归纳后的产物。信息能够消除不确定性,为决策提供依据。大数据一般的定义为:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。对于大数据,不一定强调对事物因果关系的探求,而是更加注重它们的相关性。ABD选项说法正确。C选项,同一信息可以依附于不同载体,选项说法错误。故本题答案是C选项。【典型例题2】(2023-江苏)市交通智能化大数据分析平台的实时数据来源于交通部门、电信、相关企业等服务器中。该事例主要体现的大数据的特征是()A.价值密度低 B.数据类型繁多 C.变化速度快 D.分布式存储【答案】D【解题技巧】来源于交通部门、电信、相关企业等服务器中,体现的是分布式存储。【解析】本题考查大数据特征相关内容。市交通智能化大数据分析平台的实时数据来源于交通部门、电信、相关企业等服务器中。该事例主要体现的大数据的特征是分布式存储。选D。对点专攻1.下列关于大数据(Bigdata)特点的叙述,错误的是()A.数据体量巨大B.数据种类繁多 C.商业价值高D.处理速度慢【答案】D【解析】本题主要考查大数据的叙述。大数据具有数据体量巨大、数据类型繁多、商业价值高、处理速度快,故本题选D选项。2.以下选项中不属于医疗健康大数据的是()A.健康档案数据 B.公共安全数据 C.诊疗数据 D.个人健康管理数据【答案】B【解析】本题考查大数据。健康档案数据、诊疗数据、个人健康管理数据都与医疗健康直接相关,属于医疗健康大数据的范畴。而公共安全数据主要涉及社会治安、公共秩序等方面,与医疗健康领域的关联较小,不属于医疗健康大数据。故答案为:B。考点02数据采集【典型例题1】(2023-贵州)以下数据采集的方法,不可取的是()A.利用问卷星发放调查问卷采集数据 B.利用木马程序收集数据C.通过走访调查采集数据 D.通过实验操作采集数据【答案】B。【解题技巧】关键词:木马程序。【解析】本题考查的是信息采集。利用木马程序收集数据是违法的,故本题应选B。【典型例题2】(2024-江苏)同学们到图书馆借书需要刷卡或刷脸,这个“刷”的过程属于()A.数据分析 B.数据分类 C.数据采集 D.数据可视化表达【答案】C【解题技巧】刷卡和刷脸都是采集学生信息进行身份认证。【解析】本题考查数据处理的相关内容。数据处理一般是指对数据进行采集、整理、分析和可视化的表达的过程。数据采集是指人们根据需要获取数据,它是确保数据处理过程有效的基础。这个“刷”的过程属于数据采集。故答案为:C。对点专攻1.()是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息,并形成结论的过程。A.数据分析 B.数据采集 C.数据处理 D.数据存储【答案】A。【解析】本题考查数据分析相关内容。从题干关键词来看,涉及到分析、提取、形成结果,故本题选A。2.下列选项中,不属于人工数据采集方法的是()A.访谈B.观察 C.视频监控D.实验【答案】C【解析】本题考查数据采集相关内容。数据采集有六种方法:(1)调查法,调查方法一般分为普查和抽样调查两大类;(2)观察法,观察法是通过开会、深入现场、参加生产和经营、实地采样、进行现场观察并准确记录调研情况;(3)实验方法,实验方法能通过实验过程获取其他手段难以获得的信息或结论;(4)文献检索,文献检索分为手工检索和计算机检索;(5)网络信息收集,网络信息是指通过计算机网络发布、传递和存储的各种信息。(6)访谈法,是通过与研究对象交谈收集所需资料的一种研究方法,适合对事物进行深入研究。人工数据采集方法的有:访谈、观察、实验。视频监控是一类特殊的数据采集方式,主要是将各类图像传感器、摄像机、录像机、电视机等视频设备输出的视频信号进行采样、量化等操作,从而转化成数字数据,不属于人工数据采集方法。故本题答案是C选项。考点03数据编码【典型例题1】(2024-全国)交通控制中心对信号灯状态进行数据编码,如图1所示。若只允许左转一个车道通行,对应的编码是110101,如图2所示。若不允许车辆左转,只允许车辆直行和右转,对应的编码是()A.010111 B.111111 C.011111 D.100101【答案】C【解题技巧】允许绿灯、不允许红灯,再结合左转、直行和右行的位置要求。【解析】本题主要考查二进制编码。依题图1可知,绿灯的编码是11,红灯的编码是01。根据图2可知,如果若不允许车辆左转,只允许车辆直行和右转,左转指示的编码应该为01,直行指示的编码为11,右转指示的编码为11,所以“如果若不允许车辆左转,只允许车辆直行和右转”对应的编码是011111。故本题选C选项。【典型例题2】(2024-江苏)关于数据编码,下列说法正确的是()A.数据编码是指按规定的方法将数据组合成可存储的数值 B.数据编码就是将模拟信号转换为数字信号C.数据编码就是对数据进行压缩管理 D.数据编码就是将数据计算后重新组织【答案】A【解题技巧】BCD在表述上用就是,绝对化表述。【解析】本题考查数据编码相关知识。数据编码是指按规定的方法将数据组合成可存储的数值,A选项说法正确;将模拟信号转换为数字信号是数据编码的一种方法,B选项错误;数据压缩是数据编码的一种方式,C选项错误;数据编码是将数据转换为计算机可读取和处理的二进制格式的过程,D选项错误。故本题选A。对点专攻1.声音信号的数据编码采用的二进制位数越多,数据量越大,占用存储空间越大。其存储空间遵循如下公式:声音存储空间=采样频率*量化位数*声道数*时间/8。例如:录制一段时长为1秒、采样频率为44.1kHz、量化位数为16位、双声道、WAVE格式的音频,所需要的字节数为:44.1*1000*16*2*1/8=176400(B)。请问录制一段时长为1分钟、采样频率为44.1kHz、量化位数为16位、双声道、WAVE格式的音频,该音频的存储容量约为()A.10.3KBB.172KB C.10.1MBD.80.7MB【答案】C【解析】本题考查数据编码的相关内容。声音存储空间=采样频率*量化位数*声道数*时间/8,根据此公式,代入数据计算:44.1*1000*16*2*60/8=10584000(B),转换为KB为10335.9KB,转换为MB为10.1MB,故选C。2.下列有关数据编码的说法正确的是()A.声音、图片、文字等数据存储在计算机中,不一定转为二进制B.编码是信息按某种规律与格式,从一种形式转换为另一种形式的过程C.解码是编码的另一种形式D.声音数字化过程不需要编码【答案】B【解析】本题考查数据编码的相关内容。计算机中都是二进制形式保存;C是将信息从已经编码的形式恢复到编码前原状的过程.也就是用特定方法把数码还原;D声音数字化过程是采样、量化和编码,故正确的是B。考点04数据可视化【典型例题1】(2024-安徽)学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并做出分析,得出结论。以下说法错误的是()A.《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识B.可以借助多种数字化学习工具完成该项目,如网络调查问卷、查阅电子资料、思维导图、搜索引擎等C.通过调查问卷收集的是数据,可以用图表对其进行可视化表达D.网络调查平台已经提供了分析功能,用户无需再对数据进行分析【答案】D【解题技巧】平台分析后的数据需要用户进行需求确认和修改,故需要进一步的分析。【解析】本题考查数据处理。网络调查平台虽然可以收集数据并提供一些基本的分析功能,但通常还需要用户进行更深入的数据分析和解释,特别是在需要深入理解数据背后含义和推断结论时。故答案为:D。【典型例题2】(2023-全国)下表为某同学高一上学期四次考试成绩,他通过图表对成绩进行数据可视化表达并分析。通过对四次考试成绩分析比较,发现语文科和数学科进步明显,英语科有退步的迹象,该分析方法属于()A.平均分析法 B.对比分析法 C.结构分析法 D.水平分析法【答案】B【解题技巧】四次考试成绩的对比分析【解析】本题主要考查数据分析方法。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。通过对四次考试成绩的分析比较,发现语文科和数学科进步明显,英语科有退步的迹象,该分析方法属于对比分析法。故选B。对点专攻1.市场部门需要呈现每月鲜果消费价格的变化趋势,下列最适合的数据可视化表达方式是()A.散点图 B.面积图 C.雷达图 D.折线图【答案】D【解析】本题考查数据可视化的相关内容。呈现变化趋势用折线图,故选D。2.数据可视化的重要性,它可以帮助我们更直观地理解数据。以下哪个选项不是数据可视化的一种常见形式?()A.条形图 B.折线图 C.饼图 D.表格【答案】D【解析】本题考查数据可视化的相关内容。条形图:条形图是一种常见的数据可视化图表类型,用于比较不同类别或组之间的数据。折线图:折线图是将数据标注成点,并通过直线将这些点按某种顺序连接而成的图表。它以折线的方式形象地反映事物沿某一维度的变化趋势,能够清晰地展示数据增减的趋势、速率、规律及峰值等特征。饼图:饼图是由若干个面积大小不一、颜色不同的扇形组成的圆形图表。它使用圆表示数据的总量,组成圆的每个扇形表示数据中各项占总量的比例大小,主要用于显示数据中各项大小与各项总和的比例。表格:表格是一种二维数据结构,由行和列组成,用于展示数据。虽然表格是数据展示的基础形式,但它并不属于数据可视化的常见形式。数据可视化更侧重于通过图形、图表等形式将数据以更直观的方式展现出来,而表格虽然可以展示数据,但缺乏图形化展示所带来的直观性和易于理解性。故正确答案为选项D。考点05数据分析报告【典型例题1】(2023-江苏)数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。下列关于数据分析报告的说法中,不正确的是()A.数据分析报告中要明确数据分析的目的和背景B.数据分析报告要阐述目前存在的问题及通过分析希望解决的问题C.数据分析报告中的数据必须全部用文字的形式进行呈现D.数据分析报告要呈现数据分析的过程、结论和建议【答案】C【解题技巧】必须是绝对化用词,其次可以图表。【解析】本题考查的是数据分析报告书写。数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的思路、方法和模型;最后需要重点呈现数据分析的过程、结论和建议。数据的呈现方式多种多样,应根据数据的特点选择合适的数据呈现方式,选项C说法错误。故本题应选C。(2024-江苏)数据分析报告是整个数据分析过程的成果。对数据分析报告的要求不包括()A.数据分析必须全部基于权威部门公开发布的数据B.数据分析的推理要有很强的逻辑性和严谨性C.数据分析报告要有数据分析的结论D.分析报告要有较强的可读性【答案】A【解题技巧】必须是绝对化用词。【解析】本题考查数据分析报告相关内容。数据分析报告是一种有结构的文档,目的在于根据特定目标受众的需求,总结、解释和以可视化的方式呈现数据分析的结果。此类报告通常包括数据描述、分析方法、结果和结论,并提供洞察以解决问题或支持决策。数据分析的推理要有很强的逻辑性和严谨性,应该具有可读性强、信息准确、清晰明了的特点,以帮助受众理解和应用数据的洞察。数据分析不必全部基于权威部门公开发布的数据。故本题答案是A选项。对点专攻1.下列关于数据分析报告的说法不正确的是()A.数据分析报告中只能体现出数据分析结果,不能展示数据分析的起因和过程B.数据分析报告是项目研究结果的展示C.数据分析报告可以为决策者提供科学、严谨的决策依据D.数据分析报告中的数据可以用文本、表格、图形等多种形式呈现【答案】A【解析】本题主要考查数据分析报告的描述。数据分析报告中能体现出数据分析结果,也能展示数据分析的起因和过程,故本题选A选项。2.一份有效的数据分析报告,能够帮助用户()A.了解事物发展现状,预判事物发展趋势 B.有效判断所需解决问题的影响因素C.有针对性地选择解决问题的方案 D.以上都是【答案】D【解析】本题主要考查数据分析报告的相关内容。一份有效的数据分析报告,能够帮助用户了解事物发展现状,预判事物发展趋势;有效判断所需解决问题的影响因素;有针对性地选择解决问题的方案,故本题选D选项。考点06数据保护(加密、解密)【典型例题1】(2024-贵州)数据保护的方法有数据备份和数据加密,下列关于数据加密说法错误的是()A.只要不访问互联网就可以防止木马的入侵B.连接可信的无线网络C.合理设置智能终端的数据采集功能,保护个人隐私数据D.连接其他设备时,认真阅读操作提示和安全事项【答案】A【解题技巧】访问互联网是木马入侵的一种形式,但不是唯一的形式。【解析】本题考查数据安全。互联网只是木马等病毒传播的一种方式,还可以通过存储介质进行传播。故选A。(2023-内蒙古)数据安全防护的手段有()A.异地容灾 B.数据加密、脱敏 C.访问控制 D.数据备份【答案】ABCD【解题技巧】保护数据的相关技术和方法【解析】本题考查数据安全防护。数据安全防护的手段有:异地容灾、数据加密、脱敏、访问控制、数据备份等。故选ABCD。对点专攻1.下列有关数据加密和数据校验的说法,正确的是()A.数据加密是通过加密算法和加密钥匙将明文转变为密文B.数据加密保证了数据的完整性C.数据校验提高了数据的保密性D.常有的数据保密方法有MD5、CRC、SHA-1等【答案】A【解析】本题考查数据加密相关内容。数据加密是通过加密算法和加密钥匙将明文转变为密文,A说法正确。数据校验能够保证数据的完整性,B说法错误。数据校验提高了数据的完整性,C说法错误。常用的数据保密方法有DES、RSA、AES等,D说法错误。因此,答案为A。2.人们常采用数据加密技术来防止信息系统中的数据被破坏,下列说法错误的是()A.数据加密是通过加密算法和加密密钥将明文转变为密文B.数据解密是通过解密算法和解密密钥将密文转换为明文C.为了确保加密与解密可逆,加密与解密的密钥必须相同D.量子密钥是目前人类最安全的加密方式【答案】C【解析】本题考查数据加密相关内容。C加密和解密的秘钥可以不同,非对称加密技术,故C错误。1、下列关于大数据的描述错误的是()A.大数据不一定强调对事物因果关系的探求,而是更加注重它们的相关性B.大数据可以让决策更加精准,是因为对数据的要求更加精确C.大数据可以带来新的就业需求D.大数据带来了新的社会问题,如信息的泄露和数据安全【答案】B【解析】本题考查大数据相关内容。A选项,大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系,选项正确;B选项,数据体量足够大时,我们不需要担心数据的精确性,因为通过大量的数据分析是可以得出相对精准的结果,选项错误;C选项,大数据领域存在着巨大的就业需求,选项正确;D选项,大数据、人工智能等新技术带来了很多问题,例如数据隐私和安全、算法歧视、算法失灵、数据孤岛等,选项正确。故本题答案是B选项。2、大数据从产生的角度看,具有4V特征,以下不能体现4V特征的是()A.大数据需要采用分布式并行计算处理海量数据B.数据体量巨大,从TB级别跃升到PB级别C.价值密度低D.变化速度快,且大数据必须得到高效、迅速的处理才具有价值【答案】A【解析】本题主要考查大数据特征。大数据的4V特征:规模性(Volume)、高速性(Velocity)、多样性(Variety)、价值性(Value)。大数据需要采用分布式并行计算处理海量数据不能体现4V特征,故本题选A选项。3、数据采集有多种的方法下列属于数据采集方法的是()①汇总法 ②调查法 ③实验法 ④分类法A.②④ B.①③ C.①② D.②③【答案】D【解析】本题考查数据采集相关内容。数据采集的方法包括:(1)观察法(2)实验法(3)问卷调查法(4)查阅资料法(5)数据库采集(6)系统日志采集(7)网络数据采集,故选D。4、学校需要统计高中一年级新生对冬装、夏装校服的需求量并进行订购,下列数据采集方式不恰当的是()A.政教处到各班级现场统计 B.各班班主任班会课统计后汇总C.学生家长填写学校发放的在线问卷 D.咨询其他学校【答案】D【解析】本题考查数据采集。结合选项,可知咨询其他学校不恰当,这与本校学生无关。故选D。5、下列属于直接数据采集方法的是()①设计调查问卷,收集学生对食堂满意度调查②通过网络,亲自到招生部门网站收集近三年高考录取情况③雨后,到观测站测量本次降雨量④到图书馆统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论