版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国家开放大学《统计与数据分析基础》形考任务1-5答案《统计与数据分析基础》是国家开放大学大数据与会计(专科)专业统设必修的专业基础课,也是经济管理类其他专业的选修课。本课程计划课内学时为72课时,共4个学分。课程编号:05404形考任务11.以下关于统计含义的描述不正确的是()。A.统计思维与数据思维是有区别的C.统计研究的是确定性关系3.在下列分组中,按照取值大小分组的是()。4.按照连续变量的定义,()一定不属于连续变量。A.分类变量5.下列变量中,()属于连续变量。B.雇员的年收入6.下列变量中,()属于数值变量且属于离散变量。B.产量A.800家工业企业C.全部工业产品D.每一件工业产品8.下列属于时间序列数据的是()。B.2021年不同地区的GDPC.全国70个城市的新房价格D.2010-2021年所有直辖市的GDP数据9.假设你是一家公司的数据分析员,下列数据来源中属于一手数据的是()。10.工厂对生产的一批零件进行检查,通常采用()。A.普查D.随机抽样调查11.()描述了变量在不同观测值或不同观测值区间上出现的频数或频率。A.分布12.()是满足特定目标的所有观测对象或要素的集合。A.个体D.总体13.在制作统计分布表时,将各组的频数与个体总数的比值称为()。A.频数C.众数D.样本数14.按照获取数据的途径不同,统计数据分为()。A.观测数据B.时间序列数据C.实验数据D.面板数据15.下列调查方法中,属于概率抽样的是()。A.简单随机抽样B.分层抽样C.方便抽样D.等距抽样16.下列属于数据分析方法的是()。A.回归分析B.时间序列分析D.对比分析17.数据审核关注的主要问题包括()。A.异常值B.缺失值C.逻辑错误三、综合应用题18.一家小微企业共有20位员工,员工的年龄数据如下。请结合数据和所学知识回答下列问题:(1)员工年龄的变量类型是()。A.数值变量B.分类变量C.离散变量D.属性变量(2)在制作员工年龄统计分布表时,第一步是()。A.计算频数B.根据变量的观测值进行分组C计算频率D.整理表格(3)在根据变量观测值进行分组时,第一步是()。A.计算组距C.找到最大值和最小值D.确定组数(4)在Excel中,制作统计分布表用到的主要功能是()。A.数据透视表B.排序和筛选C.分类汇总D.数据分析(5)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最多的年龄组是()。B.33-36岁D.41-44岁(6)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最少的年龄组是()。A.29-32岁(7)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于等于40岁的占比是()。(8)请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于33岁的占比是()。形考任务21.在柱形图中,使用()代表每个类别对应的数值(频数、频率或其他数值结果)。B.面积C.高度D.宽度2.在饼图中,使用圆内扇形()表示数值大小。C.半径D.弧度3.散点图是描述()变量之间关系的图形。C.三个D.四个4.现在有关于两支球队的几项关键数据,为了横向对比两支球队的表现,适合采取的数据可视化方法是()。A.气泡图B.直方图C.散点图D.雷达图5.在热力图中,用来反映变量取值变化规律的特征是()。A.颜色B.大小C.形状D.线条类型6.当数据中存在异常值时,不适合用于度量变量分布特征的指标是()。A.众数B.中位数D.四分位数7.已知总体容量为N,抽取了一个样本量是n的样本,则在样本方差的计算公式中,分母是()。8.变异系数的计算结果是一个()。A.相对数B.绝对数C.平均数D.正数9.对于右偏分布而言,在箱线图中,中位数更靠近()的位置。A.上四分位数B.下四分位数D.最大值10.对于对称分布而言,直方图的形状呈现()特征。A.平缓B.右偏D.左偏11.度量事件发生可能性的测量指标是()。A.随机变量B.随机试验C.概率12.在正态分布中,共有()参数。13.假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<0.3),计算结果是()。14.假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<?)=0.38,求解得到?的结果是()。15.点估计方法背后的理论依据是()。A.大数定律B.中心极限定理C.中值定理D.拉格朗日定理16.在假设检验中,显著性水平实质上代表的是()。A.置信水平B.估计的准确率C.犯第一类错误的概率D.犯第二类错误的概率17.为了解学习者在线学习情况,课题研究组从某校本科生和专科生中分别各随机抽取了1000人,调查每日在线学习时长(分钟)。根据调查数据计算度量指标,结果如下表所示:本科生专科生平均值样本均值的标准差中位数众数标准差方差峰值偏度最小值最大值求和样本值(1)本次搜集数据的抽样方法是()。A.简单随机抽样B.分层抽样C.整群抽样D.雪球抽样(2)描述学习者每日学习时长分布的数据可视化方法是()。A.雷达图B.散点图(3)下列数据可视化方法中,适合描述本科生每日平均学习时长与专科生每日平均学习时长对比的是()。A.柱形图C.气泡图D.直方图(4)下列数据可视化方法中,适合用于对比分析本科生与专科生多个相关指标的是()。A.柱形图B.直方图C.气泡图(5)在Excel中,计算样本方差的函数是()。(6)根据偏度的计算结果可知,本科生组与专科生组的分布形状分别属于(7)在95%置信水平下,计算专科生组关于总体均值的置信区间,结果是(8)有研究显示,该校本科生的平均在线学习时长等于200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,假设检验的拒绝域在()。A.抽样分布的左侧B.抽样分布的右侧C.抽样分布的两侧D.抽样分布的中间(9)有研究显示,该校本科生的平均在线学习时长为200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,适合的检验统计量是()。A.Z统计量B.t统计量C.F统计量D.卡方统计量(10)在Excel中进行假设检验的计算时,计算临界值会用到的函数是()。CNORM.S.INV函数(11)在Excel中求解本科生组和专科生组区间估计结果时,用于计算估计误差的函数是()。A.CONFIDENCE.NORM函数(12)在Excel中进行假设检验的计算时,计算P值会用到的函数是()。D.NORM.S.DIST函数形考任务31.下列属于结构相对数的是()。A.恩格尔系数2.下列属于比例相对数的是()。C.运输量定基增长率之间的不平衡性的对比分析方法是()。4.一家企业2023年计划生产商品1000件,实际完成500件,按照计划完成度相对数的计算公式可得,产量的计划完成相对数是()。5.线性相关系数的取值范围是()。6.如果两个变量的线性相关系数计算结果是0.7,则说明二者之间可能存在()。A.线性负相关B.线性正相关C.不相关D.完全线性正相关7.下列属于时点时间序列的是()。A.年末总资产B.第一季度营业收入C.年净资产收益率8.平稳时间序列只包含()成分。A.不规则性B.趋势C.周期性D.季节性9.已知某商场三种商品的销售资料,如下表所示,请根据表中信息回答问题。单价(元)报告期ql报告期pl报告期(销售量)*报告期(单价)*基期(单价)基期(销售量)*报告期(单价)甲乙四台件77a5【1】(1)拉氏销售量指数属于()。A.数量指标指数B.质量指标指数C.个体指数D.平均指数(2)帕氏价格指数属于()。A.数量指标指数C.个体指数D.平均指数(3)在表格中,计算【1】位置上数值的方式包括()。(4)根据表格数据计算帕氏销售量指数,计算公式正确的是()。(5)根据平均指数与综合指数的关系,与报告期总值加权的销售量调和平均指数结果一致的是()。A.拉氏价格指数C.帕氏价格指数D帕氏销售量指数10.表1给出了一组消费性支出和可支配收入的数据。为了探究两个变量之间的联系,基于Excel工具,使用相关分析、回归分析等方法展开研究,结果如图1所示。(图略)(1)从散点图中,可以得到的初步结论是()。A.消费性支出和可支配收入之间的关系几乎呈现线性特征B.消费性支出和可支配收入之间的关系呈现二次函数特征C.消费性支出和可支配收入之间不存在明确的关系特征D.消费性支出和可支配收入之间的关系呈现三次函数特征(2)相关分析结果的含义是()。A.消费性支出和可支配收入之间存在高度线性负相关关系B.消费性支出和可支配收入之间存在低度线性正相关关系C.消费性支出和可支配收入之间存在高度线性正相关关系D.消费性支出和可支配收入之间存在不存在线性相关关系(3)从回归分析的Excel输出结果看,模型拟合优度检验中R平方的值是()。(4)从回归分析的Excel输出结果看,F检验的P值远远小于0,说明模型的显著性检验结论是()。A.两个变量之间的线性关系不显著B.两个变量之间的线性关系显著C.两个变量之间的非线性关系显著D.两个变量之间的无明显关系(5)根据回归分析结果,可以写出最终估计得到的一元线性回归方程的表达式是()。(6)回归系数b的估计值的含义是()。A.每增加2元的可支配收入,消费性支出平均增加0.53元B.每增加1元的消费性支出,可支配收入平均增加0.53元C.每增加2元的消费性支出,可支配收入平均增加0.53元D.每增加1元的可支配收入,消费性支出平均增加0.53元11.现有数据如下表所示年份年末人口数(万人)最终消费(亿元)请结合数据回答下列问题:(1)现在需要使用数据可视化方法描述2015-2020年年末人口数变化情况,请选择适合的数据可视化方法()。A.散点图B.折线图C.直方图D.饼图(2)现在需要使用数据可视化方法描述年末人口数与最终消费之间的关系,请选择适合的数据可视化方法()。A.散点图B.折线图C.直方图(3)计算2015-2020年最终消费序列平均发展水平的公式是()。年最终消费数值的加权平均数年最终消费数值的加权平均数年最终消费数值的算术平均数D.2015-2020年最终消费数值的算术平均数(4)以2015年为基期,年末人口数2017年的环比发展速度等于()。(5)2015-2020年最终消费的平均发展速度为()。(6)在使用Excel计算定基发展速度时,会用到绝对引用符号,表示正确的形考任务4(实践任务)姓名学号所在分部一、背景与目的(一)背景介绍磁流体是一种新型的功能材料,它是由磁性纳米颗粒分散在基液中形成的稳定胶体体系。由于其独特的物理化学性质,如在磁场作用下可改变自身的流变性能等,在密封、润滑、医学、传感器等众多领域有着广泛的应用前景。(二)实际业务或实际问题说明在磁流体的实际应用中,其力学性能是决定其使用效果和寿命的关键因素。例如,在密封应用中,磁流体需要承受一定的压力差,并且在长期使用过程中保持良好的密封性能;在润滑领域,磁流体需要在不同的负载和速度条件下提供稳定的润滑效果。然而,磁流体的力学性能受到多种因素的影响,包括磁性颗粒的种类、浓度、粒径,基液的性质,以及外加磁场的强度和方向等。(三)开展数据分析的原因、意义目前,对于磁流体力学性能的研究还存在一些不足。一方面,不同实验条件下得到的数据较为分散,缺乏系统的分析;另一方面,实际应用中需要更准确地预测磁流体在特定条件下的力学性能,以便优化设计和提高产品性能。因此,开展本数据分析的意义在于:通过对大量实验数据的综合分析,揭示磁流体力学性能与各影响因素之间的定量关系,为磁流体材料的优化设计和实际应用提供理论依据。二、分析思路(一)数据分析流程本次分析主要包括以下步骤:1、数据收集:从已有的实验研究报告、学术文献以及本实验室的实验数据中获取关于磁流体力学性能的数据。2、数据整理与清洗:对收集到的数据进行整理,去除重复、错误或不完整的数据记录。3、数据分析方法选择:根据数据特点和研究目的,选择合适的数据分析方法,包括相关性分析、回归分析和主成分分析等。4、结果验证与解释:通过交叉验证等方法验证分析结果的可靠性,并结合磁流体的物理机制对结果进行解释。(二)具体分析方法1、相关性分析:用于研究磁流体力学性能(如剪切应力、粘度等)与各影响因素(如磁性颗粒浓度、粒径、磁场强度等)之间的线性相关程度,确定哪些2、回归分析:在相关性分析的基础上,建立磁流体力学性能与关键影响因素之间的定量回归模型,以便预测磁流体在不同条件下的力学性能。3、主成分分析:当影响因素较多且存在一定相关性时,通过主成分分析提取主要影响因素,简化数据结构,同时减少分析过程中的信息损失。(一)数据来源及变量说明1、数据来源(1)国内外权威学术数据库中关于磁流体力学性能的研究论文,涵盖了近(2)本实验室进行的一系列磁流体实验数据,实验过程中严格控制了各种条件,包括磁性颗粒的制备、基液的选择以及磁场的施加方式等。2、变量说明(1)因变量(力学性能指标):单位为Pa,是衡量磁流体在流动过程中力学性能的重要指标。②粘度(η):表示磁流体抵抗流动的能力,单位为Pa·s。粘度的大小与磁流体的内部结构、颗粒间相互作用以及磁场作用密切相关。(2)自变量(影响因素):①磁性颗粒浓度(C):以质量分数表示,即磁性颗粒质量占磁流体总质量的比例,单位为%。磁性颗粒浓度对磁流体的力学性能有显著影响,浓度越高,颗粒间相互作用越强。②磁性颗粒粒径(d):单位为nm,粒径大小影响颗粒的表面积和磁矩,进③磁场强度(H):单位为A/m,磁场强度是决定磁流体在磁场作用下力学密度、粘度、极性等)会影响磁流体的整体力学性能。(二)数据预处理1、数据审核对收集到的数据进行了全面的审核,主要检失值较多的数据记录进行了标记或删除。度超过了理论上的最大溶解度,则认为该数据可能存在错误。2、数据清洗系,采用均值填充、线性插值等方法进行补充。对于缺失值较多的数据记录(超过总数据量的20%),则予以删除。差等原因导致的异常值,根据具体情况进行(三)数据分析1、相关性分析通过计算Pearson相关系数来分析力学性能指标与各影响因素之间的相关剪切应力(t)粘度(n)磁性颗粒浓度(C)磁性颗粒粒径(d)磁场强度(H)基液类型(T)2、回归分析基于相关性分析结果,选择磁性颗粒浓度(C)和磁场强度(H)作为自变量,分别建立剪切应力(T)和粘度(η)的线性回归模型:对于剪切应力(T):对于粘度(η):考虑到影响因素较多,为了进一步简化数据结构,对所有自变量(磁性颗粒浓度、粒径、磁场强度、基液类型)进行主成分分析。通过计算得到主成分的特贡献率(%)累计贡献率(%)5根据特征值大于1的原则,选择前两个主成分PC1和PC2。PC1主要与(一)结论1、通过相关性分析可知,磁流体的剪切应力和粘度与磁性颗粒浓度、磁场2、建立的线性回归模型能够较好地描述磁流体力学性能与磁性颗粒浓度、磁场强度之间的定量关系,可用于预测磁
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新高一化学暑假衔接(人教版):第17讲 元素周期律【学生版】
- 世界精神卫生日宣传方案
- 车险网络客服培训课件
- 能量芯节电产品营销招商方案计划书
- 马莲台煤矿应急预案考试试卷
- 2026年企业自查自纠整改报告4篇
- (2025年)保障性住房供需研究报告
- 2025年隐私计算技术在企业数据共享中的实践路径研究报告
- 2026年开展全国助残日活动总结(2篇)
- 银行合规管理制度实施监督
- TGXAS-火龙果品质评价技术规范编制说明
- (2025)70周岁以上老年人换长久驾照三力测试题库(含答案)3
- 口腔科门诊主任年度工作汇报
- 福建省能源石化集团有限责任公司2025年秋季招聘备考题库及一套完整答案详解
- 2025年新闻记者资格证及新闻写作相关知识题库附答案
- DB32∕T 5188-2025 经成人中心静脉通路装置采血技术规范
- 深圳市2024-2025学年九年级上学期期末考试化学试卷(含答案)
- 白车身轻量化设计技术
- 华师 八年级 数学 下册《17.2 平行四边形的判定 》课件
- 主板维修课件
- 2026中央纪委国家监委机关直属单位招聘24人考试笔试模拟试题及答案解析
评论
0/150
提交评论