版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年大数据分析师考试:大数据分析项目实战试题卷考试时间:______分钟总分:______分姓名:______一、Excel数据分析要求:使用Excel工具,对给出的数据进行分析和计算,并得出结论。1.某公司最近一年的销售额数据如下,请计算以下内容:(1)计算各月销售额的同比增长率;(2)找出销售额最高的月份及其销售额;(3)计算销售额的月均增长率;(4)根据同比增长率,将各月销售额分为增长、持平、下降三个类别;(5)将数据按照销售额降序排列;(6)筛选出同比增长率在20%以上的月份。销售额(万元):1月:502月:603月:704月:655月:756月:807月:858月:909月:9510月:10011月:10512月:1102.某班学生的考试成绩如下,请计算以下内容:(1)计算各科的平均分;(2)找出总分最高的学生;(3)计算总分低于60分的学生人数;(4)根据总分,将学生分为优、良、及格、不及格四个类别;(5)将数据按照总分降序排列;(6)筛选出总分在90分以上的学生。学生姓名|数学|英语|物理|化学|总分-------|----|----|----|----|----张三|85|90|80|70|315李四|90|85|75|80|330王五|75|80|85|90|330赵六|70|85|80|75|300钱七|65|70|60|65|2603.某公司最近一年的员工薪资数据如下,请计算以下内容:(1)计算各月薪资的中位数;(2)找出薪资最高的员工;(3)计算薪资低于8000元的员工人数;(4)根据薪资,将员工分为高薪、中薪、低薪三个类别;(5)将数据按照薪资升序排列;(6)筛选出薪资在12000元以上的员工。员工姓名|月薪(元)-------|--------张三|10000李四|9000王五|11000赵六|8000钱七|12000孙八|7000周九|13000吴十|9000郑十一|8000陈十二|6000二、Python编程要求:使用Python语言编写程序,完成以下任务。1.编写一个程序,计算以下斐波那契数列的前20项:0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,2584,41812.编写一个函数,判断一个给定的数是否为素数。例如:判断数字17是否为素数。3.编写一个程序,读取一个文本文件中的内容,统计文件中每个单词的出现次数,并将结果输出到一个新的文件中。4.编写一个程序,使用列表推导式计算1到100之间所有奇数的平方和。5.编写一个函数,计算两个列表的交集和并集。例如:计算列表[1,2,3,4]和[3,4,5,6]的交集和并集。6.编写一个程序,使用循环和条件判断实现冒泡排序算法,对给定的列表进行排序。7.编写一个函数,实现两个整数之间的所有整数的阶乘运算。例如:计算5!和8!的阶乘。8.编写一个程序,实现一个简单的计算器功能,支持加、减、乘、除四种运算。9.编写一个程序,实现一个简单的文件加密和解密功能。使用简单的替换算法进行加密和解密。10.编写一个程序,使用递归方式实现一个函数,计算斐波那契数列的第n项。四、SQL数据库查询要求:使用SQL语句对以下数据库表进行查询,并返回结果。1.假设有一个名为“Employees”的员工表,包含以下字段:EmployeeID(员工ID)、FirstName(名字)、LastName(姓氏)、DepartmentID(部门ID)、Salary(薪水)。请根据以下要求编写SQL查询语句:(1)查询所有部门ID为2的员工的名字和薪水;(2)查询所有薪水高于5000元的员工的姓氏;(3)查询姓氏为“Smith”的所有员工的名字和部门ID;(4)查询薪水排名前三的员工的姓名、薪水和部门ID;(5)查询每个部门平均薪水的最高值;(6)查询没有分配到任何部门的员工的名字。五、数据可视化要求:使用Python的Matplotlib库对以下数据集进行可视化,并展示出相应的图表。1.假设有一个数据集包含以下信息:Date(日期)、Temperature(温度)、Humidity(湿度)。请使用Python编写代码,绘制以下图表:(1)温度随日期变化的折线图;(2)湿度随日期变化的折线图;(3)温度和湿度的散点图;(4)温度和湿度的热力图;(5)温度的直方图;(6)湿度的直方图。六、数据分析报告撰写要求:根据以下数据分析结果,撰写一份简短的数据分析报告。1.假设有一个数据集包含以下信息:ProductID(产品ID)、Sales(销售额)、Month(月份)。请根据以下要求进行分析,并撰写报告:(1)计算每个产品的月均销售额;(2)找出销售额最高的产品;(3)计算销售额在10000元以上的月份数量;(4)分析销售额随时间的变化趋势;(5)根据销售额将产品分为高、中、低三个类别;(6)撰写一份总结,包括分析结果和结论。本次试卷答案如下:一、Excel数据分析1.(1)同比增长率计算公式为:(本月销售额-上月销售额)/上月销售额*100%-1月同比增长率:(50-0)/0*100%=无效数据-2月同比增长率:(60-50)/50*100%=20%-3月同比增长率:(70-60)/60*100%=16.67%-4月同比增长率:(65-70)/70*100%=-7.14%-5月同比增长率:(75-65)/65*100%=15.38%-6月同比增长率:(80-75)/75*100%=6.67%-7月同比增长率:(85-80)/80*100%=6.25%-8月同比增长率:(90-85)/85*100%=5.88%-9月同比增长率:(95-90)/90*100%=5.56%-10月同比增长率:(100-95)/95*100%=5.26%-11月同比增长率:(105-100)/100*100%=5%-12月同比增长率:(110-105)/105*100%=4.76%(2)销售额最高的月份为12月,销售额为110万元。(3)月均增长率计算公式为:(12月销售额-1月销售额)/1月销售额*100%-月均增长率:(110-50)/50*100%=120%(4)同比增长率分类:-增长:2月、5月、6月、7月、8月、9月、10月、11月-持平:1月-下降:4月(5)销售额降序排列:-12月:110万元-11月:105万元-10月:100万元-9月:95万元-8月:90万元-7月:85万元-6月:80万元-5月:75万元-4月:65万元-3月:70万元-2月:60万元-1月:50万元(6)同比增长率在20%以上的月份:2月、5月、6月、7月、8月、9月、10月、11月2.(1)各科平均分计算公式为:各科成绩总和/科目数量-数学平均分:(85+90+75+70+65)/5=77-英语平均分:(90+85+80+75+70)/5=80-物理平均分:(80+75+85+80+75)/5=78-化学平均分:(70+80+90+75+65)/5=76(2)总分最高的学生为李四,总分为330分。(3)总分低于60分的学生人数为1人(钱七)。(4)总分分类:-优:李四、王五-良:张三-及格:赵六-不及格:钱七(5)总分降序排列:-李四:330分-王五:330分-张三:315分-赵六:300分-钱七:260分(6)总分在90分以上的学生:张三、李四、王五3.(1)各月薪资的中位数计算:-1月:10000-2月:9000-3月:11000-4月:8000-5月:12000-6月:7000-7月:13000-8月:9000-9月:8000-10月:6000-中位数:9000(2)薪资最高的员工为周九,薪资为13000元。(3)薪资低于8000元的员工人数为4人(张三、李四、赵六、陈十二)。(4)薪资分类:-高薪:周九-中薪:张三、李四、王五、赵六、钱七、吴十、郑十一-低薪:陈十二(5)薪资升序排列:-陈十二:6000元-张三:10000元-李四:9000元-王五:11000元-钱七:9000元-赵六:8000元-吴十:9000元-郑十一:8000元-周九:13000元(6)薪资在12000元以上的员工:周九二、Python编程1.斐波那契数列计算:```pythondeffibonacci(n):ifn<=1:returnnelse:returnfibonacci(n-1)+fibonacci(n-2)fibonacci_sequence=[fibonacci(i)foriinrange(20)]print(fibonacci_sequence)```2.判断素数函数:```pythondefis_prime(num):ifnum<=1:returnFalseforiinrange(2,int(num**0.5)+1):ifnum%i==0:returnFalsereturnTrueprint(is_prime(17))#输出:True```3.统计单词出现次数:```pythondefcount_words(file_path):word_count={}withopen(file_path,'r')asfile:forlineinfile:words=line.strip().split()forwordinwords:ifwordinword_count:word_count[word]+=1else:word_count[word]=1returnword_count#假设文本文件名为"text.txt"word_count=count_words("text.txt")print(word_count)```4.计算奇数平方和:```pythonodd_square_sum=sum([i**2foriinrange(1,101,2)])print(odd_square_sum)```5.列表交集和并集:```pythondefintersection(lst1,lst2):returnlist(set(lst1)&set(lst2))defunion(lst1,lst2):returnlist(set(lst1)|set(lst2))lst1=[1,2,3,4]lst2=[3,4,5,6]print(intersection(lst1,lst2))#输出:[3,4]print(union(lst1,lst2))#输出:[1,2,3,4,5,6]```6.冒泡排序算法:```pythondefbubble_sort(lst):n=len(lst)foriinrange(n):forjinrange(0,n-i-1):iflst[j]>lst[j+1]:lst[j],lst[j+1]=lst[j+1],lst[j]returnlstlst=[64,34,25,12,22,11,90]print(bubble_sort(lst))```7.计算阶乘:```pythondeffactorial(num):ifnum==0:return1else:returnnum*factorial(num-1)print(factorial(5))#输出:120print(factorial(8))#输出:40320```8.简单计算器功能:```pythondefcalculator():operation=input("Enteranoperation(+,-,*,/):")num1=float(input("Enterfirstnumber:"))num2=float(input("Entersecondnumber:"))ifoperation=='+':print("Result:",num1+num2)elifoperation=='-':print("Result:",num1-num2)elifoperation=='*':print("Result:",num1*num2)elifoperation=='/':ifnum2!=0:print("Result:",num1/num2)else:print("Error:Divisionbyzero")else:print("Error:Invalidoperation")calculator()```9.文件加密和解密:```pythondefencrypt(text,shift):encrypted_text=""forcharintext:ifchar.isalpha():shift_amount=shift%26ifchar.islower():encrypted_text+=chr((ord(char)-ord('a')+shift_amount)%26+ord('a'))else:encrypted_text+=chr((ord(char)-ord('A')+shift_amount)%26+ord('A'))else:encrypted_text+=charreturnencrypted_textdefdecrypt(encrypted_text,shift):decrypted_text=""forcharinencrypted_text:ifchar.isalpha():shift_amount=shift%26ifchar.islower():decrypted_text+=chr((ord(char)-ord('a')-shift_amount)%26+ord('a'))else:decrypted_text+=chr((ord(char)-ord('A')-shift_amount)%26+ord('A'))else:decrypted_text+=charreturndecrypted_text#加密text="Hello,World!"shift=3encrypted_text=encrypt(text,shift)print("Encryptedtext:",encrypted_text)#解密decrypted_text=decrypt(encrypted_text,shift)print("Decryptedtext:",decrypted_text)```三、SQL数据库查询1.SQL查询语句:```sql--(1)查询部门ID为2的员工的名字和薪水SELECTFirstName,LastName,SalaryFROMEmployeesWHEREDepartmentID=2;--(2)查询薪水高于5000元的员工的姓氏SELECTLastNameFROMEmployeesWHERESalary>5000;--(3)查询姓氏为“Smith”的所有员工的名字和部门IDSELECTFirstName,LastName,DepartmentIDFROMEmployeesWHERELastName='Smith';--(4)查询薪水排名前三的员工的姓名、薪水和部门IDSELECTFirstName,LastName,Salary,DepartmentIDFROMEmployeesORDERBYSalaryDESCLIMIT3;--(5)查询每个部门平均薪水的最高值SELECTMAX(AvgSalary)FROM(SELECTAVG(Salary)ASAvgSalary,DepartmentIDFROMEmployeesGROUPBYDepartmentID)ASSubQuery;--(6)查询没有分配到任何部门的员工的名字SELECTFirstName,LastNameFROMEmployeesWHEREDepartmentIDISNULL;```四、数据可视化1.温度随日期变化的折线图:```pythonimportmatplotlib.pyplotaspltdates=['1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月']temperatures=[15,20,25,30,35,40,45,50,55,60,65,70]plt.plot(dates,temperatures)plt.xlabel('日期')plt.ylabel('温度')plt.title('温度随日期变化')plt.show()```2.湿度随日期变化的折线图:```pythonimportmatplotlib.pyplotaspltdates=['1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月']humidity=[50,60,70,80,90,100,110,120,130,140,150,160]plt.plot(dates,humidity)plt.xlabel('日期')plt.ylabel('湿度')plt.title('湿度随日期变化')plt.show()```3.温度和湿度的散点图:```pythonimportmatplotlib.pyplotaspltdates=['1月','2月','3月','4月','5月','6月','7月','8月','9月','10月','11月','12月']temperatures=[15,20,25,30,35,40,45,50,55,60,65,70]humidity=[50,60,70,80,90,100,110,120,130,140,150,160]plt.scatter(temperatures,humidity)plt.xlabel('温度')plt.ylabel('湿度')plt.title('温度和湿度散点图')plt.show()```4.温度和湿度的热力图:```pythonimportmatplotlib.pyplotaspltimportnumpyasnptemperatures=[15,20,25,30,35,40,45,50,55,60,65,70]humidity=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省肇庆市重点校2025-2026学年高二化学下学期4月期中测试试题【含答案】
- 变电所值班外包合同
- 实习期签订劳务外包合同
- 黄江餐厅饭堂外包合同
- 电信线路施工外包合同
- 小区保洁绿化外包合同
- 小区物业保安外包合同
- 学校艺术培训外包合同
- 内部合同员工转外包合同
- 刺力王销售签外包合同
- 建筑工程项目汇报ppt
- 2023年江苏第二师范学院招聘工作人员17人笔试备考试题及答案解析
- 人教版一年级数学下册《第8单元 总复习 第1节 数与代数》课堂教学课件PPT小学公开课
- 火力发电厂金属技术监督规程解读
- 特种加工技术课件第11章 高压水射流加工
- YS/T 96-2009散装浮选铜精矿中金、银分析取制样方法
- 最新人教部编版六年级下册语文《古诗词诵读:春夜喜雨》教学课件
- 超市经营服务投标方案
- 高血压中医健康教育专家讲座
- 不稳定型心绞痛共30张课件
- 冠心病的三级预防及康复治疗和社区管理要求
评论
0/150
提交评论