《人工智能导论》课件-04.DeepSeek驱动数据洞察与分析_第1页
《人工智能导论》课件-04.DeepSeek驱动数据洞察与分析_第2页
《人工智能导论》课件-04.DeepSeek驱动数据洞察与分析_第3页
《人工智能导论》课件-04.DeepSeek驱动数据洞察与分析_第4页
《人工智能导论》课件-04.DeepSeek驱动数据洞察与分析_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ArtificialIntelligenceDeepSeek驱动数据洞察与分析项目4学习目标知识目标1掌握DeepSeek工具的多模态数据分析功能理解数据清洗对分析结果准确性的关键作用熟悉职场数据分析的标准流程技能目标2能够使用Excel完成数据预处理能够设计精准的DeepSeek指令能够将DeepSeek分析结果整合至PPT,生成结构化报告。素质目标3培养严谨性的工作态度培养多个工具协同创作的逻辑能力1数据分析能力拆解数据收集:想要更好的将AI用于数据分析中,我们就要先弄清楚数据分析的工作分为几个部分,下面列举一下:01数据预处理确保数据的质量和完整性,从可靠的来源收集数据。数据清洗:处理缺失值、异常值和重复数据,确保数据的准确性和一次性。数据整理:将数据转换为适合分析的格式,进行必要的转换和标准化。数据预处理数据收集:多数数据分析工作的数据都是来自于公司内部,不过有些场景下我们需要一些网络数据作为参考,我们可以开启DeepSeek的联网搜索模式进行数据获取。示例如下:模版:我要XXXXX,请给我提供一些数据,并注明数据来源。为了确保数据真实性,记得要让DeepSeek标注数据来源,(不要忘记勾选联网搜索)数据预处理数据清洗:数据清洗是数据分析中很重要的一个过程,我们可以让DeepSeek给出我们一些清洗建议,也可以直接让它返回清洗好的数据。模板:看一下整个数据表中有哪些数据需要清洗。模板:看一下A列中有哪些异常数据。示例如下(进行部分提取):数据预处理数据清洗:1数据分析能力拆解数据可视化02数据图表使用图表、图形和仪表板等工具将数据可视化,帮助识别趋势、模式和异常。探索性数据分析通过可视化手段探索数据的基本特征,发现潜在的关系和结构。数据图表数据可视化DeepSeek暂不支持直接生成数据图表,ChatGPT这种多模态模型生成的内容你也会觉得“差点意思”。其实对于数据图表来说,我们不需要刻意的使用DeepSeek这种大模型去寻找答案,很多AI工具对于数据图表的智能化可以说是遥遥领先,举例说明一下:①Excel+DeepSeekDeepSeek生成公式+Excel人工操作=Excel图表WPS:WPS中设有付费AI功能可以智能生成图表②Python+DeepSeek对于会进行编程的人来说,我们让DeepSeek生成绘图代码,我们调整参数即可生图。数据图表数据可视化总结:在数据可视化的情景下使用DeepSeek的核心思想就是“问”①问XXX数据应该做什么图?②问Excel公式怎么写?③问XXX工具想要实现XXX该怎么操作?④问XXX图的Python代码该怎么写?1数据分析能力拆解预测建模03模型构建使用机器学习等技术构建预测模型,预测未来趋势和结果。统计分析应用统计方法检验假设,评估变量之间的关系。模型构建预测建模数据分析中有很多任务需要用到机器学习,例如对用户群进行分类、聚类,对DAU、GMV等指标进行预测等等。这些任务直接交给DeepSeek即可。注意:小数据可以直接上传或输入,大量数据就让DeepSeek生成代码自己本地运行一下吧。模板:[...],这是XXX数据,预测一下XXX模板:上传Excel+这是XXX数据,"请使用A,B,C"三个特征进行用户聚类。模板:给我一段...算法的Python代码。模型构建预测建模模型构建统计分析数据分析工作中我们经常需要进行数据的显著性检验,这个过程我们可以交由DeepSeek来进行。模板:数据组数+场景+检验方法+示例数据模板:数据+具体检验方法(请将下列数据进行配对样本T检验,数据如下......)这里如果不知道该进行具体的哪种检验,直接告诉他数据来源(同源/异源),让其进行显著性检验即可。模型构建统计分析1数据分析能力拆解策略制定04决策根据数据分析的结果,制定或调整业务测量和行动计划。洞察提取从数据中提取有价值的洞察,支持业务决策。数据解释基于分析结果,解释数据的意义和影响决策数据解析解释数据通常就是找到数据中的趋势、关键指标变化等内容,我们直接将数据丢给DeepSeek让它自动的解释一下整体数据或者解释某些字段即可。模板示例:分析一下男性用户的消费习惯。模板示例:分析一下新用户的流失情况。洞察提取我们可以让DeepSeek从数据中分析出一些有意义的拐点,我们可以指定人群、指标等。决策我们还可以上传数据让DeepSeek帮我们进行相关性分析,异常值/异常行为检测等。模板示例:分析一下客户满意度与售后服务响应时间的相关性模板示例:分析一下该用户行为数据中的异常行为用户,并给出原因。策略制定对于策略,我们可以告诉DeepSeek你的业务场景,让它给出你一些可以参考的“辅助性决策”,示例如下:模板示例:我从事电商销售行业,请帮我针对高价值用户的回流,给出一些策略。决策模板示例:我从事电商销售行业,请帮我针对高价值用户的回流,给出一些策略。每个人所处的业务场景是不同的,我们可以根据自己的业务场景调整提问方式,不过要记住,DeepSeek做的是“辅助性决策”,如果要参考它的回答一定要要仔细斟酌一下。1数据分析能力拆解报告撰写05沟通和报告编写详细的分析报告,包括方法、结果、结论和建议。结果呈现将分析结果以清晰、简洁的方式呈现给非技术背景的决策者。沟通和报告结果呈现结果呈现的方式有很多种,作为数据分析师,最拿手的就是用报告、用数据、用图去展示,但是很多人不会向不懂数据的人(不要带入你的领导)去描述,最后导致好的数据没有被重视,这个时候我们就要启动DeepSeek强大的沟通能力了。模板:如何向不懂数据分析的人解释XXX模板:用三岁小孩都能听懂的方式解释XXX模板:解释一下XXX,说人话沟通和报告报告撰写你一定从某个介绍DeepSeek的文章上看到过,DeepSeek能快速制作数据分析报告的介绍。从事过数据分析工作的人应该都清楚,报告的撰写是有针对性,结合业务和实际场景的,有很多干扰因素是AI捕捉不到的。和上面提到的决策同样的思路,我们可以让DeepSeek生成报告大纲进行参考,看一下有哪些点可以让我们的报告锦上添花。举个例子:沟通和报告报告撰写1数据分析能力拆解软件工具06工具和技术熟练使用数据分析软件和编程语言,如Python、Excel等技术方法掌握数据挖掘、机器学习、人工智能等先进技术方法。工具和技术软件工具DeepSeek不仅能够告诉我们如何操作Excel,还可以直接给出我们想要实现的代码,让我们节省大量的工作时间,DeepSeek分析新能源汽车行业趋势生成可视化报告实训四全球新能源汽车高速增长,政策技术环保共驱TaskContents目

录4.1任务背景4.2相关知识4.3任务实施1.严谨求实:通过数据分析与报告制作,培养学生一丝不苟的职业素养;2.绿色发展:结合新能源汽车行业分析,引导学生践行绿色低碳的发展理念。思政元素有机融入4.1任务背景全球新能源汽车行业正处于高速增长期,政策驱动、技术进步与环保需求共同推动新能源汽车产业变革。各国“碳中和”目标加速传统车企电动化转型,中国、欧洲等市场渗透率持续提升,电池技术的突破和充电基建完善缓解续航焦虑,智能化的自动驾驶、车联网等技术也成为企业之间竞争的新焦点。同时,供应链波动、技术标准差异及全球化竞争,也不断加剧行业的不确定性。在本节内容中,将通过对新能源汽车行业趋势的分析,生成可视化报告,报告通过数据可视化显示,从而能够解析市场格局、技术路径、政策影响及未来趋势等内容,为行业参与者提供战略参考。4.1任务背景在传统分析方式下,某咨询公司需在8小时内完成《2025年新能源汽车市场洞察报告》,传统操作模式存在以下局限:数据收集低效,需从工信部、企业年报、充电平台等10+个独立系统手动导出数据,耗时较长,且字段格式不统一,人工计算复杂。内容上,竞品对比的数据分析粗糙,人工整理TOP5品牌市占率时,跨文件复制粘贴易造成内容上的混淆,可能导致错误率较高。使用基于DeepSeek进行多模态融合分析与智能建模技术,能够实现多源数据整合、自动抓取及清洗分散数据,进行智能化的建模和趋势分析,生成动态敏感性分析报告,全自动的报告生成,并输出含交互式图表的标准化报告。通过以上操作,能够实现新能源汽车全面的数据分析,从而推动行业分析向数据驱动的智能化分析转型。Contents目

录4.1任务背景4.2相关知识4.3任务实施4.2相关知识4.2.1Deepseek在数据分析中的作用应用DeepSeek能够在新能源汽车数据分析中扮演智能中枢角色,通过多维度技术整合与深度推理能力,为行业研究、企业决策及政策制定提供关键支持。其核心作用体现在以下方面:1.多源异构数据整合DeepSeek能够进行结构化解析,自动提取PDF格式政策文件中的补贴条款、技术标准,解析Excel中的销量、成本及供应链数据,同步抓取PPT中的技术路线图与市场预测图表,消除数据孤岛。然后,构建动态知识库,将电池技术参数等数据融合为统一知识图谱,支持“技术-成本-政策”的关联查询。DeepSeek的结构化解析2.趋势预测与风险预警DeepSeek构建市场动态建模DeepSeek能够构建市场动态建模,基于Excel格式历史销量数据与取PDF格式政策时间节点,预测2025-2030年区域市场渗透率,识别潜在增长瓶颈。对比固态电池量产时间轴、专利布局数据,预判技术路线竞争格局。4.2相关知识4.2.1Deepseek在数据分析中的作用3.决策支持与场景应用通过对成本结构的竞品分析,推荐降本路径。针对“以旧换新”政策,预计每年的新增销量,预测换新政策对消费需求的拉动效应。4.2相关知识4.2.1Deepseek在数据分析中的作用4.2相关知识4.2.2Deepseek处理多文档的原理DeepSeek在处理多格式文档,如PPT、Excel、PDF等不同格式时,基于以下原理实现高效信息整合与分析:1.结构化解析与格式适配对PPT提取标题、段落层级和图表说明,保留逻辑顺序,处理Excel时解析数值、公式及元数据,识别数据模式和统计特征。分析PDF时区分文本、表格及图像区域,结合OCR技术还原扫描内容的结构化信息。所有解析均注重保留语义关系和上下文关联,确保原始信息的完整性。DeepSeek根据文档类型定制解析策略2.跨文档语义关联与知识融合通过自然语言处理技术提取实体、主题及关系,建立跨格式统一知识框架。自动对齐文档中的同名实体,如企业名称、产品名称,构建语义关联网络。识别文本描述与表格数据的隐含联系,融合多源信息,动态生成知识图谱,以节点关系图呈现事件、人物及数据的复杂交互,支撑深层次趋势推演与决策分析。4.2相关知识4.2.2Deepseek处理多文档的原理3.多模态验证与智能推理结合文本、表格及图像进行交叉验证,检测逻辑一致性。对比图表结论与原始数据的匹配度,识别跨文档的矛盾点,如表述上的冲突。支持自然语言提问,通过检索增强技术定位关联内容,输出基于多文档联合推理的结论,确保分析结果的可靠性与可解释性。4.2相关知识4.2.2Deepseek处理多文档的原理4.2相关知识4.3Deepseek实现多文档处理的流程DeepSeek采用分层处理机制实现高效分析。通过分阶段的结构化处理、语义关联与多模态验证,DeepSeek实现从异构文档中提取技术演进、市场分化及政策驱动的核心趋势,为决策提供高可信度分析框架。假设用户询问“针对新能源汽车行业趋势,生成可视化报告”,Deepseek的处理流程如下:3.多模态验证与智能推理2.跨文档语义关联与知识融合1.结构化解析与格式适配对PPT提取章节标题、技术路线图及图表注释,解析Excel中的销量增长率与成本曲线结构化数据表,识别PDF政策文件的段落层级与关键词分布,实现多格式文档的标准化语义解析与格式适配。建立“电池技术迭代—成本下降—政策补贴”跨文档关联网络,对齐PPT技术节点、Excel成本数据与PDF政策文本,生成“技术渗透率”“区域竞争力”等融合指标,构建动态知识图谱支撑趋势推演。交叉验证PPT预测与Excel历史数据趋势一致性,检测政策目标与技术路线的逻辑冲突,溯源数据来源,输出多模态交叉验证的行业趋势结论。Contents目

录4.1任务背景4.2相关知识4.3任务实施4.3任务实施本任务通过DeepSeek分析新能源汽车行业趋势并生成可视化报告,以:最终实现“数据清洗-分析-报告生成”闭环,AI输出的透明逻辑与核心结论直接转化为报告关键内容。精准提问驱动AI输出可执行方案用户输入聚焦数据清洗(如缺失值填充规则)指标计算(渗透率/出口增速公式)区域产业链量化分析(HHI指数)引导AI提供结构化操作步骤行业融合洞察(如BEV/PHEV分类、供应链优势对比)可视化输出(带下载功能的HTML报告代码)1.上传文档,让AI进行分析解读将如图4-7所示的文档上传到AI,对文本进行解析精读。4.3任务实施图4-7DeepSeek选择文件界面2.针对新能源汽车行业数据,对Deepseek进行针对性提问根据任务要求对AI进行提问,从而获取问题结果,对话操作过程如下所示:4.3任务实施(1)我:如何在使用Excel生成热力图和折线图的同时,实现新能源汽车数据清洗(包括删除无效记录、处理缺失值)并输出带下载功能的HTML报告?DeepseekAI:原始数据表:新能源月度产量数据.xls清洗后数据表:clean_data.csv1.无效记录删除

无效记录定义:整行数据完全为空或包含非数值字符(如文本、符号)。

处理结果:未发现完全空白的行或非数值字符,未删除任何记录。2.缺失值处理数值型字段

规则:使用相邻月份(前一个月和后一个月)的均值填充缺失值。若相邻月份无数据,则跳过或标记为“不可填充”。

处理结果:当期值(万辆):

2024年2月:缺失

用2024年1月(无数据)和2024年3月(88.4)的均值填充(仅用后值)→

填充为88.4。

2024年1月:缺失

无前值,用2023年12月(114.1)和后值(2024年2月填充后的88.4)均值

填充为101.25。累计值(万辆):

2024年1月:缺失

根据当期值填充后,重新计算累计值(2023年12月累计值944.3+2024年1月当期值101.25)→

填充为1045.55。同比增长(%):

2024年2月:缺失

用2024年1月(无数据)和2024年3月(33.5%)均值(仅用后值)→

填充为33.5%。

2024年1月:缺失

用2023年12月(43.7%)和后值(2024年2月填充后的33.5%)均值

填充为38.6%。累计增长(%):

2024年1月:缺失

用2023年12月(30.3%)和后值(2024年2月填充后的25.6%)均值

填充为27.95%。

文本型字段

规则:标记缺失值为“未分类”。

处理结果:当前数据表无文本型字段,无需处理。3.清洗后数据表(clean_data.csv)<!DOCTYPEhtml><htmllang="zh-CN"><head><metacharset="UTF-8"><title>新能源汽车清洗数据</title><scriptsrc=".com/xlsx-0.20.0/package/dist/xlsx.full.min.js"></script><style>body{font-family:Arial,sans-serif;margin:20px;}table{border-collapse:collapse;margin:20px0;}th,td{border:1pxsolid#ddd;padding:8px;text-align:center;}th{background-color:#f2f2f2;}.download-btn{background-color:#4CAF50;color:white;padding:10px20px;border:none;border-radius:4px;cursor:pointer;}</style></head><body><h2>新能源汽车清洗数据</h2><buttonclass="download-btn"onclick="downloadExcel()">下载Excel</button><divid="table-container"></div><script>//清洗后的数据constcleanData={"当期值(万辆)":{"2025年3月":"129.8","2025年2月":"88.4*","2025年1月":"101.25*",........................"2024年6月":"34.3","2024年5月":"33.9","2024年4月":"33.2","2024年3月":"29.2","2024年2月":"25.6","2024年1月":"27.95*"}};//动态生成表格functionrenderTable(){constcontainer=document.getElementById("table-container");consttable=document.createElement("table");constthead=document.createElement("thead");consttbody=document.createElement("tbody");//表头constheaderRow=document.createElement("tr");headerRow.innerHTML="<th>指标</th>";Object.keys(cleanData["当期值(万辆)"]).forEach(date=>{headerRow.innerHTML+=`<th>${date}</th>`;});thead.appendChild(headerRow);//表格内容Object.entries(cleanData).forEach(([metric,values])=>{constrow=document.createElement("tr");row.innerHTML=`<td>${metric}</td>`;Object.values(values).forEach(value=>{row.innerHTML+=`<td>${value}</td>`;});tbody.appendChild(row);});table.appendChild(thead);table.appendChild(tbody);container.appendChild(table);}//下载ExcelfunctiondownloadExcel(){constwsData=[["指标",...Object.keys(cleanData["当期值(万辆)"])],...Object.entries(cleanData).map(([metric,values])=>[metric,...Object.values(values)])];constws=XLSX.utils.aoa_to_sheet(wsData);constwb=XLSX.utils.book_new();XLSX.utils.book_append_sheet(wb,ws,"清洗数据");XLSX.writeFile(wb,"clean_data.xlsx");}//初始化渲染renderTable();</script></body></html>标注说明:带*的值为填充结果。4.注意事项1.累计值的填充需结合当期值重新计算,确保逻辑一致性。2.若未来需扩展文本字段(如车型分类),需按规则标记“未分类”。清洗完成

2.针对新能源汽车行业数据,对Deepseek进行针对性提问根据任务要求对AI进行提问,从而获取问题结果,对话操作过程如下所示:4.3任务实施(2)我:如何通过Excel计算2023-2025年新能源车市场中纯电与插混车型的渗透率及出口增速对比,并实现可视化分析?DeepseekAI:2023-2025年新能源车市场趋势分析实施指南1.数据准备与指标计算1.1数据来源销量数据:BEV/PHEV销量:从《2025年3月新能源汽车产销情况.pdf》中提取纯电(BEV)和插混(PHEV)车型的月度销量。汽车总销量:从《2025年3月汽车工业产销情况简析.pdf》获取汽车总销量数据(2025年3月总销量291.5万辆)。出口数据:从《2025年3月汽车出口情况简析.pdf》中提取新能源车型分类型出口量(2025年3月新能源出口15.8万辆)。年份BEV销量(万辆)PHEV销量(万辆)汽车总销量(万辆)BEV渗透率PHEV渗透率202345.820.0300.015.3%6.7%202488.435.0320.027.6%10.9%2025127.750.0291.543.8%17.2%表2渗透率对比(2023-2025年)1.2计算公式渗透率=×100%示例:2025年3月BEV销量80万辆,总销量291.5万辆,则渗透率为27.4%。出口增速=

×100%示例:2024年3月BEV出口10万辆,2025年3月出口12万辆,增速为20%。2.关键指标计算示例2.1渗透率对比(2023-2025年)2.2出口增速对比(2024-2025年)表3出口增速对比(2023-2025年)3.数据验证与逻辑说明数据一致性:渗透率计算需与《2025年3月汽车工业产销情况简析.pdf》中的总销量一致。出口量需与《2025年3月汽车出口情况简析.pdf》中的分类型数据匹配。异常值处理:若某月数据缺失(如2025年2月),使用相邻月份均值插补(见清洗步骤)。车型2024年出口量(万辆)2025年出口量(万辆)增速BEV10.012.525%PHEV5.87.326%(3)我:如何通过数据分析评估2025年东部地区新能源车产业链的产能集中度与供应链优势对比?DeepseekAI:2025年东部地区新能源汽车产业竞争格局分析一、区域产能集中度分析产能分布与集中度计算广东:作为新能源汽车第一大省,2024年产量占全国1/4,预计2025年产能进一步扩大。广东省汽车制造业营收目标超1.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论