统计专业实习PPT课件_第1页
统计专业实习PPT课件_第2页
统计专业实习PPT课件_第3页
统计专业实习PPT课件_第4页
统计专业实习PPT课件_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011年经济管理学院统计学专业暑期实习成果汇报 小组成员 易文姗 宋琴琴 路昱 指导老师 徐德义 实习时间 2011年8月20日 2011年8月28日 1 实习概况2 运用Graph菜单制图3 正态性检验4 相关性检验5 聚类分析6 实习总结 实习心得 实习概况 实习主题 运用SPSS软件对广东韶关地区全区及各组地层中不同岩类 不同期次花岗岩侵人体的元素丰度表的相关数据进行整理 简单分析和复杂的统计分析 实习目的 通过上学期学习过的统计学原理等知识来科学地使用Excel和SPSS等统计学工具研究数据 作图等等 从而巩固学习的知识并且为以后的专业知识的学习奠定坚实的基础 实习背景 本次实习是在徐德义老师的指导下 对广东韶关地区全区及各组地层中不同岩类 不同期次花岗岩侵人体的元素丰度表的相关数据的整理和简单分析 韶关 位于东经112 50 114 45 北纬23 5 25 31 之间 地处南岭山脉南部 全境在大地构造上处于华夏活化陆台的湘粤褶皱带 地质构造复杂 火成岩分布极广 地层发育基本齐全 岩溶地貌广布 种类多样 岩类以红色砂砾岩 砂岩 变质岩 花岗岩和石灰岩为主 在地质历史上属间歇上升区 流水侵蚀作用强烈 造成峡谷众多 山地陡峻以及发育成各级夷平面 以山地丘陵地貌为主 自北向南三列弧形山系排列成向南突出的弧形构成粤北地貌的基本格局 北列为蔚岭 大庾岭山地 长140公里 中列为大东山 瑶岭山地 长250公里 南列为起微山 青云山山地 长270公里 其间分布两行河谷盆地 包括南雄盆地 仁化董塘盆地 坪石盆地 乐昌盆地 韶关盆地和翁源盆地 红色岩系构成的丘陵 台地分布较广 特征显著 仁化丹霞山一带以独特的红岩地貌闻名于世 2010年成为世界自然遗产 是中国典型的 丹霞地貌 所在地和命名地 面积约280平方公里 山群呈峰林结构 有各种奇峰异石600多座 南雄 坪石等盆地属红岩类型 南雄盆地幅员较广 岩层有十分丰富的古生物化石 全市境内山峦起伏 高峰耸立 中低山广布 北部地势为全省最高 位于乳源 阳山 湖南省交界的石坑崆 海拔1902米 为广东第一高峰 市区南部地势较低 市区海拨在最低35米 实习安排 2011 07 07与徐德义老师见面 了解实习的基本要求和大致了解实习内容 分配好实习任务和实习小组 并且确定实习时间 与学长贾栗文见面 了解实习办公地点 告知实习时间 互相熟悉 2011 08 20第二小组实习的第一天 拿到实习数据 讨论实习计划和分工 进行第一天数据录入 2011 08 21完成全部数据的录入后 互相修改数据录入的错误 总结心得 计划明天的工作 2011 08 22讨论数据分析的第一步 作图 查阅相关资料 了解数据的背景信息 2011 08 23温习所学的SPSS软件的应用和统计学原理 先着手于一个元素的研究 小组总结心得 2011 08 24继续研究其他元素 讨论各种分析的可行性 2011 08 25开始制定实习报告的书写计划 查阅格式等相关资料 小组分工撰写实习报告任务 2011 08 26撰写实习报告 2011 08 27整合三人的报告 修改内容 2011 08 28提交报告给徐老师 运用Graph菜单作图 图形类别 1 条形图a 简单条形图b 复合条形图c 三维图2 线图a 单线图 打开数据文件 选择Graph LegacyDialogs Bar 打开BarCharts对话框 选择Sample 选择Valuesofindividualcases Define 选择样品数到BarsRepresents 选择岩性到Variable Ok生成条形图 打开数据文件 选择Graph LegacyDialogs Bar 打开BarCharts对话框 选择Clustere 选择Summariesforgroupesofcases define BarsRepresents otherstatistic 选择样品数到Variable 选择时代到Category 选择岩性到DefineClusterby Ok生成条形图 打开数据文件 选择Graph LegacyDialogs Line 打开LineCharts对话框 选择Sample 选择Valuesofindividualcases Define 选择样品数到LineRepresents 选择一个化学元素 Al Mg Ca 到Variable Ok生成单线图 打开数据文件 ChartBuilder 选择时代到X轴 选择样品数到Y轴 选择岩性到Z轴 Ok输出结果 正态性检验 1 图示法 P P图Q Q图直方图箱线图茎叶图2 偏度和峰度3 W检验 P P图 判断方法 以样本的累计频率作为横坐标 以按照正态分布计算的相应累计概率作为纵坐标 以样本值表现为直角坐标系的散点 如果数据服从正态分布 则样本点应围绕第一象限的对角线分布 操作步骤 打开数据文件 Analyze DescriptiveStatistics P P 打开P PPlots对话框 将Al Mg Ca等三十七种化学元素选入Variables Ok输入结果 正态性较好的元素P P图及去势的P P图 正态性较差的元素P P图及去势的P P图 Q Q图 判断方法 以样本的分位数作为横坐标 以按照正态分布计算的相应分位点作为纵坐标 把样本表现为直角坐标系的散点 如果数据服从正太分布 则样本点应围绕第一象限的对角线分布 与P P图相比 Q Q图较佳 效率较高 操作方式 打开数据文件 Analyze DescriptiveStatistics Q Q 打开Q QPlots对话框 将Al Mg Ca等三十七种化学元素选入Variables Ok输入结果 正态性好的Q Q图及去势Q Q图 正态性较差的Q Q图及去势Q Q图 直方图 箱线图 茎叶图 偏度和峰度 W检验 分析的元素 1 Cr和Ti 2 Fe和Co 3 Nd和La分析结果 以Cr和Ti为例 r 0 862 属于强相关 相关分析 聚类分析 聚类分析又称群分析 它是研究样品或指标分类问题的一种多元统计方法 其分析的思路是依照事物的数值特征来观察各样品之间的亲疏关系 相近的聚为一类 以距离表示 样品聚类 相似的聚为一类 以相似系数表示 变量聚类 聚类分析过程 构造n个类 每个类包含且只包含一个样品 计算n个样品两两间的距离 构成距离矩阵 合并距离最近的两类为一新类 计算新类与当前各类的距离 若类的个数等于1 转到步骤5 否则回到步骤3 画聚类图 决定类的个数 及各类包含的样品数 结果分析 运用层次聚类可以将Al Mg Ca等37种元素分成两类 第一类包括元素Al Ca K Th La Nd Ce Ba Yb Y Ti Sc V Fe Co Cu Cr Zn Zr Mn P W Pb Be Sn Bi Li Mo Au F As 第二类包括元素Ca Sr Hg Sb Mg Ag 实习总结 通过Graph菜单中的各项操作 我们可以得出 在整个抽样中诸广山岩体 砂砾岩 细砂岩的样品数含量较多 而泥岩 硅质岩 贵东岩体 灵溪岩体的样品含量较少 燕山第一期抽样的诸广山岩体和bca时期抽样的砂岩样品数含量很高 而燕山第二期抽样的贵东岩体 印支期抽样的灵溪岩体 P2时期抽样的砂岩P1q时期抽样的灰岩 P1m时期抽样的泥岩砂岩和硅质岩 C1z时期抽样的砂岩和灰岩的样品数极少 Al K Ti Zr Ca Sc Fe Li Yb Cr La Hg Cu Ca Zn V Co这十七中化学元素在不同时代的含量变化非常剧烈 Be Mn Ba Ce Th Nd Sr Y这八种化学元素在不同时代的含量变化比较剧烈 Sn Bi W Pb Mo Au Mg这七种化学元素除在某些时代的含量变化比较剧烈以外 在其它时代变化比较温和 P F Sb As Ag这五种化学元素除在某个时代的含量变化很剧烈以外 在其它时代含量变化很温和 通过图示法进行正态性检验 通过P P图可以看出Al K Ti Cr Mn Fe Li Zr Ce La Nd Yb Y Th Pb Zn Au Ba Ca P这二十种化学元素服从正态分布 Mg Ca V Co Be Sc W Sn Mo Bi Cu Ag Hg As Sb Sr F不服从正态分布 通过Q Q图可以看出Al K Ti Cr Mn Fe Li Zr La Nd Yb Y Zn Ba Ca这十五种化学元素服从正态分布 Mg Ca V Pb Co Be Sc W Ce Th Sn Mo Bi Cu Ag Hg As Sb Au Sr F P这二十二种元素不服从正态分布 两种检验存在差异 以Q Q图更优 通过偏度 峰度检验法检验正态性 看出Al K Ti V Cr Mn Fe Co Li Zr Ce La Nd Yb Y Th Zn Ba Ca P这二十种化学元素的偏度系数和峰度系数都接近0 说明它们服从正态分布 Mg Ca Au Be Sc W Sn Mo Bi Cu Ag Hg As Sb Pb Sr F这十七种元素的偏度和峰度系数远离0 说明它们不服从正态分布 通过非参数检验法检验正态性 Kolmogorov Smirnov检验中Al K Ti V Cr Mn Fe Co Li Be Zr Sc Ce La Nd Yb Y Th Zn Au Ba Ca这二十二中化学元素是服从正态分布的 Mg Ca W Sn Mo Bi Cu Pb Ag Hg As Sb Sr F P这十五种化学元素是不服从正态分布的 通过相关性检验 可以看出Al与K Ca Nd Yb Th Ce Ca与Sr K与Th Be Ti与V Cr Fe Co Sc La Nd Cu V与Cr Fe Co Sc Cu Cr与Fe Sc Nd Mn与Y Fe与Co Sc Zn Co与Sc Cu Zn Li与Be Be与Th Sn Sc与La Cu Zn Ce与La Nd La与Nd Yb Ba Nd与Yb Ba Ca Yb与Y Ca Sn与Bi Cu与Zn Zn与Ca 它们存在高度相关性 通过聚类分析TwostepCluster过程中 可以看出将数据分组为2是最合适的 第一组频数为42占总体的72 4 第二组频数为16占总体的27 6 实习心得 1 我们不是地质学专业的学生 课余也没有接触到这些资料 因此做地质学方面的数据分析比较困难 如果一开始我们有幸能够参与到搜集数据的工作中去 并且在实习之前了解一下数据的背景 学习一下相关的知识 那么我们更容易进行数据的录入和分析 2 我们上学期讲过比较粗浅的SPSS相关应用知识 结合所学的 统计学原理 知识 对于做一些数据的分析是不够的 我们应该熟练地掌握相关的统计分析软件 并且温习和预习一些知识 3 我们小组在讨论分析数据时 没有什么创新的想法 因此总觉得这些数据是能分析出时间序列模型等我们还没有学过的知识 4 我们遇到的这种实习 实践活动很少 以前参加过的一些实践活动也没有比这次的实习更注重报告的模式等 5 不知道怎么对SPSS输出的结果根据自己需要做出修改 经过反复摸索 可以对结果做一些简单的变换 不过对于相关分析的输出结果非常庞大 也不知道这么导出 也不能复制粘贴 于是只能截屏一部分作为结果图展示 6 由于有37种化学元素 作图做表什么的都比较庞大 很多按每种元素来分析的图表 我们都要对其缩小然后排序 整合在一张图上 不过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论