




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南财经大学天府学院 大数据时代的信息分析实训报告大数据时代的信息分析实训报告1、严格按下面的模板做(包括标点、字体、字号、段落、行间距等),正文使用数字番号为“一、(一)、1、(1)”。字数要求在3000字以上,正文一律4号字宋体。这部分所占分数为30分,按是否符合要求给分。2、必须有摘要、关键词、必须有实训模拟过程的描述、必须有自己的心得体会、必须有一定逻辑性。这部分所占分数为30分,按是否符合要求给分。如有三处以上错别字及语句不通者,则酌情扣分。西南财经大学天府学院大数据时代的信息分析实训报告学生姓名:张 洁 所在班级: 会计电算化05班 摘要对于数据分析,这无疑是一个前所未有的黄金时代。现在,几乎每个人的衣袋都有一部可以随时联网的智能手机,更强大的平板电脑则安静的躺在数亿人的手提包里,加之久久没有退出历史舞台的个人电脑和方兴未艾的物联网中的电子设备,这个世界,每时每刻有数以百亿计的电子精灵在产生数据,一个崭新的数据爆炸时代正喷薄而出。本文以大数据和大数据分析来写,从了解大数据的概念、大数据与传统数据库应用的比较,大数据与大数据分析的概念来了解什么是大数据,通过实训模拟来进一步描述我们所了解的大数据,从我们的实训模拟中来得出的大数据来知道现在这个信息发达的时代什么是需要的、什么是我们可以通过数据去完成的。然后在文中也写到了大数据的两面性,我们要合理利用大数据。关键词:大数据 数据爆炸 数据分析AbstractFor data analysis, this is a hitherto unknown of the golden age. Now, almost everyone has a mobile phone pocket intelligent can be networked, flat computer more powerful quietly lying in the hundreds of millions of peoples handbag, and for a long time without electronic equipment, quit the stage of history of the personal computer and the Internet of things be just unfolding in the world, all electronic elves tens of billions of in the data, a new era of information explosion is gushing out. Based on the analysis of large data and data to be written to, from concept, large data of large data and traditional database applications, concept analysis data and data to understand what is the big data, large data further described by training simulation, we know, big data from our training simulation at from now to know this information developed era of what is needed, what we can through the data to complete the. Then wrote two sides of large data in this paper, we should make use of the large data.Keywords: Big data The data explosion 目 录摘要2Abstract3正文5引言5一、大数据5(一)什么是大数据5(二)大数据与大数据分析5二、实训模拟6(一)实训模拟过程描述6(二)实训模拟心得体会6(三)实训模拟结语6三、总结6四、文献6引言大数据是目前的热门词汇,本文分析了大数据和大数据分析等基本概念和大数据的特点。针对其引起的技术上的挑战进行了深入分析,突出讨论了在数据库技术上关于NoSQL与SQL的挑战,和在机器学习方面的挑战。最后从软件角度对如何实现大数据的管理、处理和分析,以及相关的技术平台进行了分析和研究。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。且中国物联网校企联盟认为,物联网的发展离不开大数据,依靠大数据可以提供足够有利的资源。一、大数据(一)、什么是大数据大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托迈尔-舍恩伯格及肯尼斯库克耶编写的大数据时代中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法1)大数据的4V特点:Volume、Velocity、Variety、Veracity。 “4V理论并不足以概括全部,大数据的核心其实还在于其跨域关联。数据正像棉花和钢铁在工业革命中所发挥的作用一样,变成新科技革命中最重要的原材料。”电子科技大学教授周涛认为,数据积累遵循游由量而质的演变过程。如果规模较小,数据就只能用于分析特定现象本身;一旦规模达到另一域值,很多杂乱无章的现象就会变献出意外的关联性,这才是大数据的价值所在。举一个有趣的例子。人品与删除浏览记录,就是一个典型的曾经看似风马牛不相及的关联体。很多人喜欢上网后删除浏览记录。在保护隐私的旗帜下,这种行为很少受到关注,也很少激起人们的兴趣,自然也就不能调动人们深入思考和仔细研究的积极性。但来自以色列的Shvat Shaked却通过努力告诉人们,如此寻常的行为中同样蕴含着道理,也许还蕴含着无限商机。Shvat有一个坚定的信念:一个人的品行与其不经意间的行为密切相关,那些“坏人”为防被人追踪一定会不断删除自己在互联网上的踪迹,而“好人”则一般不介意在互联网上留下自己的印记。基于这个信念,Shvat通过对海量数据的分析研究出了一款独特的欺诈系统。这一防欺诈系统受到了ebay的关注。后者的paypal系统允许两个通户通过电邮地址在线交易,这微钓鱼式攻击提供了可乘之机:一些欺诈网站伪装成真实网站以获得用户的登录信息。paypal近年来不断加强在线安全却一直收获不大,Shvat的创意及其防欺诈系统出色的性能就在此时吸引了ebay。2008年,ebay以1.69亿美元将Shvat及其公司Fraud Sciences收入囊中。(二)大数据与大数据分析大数据是最近一两年来的热门词汇。街头巷尾大家都在谈大数据。那么:什么是大数据?为何现在讨论大数据?对大数据该如何处理?什么是大数据分析?其产业前景如何?什么是大数据?这是一个令人困惑的问题。按名字,假如仅仅就是“大”,那么这不是新问题,因为数据的规模一直在膨胀,数据库技术的研究人员和数据库系统的供应商一直在努力,数据库的存储能力也一直在扩大,所以,何必大惊小怪?大数据成为新问题的原因是,这里,“岂是一个大字了得!数据数量的爆炸、来源的多样和形态的迥异,使这个时代显得如此不同。在这个时代,人们第一次有机会接触与某个现象相关的全部数据,因而得以颠覆“以样本代表总体”的科学研究铁律。但技术如此,我们对于大数据这一新事物的了解依然过少。对于数据分析,这无疑是一个前所未有的黄金时代。现在,几乎每个人的衣袋都有一部可以随时联网的智能手机,更强大的平板电脑则安静的躺在数亿人的手提包里,加之久久没有退出历史舞台的个人电脑和方兴未艾的物联网中的电子设备,这个世界,每时每刻有数以百亿计的电子精灵在产生数据,一个崭新的数据爆炸时代正喷薄而出。“数据不会被它所激发的思想和创新消耗,相反,它可以为创新提供无穷的燃料。一小片合适的信息,可以促使创新迈进一大步。一组数据,可能会得到数据收集人难以想象的应用,也可能会在另一个看起来毫不相关的领域得到应用,因为这些创新型的应用,数据的能量将层层放大。”二、实训模拟(一)实训模拟过程描述我们通过软件对欧洲人民使用的自行车进行的花费进行了大数据调查,家喻户晓的自行车顶级赛事都在欧洲,比如一年一度的公路车盛宴环法国公路车比赛吸引着全球成千上万的热爱自行车运动的人。所以自行车的花费相比其他占据着绝对地位。与此同时,有关自行车等一系列的配件即然而然的成为了第二大热门消费。众所周知,自行车现在在欧洲越来越流行,人们愿意去购买自行车相关的配件等一系列设备来为自己的自行车进行保养,我们就是根据这些特点来制定了自行车花费有关数据的实训模拟。 图1 自行车花费的所有的数据 上图是我们对欧洲和北美的模拟数据,从图中可以看出我们分了四个小图进行了数据模拟,每个小图中我们可以清楚的看到自行车相关的花费,我们设置了饼状图和柱状图,可以更加明显的了解到哪些部分所占的比例有多大。 图2 枢纽分析表上图就是列出数据,列出自行车不同地区在不同消费上得金额。(配饰,配件,附件)的花费+订货量;自行车的花费+订货量;衣服的花费+订货量;零件的花费+订货量。我们从图中可以看出北美市场相对欧洲市场使用人们在自行车的总销售量相对较高,所以我们可以把重点放在北美市场,其中我们可以看出人们更加注重自行车的品质、质量上,自行车的销售量相对偏高;自行车的配件销售量相对其他配件销售量偏低,销售数量相对较少,我们可以在配件上也进行一定的购货量。骑自行车的配饰和衣服销售量相对很高,销售量相对不错,可以看出大家在骑车时对服装也有一定的要求,我们在销售自行车时可以搭配服装配套销售,零件是自行车配置的一个很重要的部分,我们在销售自行车的时候可以把零件也一起销售,让更多人购买。 图3 欧洲销售量决策分析图上图是饼状图,我们把欧洲人们关于自行车的花费通过表格绘制成了饼状图,让大家更能够浅显易懂。从图中可以看出有关自行车种类的数据和所占比例额,图中可以看出自行车配销售量件张最大的比例,达到30.38%,配件在自行车的使用中有很大作用,人们在修理修配时必须拥有,所以我们可以看出销量很大;然后自行车销售量在28.56%,自行车还是占大部门销量;衣服的销量也相对较大,我们可以看出大家对骑车的装备也比较注重;零件的比例相对较少,销售量相对较小,所以我们在零件这里不需要太过注重,但是也不能放弃。 图4 欧洲销售额决策分析图上图可以看出有关自行车的相关产品在欧洲的销售额,图中显而易见,自行车在欧洲的消费量占据绝对地位 ,自行车的花费相比其他占据着绝对地位。占了整个比重的86.64%;与此同时,有关自行车等一系列的配件即然而然的成为了第二大热门消费。可能由于欧洲的经济体系的原因,人们花在穿着方面的金额倒是不多,而且与衣服相关的配饰也顺理成章没有占据大量的消费金额。 图5大洋洲自行车配套销售图上图是表格和根据表格绘制出来的饼状图,图中可以看出大洋洲人们在自行车的配套设施方面的花费,我们可以看出手套、背心、短裤和紧身内衣的销售额相对较高,我们在销售自行车的时候可以把这些产品配套和放在显眼位置供顾客选择,以达到销售目的。 图5 柱状分析决策图上图为欧洲,大洋洲,北美三个地区对自行车的销售额,可以看出北美在三个地区中自行车的销售额为最好的,所占比例最大,我们可以知道这跟北美人们的生活习惯有关,我们可以在这里多多生产自行车进行销售。(二)实训模拟心得体会这次的实训模拟是让我们运用大数据来分析自行车在其他地区的销售额和销售数量,根据大数据提供的数据来制定销售计划,这次的实训模拟让我知道了大数据在现代生活和技术中的运用,对于数据分析,以前我们只是接触了简单的数据,而这次运用更多的数据来更加具体的分析,使我觉得大数据在现在这个信息告诉发展的时代,疑是一个发展的黄金时代。现在,我们几乎每个人的衣袋都有一部可以随时联网的智能手机,更强大的平板电脑则安静的躺在数亿人的手提包里,加之久久没有退出历史舞台的个人电脑和物联网中的电子设备,这个世界,每时每刻有数以百亿计的电子精灵在产生数据,我觉得大数据对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响,这6个月的实训模拟中我学到了很多,懂得了在这个信息飞速的时代运用先进的数据来分析和决策我们想要的东西,只有不断的收集数据分析数据,分析现在的环境,抓住机遇,才能做到我们想要的,我们不能仅仅局限于一个地区,要学会分析,相对的去做比较,我们不断的分析数据,把握消费者的心态,并主动迎合他们的需求,让我们的产品得以销售,这正是我们为什么要用大数据的原因。(三)实训模拟结语模拟实训让我们了解了什么是大数据,大数据在具体生活中的运用,我们运用在数据在实训模拟中得到了很多对我们有用的数据,让我们知道了大数据的重要性。三、总结综上所述,我们通过大数据来找准了自行车在不同地区准确合理的目标市场群体的定位、产品的结构体系,最终完成了客户群体的目标。我觉得不管任何行业、任何企业,都可以通过大数据来分析决策和了解市场定位,找准消费群体,给自己的产品找准定位,让更多的客户认同自己的产品乃至文化。只有这样企业才能拥有源源不断的消费群体,才能在今后的持续发展中拥有坚强的后盾!而屈臣氏就恰恰做到了这一点,这也是其成功的最关键之一。大数据是国内外很多企业都可以有效实施的方法。参考文献1 (美)施瓦尔贝(Schwalbe,K.)著. 王金玉等译. IT项目管理M. 北京:机械工业出版社. 2001-12.2 美国项目管理协会著. 卢有杰, 王勇译. 项目管理知识体系指南M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《小英雄雨来》观后感(合集15篇)
- 年产200吨医药中间体项目可行性研究报告(模板范文)
- 家医上门服务的政策支持与执行策略
- 海洋科技创新的发展框架与路径
- 新疆乌鲁木齐市实验学校2023-2024学年高三上学期1月月考生物含解析
- 小学均衡发展教育班会
- 珠海艺术职业学院《计算机导论》2023-2024学年第二学期期末试卷
- 皖江工学院《广告策划与制作》2023-2024学年第二学期期末试卷
- 心理学知识普及课件
- 开封职业学院《分离工程》2023-2024学年第二学期期末试卷
- 民法典解读–总则编1
- 建设工程前期手续办理程序
- 干部履历表(中共中央组织部2015年制)
- 子宫内膜息肉的中西医结合治疗策略
- 仪表车采集及控制
- 漏洞扫描与修复技术
- 巴以冲突的历史和现状分析
- 学校食堂食材配送服务方案(肉类、粮油米面、蔬菜水果类)(技术标)
- 中医外科学肛肠疾病课件
- GA/T 2073-2023法庭科学血液中碳氧血红蛋白检验分光光度法
- 黔灵山公园调研报告
评论
0/150
提交评论