增程式电动自行车工程项目数据采集分析与知识管理(工程项目组织与管理)_第1页
增程式电动自行车工程项目数据采集分析与知识管理(工程项目组织与管理)_第2页
增程式电动自行车工程项目数据采集分析与知识管理(工程项目组织与管理)_第3页
增程式电动自行车工程项目数据采集分析与知识管理(工程项目组织与管理)_第4页
增程式电动自行车工程项目数据采集分析与知识管理(工程项目组织与管理)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、泓域咨询/增程式电动自行车工程项目数据采集分析与知识管理增程式电动自行车工程项目数据采集分析与知识管理xx集团有限公司一、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年

2、翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。

3、想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是

4、简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以

5、可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从WWW中发现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间

6、的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了Robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态Web页面,最后获取被访问站点网络数据库中的动态信息,生成WWW资源索引库。(4)信息特征匹配。提取索引库中的源

7、信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。二、 时间数据分析方法(一)时间数据时间数据也称时间序列(Timeseries)或动态数据,是按时序排列的一组来自同一现象的观察值。时间序列可按日、月、季度、年等收集,有些呈现很强的季节性,建模时应给予反映。气象、水文、生态环境、经济及社会活动都能观察到周期性时间序列。实际观测并记录的时间序列,实际上是随机过程的样本,即,在产生时间序列的实际过程的每一时点上,人们看到的只是该时点随机变量的样本,并不能观察到母体。时间序列可分为平稳和非平稳序列,还可以分成线性和非线性时间序列。(二)时间序列分析1概述时间序列分析是根据随机过程理

8、论,研究时间序列的统计规律。时间序列分析广泛应用于信息压缩、利用卫星照片识别地球资源、石油勘探、经营管理、预测(气象、水文、地震、地下水位、农作物病虫灾害)、控制(环境污染、生态平衡)(天文学和海洋学)等方面。时间序列预测的基本依据是:(1)客观过程是连续的,有惯性,现在是过去的继续,过去的信息会传递到现在与未来,利用过去的数据或信息能推测未来。(2)偶然因素会影响到客观过程,使其行为与模式有随机性。预测要利用时间序列各时点随机量的相关关系。时间序列的趋势与波动称为“模式”,时间序列分析首要要识别其模式,然后用适当的曲线拟合。拟合模式的各种参数根据按“最优预测”原则估算出的时间序列数字特征(期

9、望值、方差、协方差、自相关函数)等确定。2.时间序列成分时间序列常含有4种成分:趋势、季节变动、规则波动和不规则波动。所谓趋势,是长期持续向上或持续向下的倾向。季节变动,是实际过程受气候、市场状况、节假日或风俗习惯等影响而呈现的周期性波动。规则波动,是周期不等的变动,呈涨落交替之状。波动的周期可能很长,但与趋势不同。不规则波动,是时间序列除去趋势、季节变动和周期波动之后的波动。不规则波动总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。时间序列经常是各种周期成分的叠加,例如地震或人工地震波的记录。这样的序列要做频域分析。频域分析确定时间序列各周期成分称为“谱”或“功率谱”的能量分

10、布形态。频域分析又称谱分析。谱分析的重要内容就是通过序列的周期图()的极值点寻找各种分量的周期。3时间序列建模时间序列建模一般有如下几个步骤(1)取得时间序列样本。(2)将样本点画成图,进行相关分析。时间序列图形可显示出变化趋势和周期,并发现离群点和转折点。若离群点确实为观测值,建模时应加以考虑,若非,应加以调整。转折点指时间序列趋势突变的点。如果发现转折拐点,则在建模时须分段用不同的模型拟合时间序列,例如用门限回归模型。(3)模式识别与拟合。时间序列模式众多。小样本可用趋势模型、季节模型加上随机误差拟合。对于样本容量(即观测值个数)大于50的平稳时间序列,可用ARMA(自回归移动平均)模型拟

11、合。非平稳时间序列可经差分化为平稳时间序列,再用ARMA模型拟合。(4)预测未来。利用建成的模型预测时间序列未来值。4时间序列常用模型(1)ARMA模型(2)回归模型三、 信息鉴别及必要性(一)信息鉴别数据与信息鉴别,可称信息识别,就是将信息与具有特定属性的“模式”进行比较,进而判断信息的类别或属性。具体而言,就是信息收集或使用者运用已有的知识和经验,在对获取的信息进行初步分析之后,按照一定原则和目的,辨认与甄别信息的真伪、轻重主次、是否完整、是否有用,以及用途大小等。(二)信息鉴别的必要性互联网时代,信息极为丰富,大大开阔了人们的眼界。然而,蜂拥而至,难辨真假的信息掺杂在一起,常常使人们陷入

12、另一种迷茫,甚至成了海量信息的奴隶。过量的信息若不筛选,会使决策者无所适从。现在,互联网上充斥着伪造、篡改缺失、无代表性、误传、以及过时等信息。有些信息背后隐藏着各种政治、经济社会的利益团体正当或不正当的目的和企图。信息识别及时与否决定了决策是否正确而又及时,决定了企业、事业、项目和其他活动的命运。对于工程咨询,信息识别同样十分必要。信息识别并非简单工作,对从事者有很高的要求。决策者固然应高瞻远瞩,但决策的基础是真实、可靠的信息。决定信息识别成败的主要因素有:对服务目标的正确认识及其深刻程度;识别者实事求是的态度和已有的知识、推理与判断能力。四、 信息鉴别常用方法(一)溯源法对到手信息涉及的问

13、题应追根溯源,及时核对。例如,尽量找到现场和掌握第一手资料的人;核对原始资料,并查对主要参考文献;按其中叙述的方法、步骤,重做实验或演算,以便从来源上找到鉴别依据。鉴别和筛选在手信息,判断是否完整、适用与可靠,是咨询人员的重要工作。工程咨询所需信息十分广泛,不可能也不必均由咨询人员鉴别。为了确保信息可靠,应尽可能选用权威机构发布或已鉴定、批准的信息。例如,地质储量选用储量委员会批准的储量报告;地震带的分布用国家地震局的数据;历史数据用国家统计局的数据。一般来说,专业技术力量强的单位提供的信息较可靠。例如,国际金融组织的国际金融信息较可靠;来自从事钢铁、汽车行业研究的机构的钢铁、汽车业信息较可靠

14、。(二)比较法有些信息受主客观条件限制难以溯源,对此,可用比较法,即比较不同人、不同时间和其他方面的材料;对于某一事实,说法、结论是否一致。如果一致,则基本可辨真伪。若否,就需进一步核查。(三)佐证法任何事物都与其他事物有一定联系,并相互制约。找到这些联系和制约因素,便可判断事物的真伪。一般说来,口头材料不如文字材料可靠,文字不如实物可靠。分析信息产生的过程也是寻求信息佐证的办法。1普查数据一般比抽查数据全面、准确。2监测数据,长期比短期全面,监测范围大的数据比监测范围小的数据代表性强;勘探密度大的数据比勘探密度小的数据准确,科学实验和仿真模拟计算的数据比一般推理的数据准确。3核对来源不同,收

15、集方法不同的数据。如卫星图片、航测数据可用地面实测数据验证;了解来的市场需求量与行业协会、主要企业、国家统计局的数据对比。4对比不同时期、不同来源的数据,并适当修正其间的差距。同一对象的数据,在不同国家、不同历史时期,由于范围不同,计算的标准和口径可能有所不同,造成数据之间有很大的差异。在对比这些数据时,必须查明统计口径,否则就会出错。5由专家集体辨别信息是否准确,是否可靠。对于来自不同渠道的信息,可能因角度不同、口径不一、方法各异等而不一致,甚至矛盾。这时,可请专家集体讨论,弄清差异和矛盾的原因,去伪存真,取得一致意见。(四)逻辑法鉴别信息,逻辑判断必不可少。不经缜密的逻辑思考容易出错。有些

16、基本差错,例如语言或文字的前后矛盾,夸大其词,有悖情理,以及某些虚构,禁不起逻辑的推敲。当然,逻辑合理并不总能证明事物为真,从虚假的前提出发,经过合理的逻辑推断得出的结果不会真实。因此,鉴别信息,既要充分利用经验、认识和判断力,也要借助其他手段。五、 PEST分析(一)政治环境分析政治环境是指一个国家或地区的政治制度、行政体制、法律法规等,具体指标包括政治体制、经济体制、财政政策、税收政策、产业政策、投资政策、政府补贴水平、民众对政治的参与度等。随着全球经济一体化和“一带一路”倡议的深入实施,我国大量企业“走出去”在“一带一路”沿线国家和其他区域国家设厂投资,在进行投资项目可行性研究时,要加强

17、所在国的政治环境分析,高度重视各国政治环境的特殊性,因为不同的国家有不同的社会制度,不同的社会制度对组织活动有不同的限制和要求,即使在同一国家,由于执政党的不同,其政府的施政方针对组织活动的态度和影响也是不断变化的。由此可以看出,政治环境对企业的影响具有直接性、难预测性和不可控制等特点,这些因素常常制约、影响企业的经营行为,尤其是影响企业较长期的投资行为。因此,在制定企业发展战略或进行境外投资时,需要掌握大量的、充分的相关资料,对政治环境的长期性和短期性的判断与预测十分重要。(二)经济环境分析经济环境主要包括宏观和微观两个方面的内容。宏观经济环境主要指一个国家的人口数量及其增长趋势,国民收入、

18、国民生产总值及其变化情况以及通过这些指标能够反映的国民经济发展水平和发展速度。微观经济环境主要指企业所在地区或所服务地区的消费者的收入水平、消费偏好、储蓄情况、就业程度等因素。这些因素直接决定着企业目前及未来的市场大小。(三)社会自然环境分析社会自然环境包括社会环境和自然环境。社会环境包括一个国家或地区的居民教育程度和文化水平、宗教信仰、风俗习惯、审美观点、价值观念等,其中文化水平会影响居民的需求层次;宗教信仰和风俗习惯会禁止或抵制某些活动的进行;价值观念会影响居民对组织目标、组织活动以及组织存在本身的认可与否;审美观点则会影响人们对组织活动内容、活动方式以及活动成果的态度。自然环境包括土地、

19、生物、矿产、能源、水资源以及生态环境。(四)技术环境分析技术环境对企业的生存和发展具有直接而重大的影响,不断的技术进步提高了生产效率,降低了生产成本,极大地影响了市场竞争的格局。随着技术更新速度的加快,新产品层出不穷,产品生命周期愈来愈短,越来越多的企业把技术研发作为企业的生存之道。技术环境分析是要分析本企业的产品有关的科学技术的现有水平、发展趋势及发展速度,跟踪掌握新技术、新材料、新工艺、新设备,分析对产品生命周期、生产成本以及竞争格局的影响。六、 项目名称及项目单位项目名称:增程式电动自行车工程项目项目单位:xx集团有限公司七、 项目建设地点本期项目选址位于xx(待定),占地面积约73.0

20、0亩。项目拟定建设区域地理位置优越,交通便利,规划电力、给排水、通讯等公用设施条件完备,非常适宜本期项目建设。八、 建设规模该项目总占地面积48667.00(折合约73.00亩),预计场区规划总建筑面积97632.11。其中:主体工程65257.66,仓储工程19370.69,行政办公及生活服务设施7844.18,公共工程5159.58。九、 项目建设进度结合该项目建设的实际工作情况,xx集团有限公司将项目工程的建设周期确定为12个月,其工作内容包括:项目前期准备、工程勘察与设计、土建工程施工、设备采购、设备安装调试、试车投产等。十、 建设投资估算(一)项目总投资构成分析本期项目总投资包括建设

21、投资、建设期利息和流动资金。根据谨慎财务估算,项目总投资37157.79万元,其中:建设投资29840.81万元,占项目总投资的80.31%;建设期利息400.97万元,占项目总投资的1.08%;流动资金6916.01万元,占项目总投资的18.61%。(二)建设投资构成本期项目建设投资29840.81万元,包括工程费用、工程建设其他费用和预备费,其中:工程费用25039.90万元,工程建设其他费用3994.01万元,预备费806.90万元。十一、 项目主要技术经济指标(一)财务效益分析根据谨慎财务测算,项目达产后每年营业收入85500.00万元,综合总成本费用69653.35万元,纳税总额75

22、61.13万元,净利润11587.78万元,财务内部收益率24.60%,财务净现值23756.00万元,全部投资回收期5.23年。(二)主要数据及技术指标表主要经济指标一览表序号项目单位指标备注1占地面积48667.00约73.00亩1.1总建筑面积97632.11容积率2.011.2基底面积29686.87建筑系数61.00%1.3投资强度万元/亩384.822总投资万元37157.792.1建设投资万元29840.812.1.1工程费用万元25039.902.1.2工程建设其他费用万元3994.012.1.3预备费万元806.902.2建设期利息万元400.972.3流动资金万元6916.

23、013资金筹措万元37157.793.1自筹资金万元20791.663.2银行贷款万元16366.134营业收入万元85500.00正常运营年份5总成本费用万元69653.356利润总额万元15450.377净利润万元11587.788所得税万元3862.599增值税万元3302.2610税金及附加万元396.2811纳税总额万元7561.1312工业增加值万元25070.1913盈亏平衡点万元33829.98产值14回收期年5.23含建设期12个月15财务内部收益率24.60%所得税后16财务净现值万元23756.00所得税后十二、 项目背景分析增程式电动汽车技术最初于20世纪初引入,并在若干海外市场上成功应用。例如,日产Note系列是2018年日本最畅销的乘用车,在日销量达13.6万辆,其中增程式电动汽车车型e-Power占65.6%。LEVCTX系列出租车是另一款于2018年1月

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论