已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
天津城市建设学院本科毕业论文基于多元统计对客户的投资偏好分析Based on multivariate statistical analysis to the client of the investment preferences学生姓名:李杕普学生学号:08580212专业名称:信息管理与信息系统指导教师:陈君艳经济与管理学院2012年6月15日摘 要 决定投资成败最重要的因素在于投资的适应性和创新性,由于投资品种的多样性自然就决定了每个投资者都会有自己的一种投资策略然后在实践中不断的去纠正和总结自己的投资经验。尽管不同的人存在不同的风险态度和风险偏好,作为一个整体,人们的投资偏好还会有一些共性,并且决定了在风险决策中投资者存在某种行为共性,而这些共性决定往往导致决策偏差。本文通过介绍国内各个阶层的居民现有收入状况,结合目前市场上的金融产品主要投资特点,重点对不同家庭情况,不同的投资偏好,不同的收入水平以及不同金融产品的生命周期的投资策略分析。关键词:生命周期;风险偏好;投资策略;收入水平;家庭状况ABSTRACTDecided to invest the most important factor in the success or failure of the investment and innovation of adaptability, because investment variety of natural diversity to each investor will have their own an investment strategy and then practice continuously in to correct and sum up your investment experience. Although different people have different attitudes and risk preference, as a whole, the peoples investment preferences will still have some common, and decide the risk decision of existing investors in some common behavior, and the common decided to often leads to decision deviation. The article introduces the domestic all sectors of existing residents income, combination of financial products on the market at present main investment features, mainly of different family situation, different investment preferences, different income levels and different financial product life cycle analysis of the investment strategy.Key Words:Life cycle;Risk preference;Investment strategy;Income level;Family status 目 录第 一 章 绪 论11.1研究背景及其社会意义11.2工薪阶层的经济特点分析11.2.1收入来源相对单一11.2.2投资理念相对趋同21.2.3消费方式的多元化21.2.4家庭整体承受风险能力相对有限21.2.5适宜投资的工薪阶层行业相对集中21.3 国内外研究现状分析31.3.1 国内研究现状分析31.3.2 国外研究现状分析3第 二 章 投资策略的基本产品分析52.1 金融理财产品52.1.1保证收益理财产品52.1.2保本浮动收益理财产品62.1.3非保本浮动收益产品62.2证券类投资产品62.2.1股票62.2.2债券72.2.3基金7第 三 章 数据挖掘技术的概述93.1 数据挖掘技术的起源93.1.1数据爆炸的形成93.1.2数据挖掘逐渐演变的过程103.2 数据挖掘技术的概念103.2.1数据挖掘在商业层面的含义103.2.2数据挖掘的特点103.3 数据挖掘的常用技术113.3.1 聚类分析113.3.2关联分析113.3.3 回归分析123.3.4 预测分析123.3.5 分类分析123.3.6 偏差分析12第 四 章 多元统计对客户投资的细分134.1 多元统计在金融投资领域中的重要作用134.1.1 对目标市场的客户134.1.2对客户价值的分析134.1.3对客户行为的分析144.1.4 对业务关联分析144.2 基于多元统计的数据处理流程144.3 数据的采集和与处理过程144.4 金融投资数据的统计和分析164.4.1性别、年龄和投资额的统计分析16(1)性别、年龄和投资额的相关性分析16(2)性别、年龄和投资额的二步聚类分析17(3)性别、年龄和投资额的K均值聚类174.4.2年龄、职业对投资额的统计分析18(1)年龄、职业和投资额的相关性分析18(2)年龄、职业和投资额的二步聚类分析19(3)年龄、职业和投资额的K-均值的聚类分析194.4.3年龄、性别和投资品种的统计分析20(1)年龄、性别和投资品种的相关性分析20(2)年龄、性别和投资品种的二聚类分析21(3)性别、年龄和投资品种的K-均值聚类分析214.4.4年龄对投资额和投资品种22(1)年龄和投资额、投资品种的相关性分析22(2)年龄和投资额、投资品种的二步聚类分析23(3)年龄对投资额和投资品种的K-均值聚类分析23第 五 章 金融投资领域中客户分析及客户关系管理255.1 金融投资领域影响客户投资的因素255.1.1 地理因素255.1.2 人口因素255.1.3 心理因素265.1.4 行为因素和收益因素265.2 对公司客户的关系维系275.2.1对投资客户的投资心理测量275.2.2 投资客户良好心态的保持275.2.3 投资者心态的调整275.2.4 投资心理的控制285.3 正确的客户心理辅导原则28第 六 章 结束语296.1 结论296.2 展望30参考文献31致 谢33附件一:综述34附件二:英文翻译37第 一 章 绪 论1.1研究背景及其社会意义近年来,国际金融市场发生很多重大经济事件,诸如像全球金融危机、欧债危机等等使得国际上的很多的金融大鳄都对前景保持了一个相对悲观的态度,我国在面对这几次金融风暴用自己的实际行动,强有力的回答了国际金融界的一个普遍的疑问“中国扛得住么?”从而大大的提高了中国在国际金融市场的核心竞争力,同时也为国内经济的高速发展奠定了一个最为良好的基础,国家通过各种金融手段强有力的抑制住了我国经济泡沫的持续增长,使人民消费水平总体呈上升趋势,国内改革开放多年来,很多的家庭都奔上小康,但是能达到温饱的水平,已然不是人们所需要的,很多的工薪阶层虽然解决了温饱问题,自然会要改善一下自己的生活质量,但以现有工资并不能去解决这样的一个优化问题,所以就会牵扯一个财富的增值问题,为了提高自己的生活品质,就会倾向做一些额外的投资,来增加自己的财富值。因此,对国内人群我们很有必要去进行对投资偏好的分析。1.2工薪阶层的经济特点分析用自己的劳动成果去为固定的工作场所工作,并且能够按月获得固定的劳动报酬并且将其作为主要经济收入来源的经济群体成为工薪阶层。他们有着较为相似的经济共同点:1.2.1收入来源相对单一 基本工资和额外投资回报作为工薪家庭的重要生活保障,来作为家庭指出的重要支撑,但是,由于我国的工薪阶层的人员整体素质相对较低,掌握的信息量较少,价值思想相对闭塞,同时我国国内整体金融投资环境发展的并不成熟,人们并不能对投资理财有足够的安全感,故而真正投入大量资金去运作的工薪阶层并不能占到很大比重,因而固定工资还是作为工薪家庭收入的主要来源,俗话说“人不理财,财不理你”,那么如何去分配家庭的固定收入即如何去理财,使之能把现有资金灵活运用起来就成为了当今工薪家庭面临的一个主要问题。 1.2.2投资理念相对趋同 由于工薪阶层了解社会信息方式相对单一,因而并不能获得足够的信息量,加之由于自身素质受限并不能去有足够的时间和精力进行互联网上的信息收集和信息分析从而导致工薪阶层所掌握的信息量较为有限,进而对他们经济社会的未来发展趋势有诸多的顾虑。由于国内现有保障尚未完善,导致他们认为自己的工作前景,子女的将来教育,父母的日常健康以及未来所要面对的衣食住行,都存在相当多的不确定因素,这样的生活精神状态导致了他们对投资的经济条件、资金的变现能力、货币的通货膨胀等方面有着较多的要求,所以他们的投资目标较为一致。1.2.3消费方式的多元化在马斯洛的需求层次理论中,当工薪阶层在基本生存需要得到满足的前提下,他们就会开始更多地关注对他们生活质量的提高和改善消费品有帮助的相关项目。包括物质方面、精神方面等多方面的追求,例如去按摩、健身、户外运动、出行、房产、汽车、子女教育、父母健康安全都会被他们考虑其中,在加上平时的日常聚会维系人际关系也存在很多的资金支出,那么当这些需求都被聚集到一起的时候,作为工薪阶层的投资者就会根据自身的需要和自身的抗风险能力去追求不同的一种投资回报以满足自己的物质文化需要。1.2.4家庭整体承受风险能力相对有限由于国家还处在共产主义社会的初级阶段,加之人口数量众多,导致了国家在对医疗、教育、住房等诸多保障体质中做的并不完善,不足以实现全民的公费医疗、保障性住房、子女教育保障,那么这就是工薪家庭的经济条件受到了一个强大的客观制约,使其在家庭理财的时候只能将很小比重的资金去作为家庭理财的基础,来降低工薪阶层的投资风险系数。结合目前的投资市场发展状况来看,工薪阶层在进行投资的时候很难确保此次投资会得到高收益,所以他们会感到很强的危机感加之经验不足,当他真正面临投资机会的时候会变得一片茫然,自顾不暇。从这种角度看,在对工薪阶层的投资策略分析中还应该去参考诸如像家庭人均年收入、家庭人口数量、家庭人员健康状况等更多家庭和社会的客观影响因素进行综合分析。1.2.5适宜投资的工薪阶层行业相对集中虽然同属于工薪阶层,但是该层涉及很多的领域行业,故而由于工薪阶层的劳动者所处在不同的行业领域和在公司中的不同级别,会导致他们的工资收入存在较大的差异水平,也就是说并不是每一个行业的工薪人群都可以去从事金融理财活动,根据我国国家统计局出具的统计资料显示,涉及金融、通信、石化、电力等行业领域的工薪人群能够更积极地去应对家庭的金融理财,向其中可以投入相对其他行业更多的金融资本,同时,诸如公务员、教师、医生、外企职员等高端领域中的管理人才干部也是可以参与金融投资的重要客户群。在此论文中主要以工薪阶层中这些有条件从事金融投资的人群作为有效分析对象。1.3 国内外研究现状分析1.3.1 国内研究现状分析随着我国经济水平的持续快速发展,人民生活水平不断提高,手里的闲置资金也越来越多起来,如何去选择性的投资理财能够让自己的资产保值增效,也就越来越为成为人们所关注的热点问题。90 年代后期以来,中国个人投资者日益成熟,其投资的选择权面对丰富的投资品种可以较充分发挥。在此大背景下,部分研究学者开始关注中国的投资分析,对于投资偏好的研究比较适合中国国情,各种结论犹如百花齐放,结合职业、收入、年龄、性格等方向研究。由于每个人的成长经历的不同,造就了每个人都具有不同的性格特点,这也就直接导致了人们在投资理财的时候具有不同的投资策略,对于自己的交易纪律严格意义上没有好与坏之分,只有适应自己的方法才是最好最重要的交易准则,趋于保守的人会选择储蓄、国债等稳健性的低收益的金融产品,积极型的人会选择更为激进的投资品种,诸如期货、现货、股票、黄金、白银等一类高风险高回报的投资产品,曾几何时,投资房地产成为众多实力派有钱人的投资热,但现在像这种投机性的投资虽然也算作是一种资本投资,但毕竟只能是一种短期行为,面对各方面的打压,如果长期持有,一定会面临很大风险甚至会倾家荡产。所以各种投资品种主要还是根据每个人不同的性格特点来进行分析,而针对我国国内金融公司的研究表明,对于国内潜在的投资客户的分析还是仅仅停留在浅显的一个摸索期。1.3.2 国外研究现状分析由于国外投资领域发展的历史较长,所以国外的投资分析研究较为成熟,分析的内容也更加地详细,透明。国外针对于金融投资领域的研究,通常都是基于活动主题来进行的规律性相关分析比如在国外的研究者通过对资产管理者、投资经理、和股评家这样之间的大量事例中总结出来了这个羊群效应这个问题,即当股评家放出消息说预测某个品种会有所行动或者在加上投资经理和资产管理者从各种渠道去放风时候,这时候的大部分投资者的心里都会有所倾向接着就发生了人云亦云一个接着一个钻进庄家的圈套,往往这个时候很多投资者真正去投入的时候,往往会被套牢那为什么他们还会这样做呢?因为他们对他们的评论家、投资经理是信任的,是高度忠诚的,从而造成了羊群效应。 除此之外,在国际市场上的研究中,人们还详细研究了投资经纪人激励政策和投资公司和客户还有投资品种的多向监管模式,而且在证券领域国际上还会对每一个公司的真实性、合法性、整体可持有性、所设计产业的未来前景分析相对于国内的虚假来说,也更为透明,更为详尽准确。这些国际上的研究都为国外的很多投资者提供了充分的保障,而且由于多年的良好信誉和口碑,也使投资者愿意相信公司的预判是真的,对自己所选择的公司有很高的忠诚度。在加上国外的国家社会福利保障政策使国民感到了很大的安全感,人们不会再为温饱、医疗、教育等政策进行担心,所以这也正向的促进了他们国家的人民会把更多的资产去诸如的整个的投资资本运营体系中,这样的良性循环,也会逐步的带动国家的快速发展,从而带动国民的收入也更为宽裕,是人们能够安居乐业,而相比于国内的各项水平来说,我们虽然和以前比有很大的进步,但是太多太多不完善的地方还要需要我们一步一步的去改进、发展,羡慕别人不是目的,最重要的是把先进的知识带入国内,然后进行改良创新,因地制宜的使用在国内的金融市场上。这才是我们真正要做的事情第 二 章 投资策略的基本产品分析 自己的部分资金去投入到某个商业性的运作,并预期会得到一定的资金回报的过程成为投资。投资的形式可谓千变万化,其中包括很多的经济形势,例如商业银行的金融型理财产品,证券基金类,金融债券类、期现货、权证、保险,等等。从金融学的角度来看,相对与投机而言,投资可能会花费更多的时间、精力、和财力,去通过掌握的市场准则和方法去规律性的操作自己的投资产品,也只有这样,才能使在未来的时间过得比其他人更多的资产收益、从而提高自己的生活质量和生活水平。2.1 金融理财产品 金融理财产品实则是国内商业性银行针对潜在的目标客户群体进行分析研究,在此基础上筛选出一个或多个具有特点的目标客户群,并对其进行开发设计帮助其进行资金投资和管理计划。对于商业银行推出的理财产品,客户授权银行管理其资金,对于投资后形成的收益和这之中伴随的风险由客户和银行按照之前的约定的方式共同承担。根据本金与收益的原则可以讲理财产品分为保本固定收益产品、保本浮动收益产品和非保本浮动收益产品三类1。2.1.1保证收益理财产品保本收益理财计划即指商业银行向客户支付之前带有约定条件的固定收益,银行自己一方承担这其中产生的投资风险,或银行向客户承诺支付之前约定条件的最低收益并承担其中的相关风险,其他的额外投资收益由银行和客户双方按照之前制定的合同原则进行合理分配,并且共同承担相关投资风险的理财计划2。投资者购买这类金融产品到期会获得固定的收益,投资风险由商业银行全部承担。但是这其中所涉及到的投资者并不是完全无条件的获得其中的固定收益因为监管层规定银行不能完全无条件的承诺固定收益,以防银行发生高息揽储等诸类作弊行为。所以,保本理财产品中,银行有权在特定的情况下终止合同,而这样的特权对于投资者来说却只能是一个望尘莫及的奢望。因此,在这样的情况下,投资者选择的前提首先,对于相同的产品,要选择一个年收益率相对较高的金融产品,同时还需要注意利息的问题,因为选择金融类产品的目的就在于它的利率相比储蓄来说要高一些而且相比于其他的投资在风险上的承担问题上,银行也可以承担大部分的风险。2.1.2保本浮动收益理财产品顾名思义,保本浮动收益理财产品计划即商业银行向客户支付之前约定条件中的本金部分,而对于本金以外的收益部分则由客户来独自承担,并依据实际的投资收益确定客户实际收益的一种理财计划12。商业银行在开展有关理财业务的同时可以未经授权而使用信托权利。在国外的经济市场中,境外商业银行多实行的是利率市场化和浮动汇率政策。因此,商业银行可向客户提供的业务主要侧重于咨询顾问和代客理财等服务,分类和性质较为简单。而对于国内的商业银行来说,由于中华人民共和国商业银行法规定银行不得从事证券和信托业务,并且由于利率尚未完全市场化,在这样的前提下商业银行理财产品的开发销售面临的约束较多同时还伴随着很大的法律风险。同时,对于具体的保本浮动利润产品又分很多诸如保本信托产品,保本挂钩股票,商品指数等。其次,直接影响投资人利益的因素还有不同的管理费用计提(即收益的抵扣程度不同)项目的收益是封顶的,其中的收益来源于贷款的利息,着也就意味着决定收益的是贷款利率,而且面临着信托公司从中提取的管理费用。2.1.3非保本浮动收益产品 随着金融经济市场的蓬勃发展,这类非保本浮动收益产品渐渐走近人们的视线,所谓非保本浮动利益产品即不保证本金收益率浮动的产品,目前该类的主要产品有QDII、基金宝等,一般银行的非保本浮动利益型的风险仅次于储蓄风险13。其中QDII作为一种投资制度,其直接的目的为了进一步吸纳民间资本,以便创造更多外汇收入,同时可使国内货币更加市场化,从而减少贸易顺差,和资本项目盈余。直接表现为让国内投资者直接参与国外的经济市场,从而获取全球市场的经济利益。这其中所伴随的风险比前两种理财产品要高很多,但是同时收益率也大大增加。2.2证券类投资产品 证券投资指投资者独立进行购买债券、股票、基金等有价证券及其衍生品,通过投资这些产品以获取红利的一种投资方式,从概念上看,广义的证券包括(如提货单、商品购物券)、货币证券(包括支票、商业票据)以及资本证券(股票、债券、基金)而对于从狭义角度来讲,证券仅指资本证券他们是代表对一定资本所有权和收益权的投资凭证3。2.2.1股票股票作为股份制有限公司进行市场性融资的一个手段,在融资时向市场发行自己的有价证券让众多的市场投资者来担任企业的股东,每一个购买该企业股票的个人和企业都是发行股票的股东,而每一个股东都会根据自己所持有的股份数量来享受不同的权利和义务,股票是一种有价证券,代表着其持有人(股东)对股份公司的所有权,每一股同类型股票所代表的公司所有权是相等的,即“同股同权”。股票可以公开上市,也可以不上市4。股票是典型的风险投资工具,其最为明显的特点就是高风险高回报,在我国目前的股票市场中,由于发展时间短,造成整体的管理制度还很不完善,这就需要投资者不仅要以足够的时间和丰富的经验作为前提的情况下还要具备较为强大的心理承受力和充裕的资金。但是,目前我国的经济形势总体形式也呈现复苏状态,并且股票的可选空间较为广阔,这就形成投资的机会很多,在策略中可以适当调整绩优股的比重以满足不同投资者的需求。2.2.2债券 国家、企业、金融机构为了扩大自己的企业发展规模时由于自己的资金不能满足发展需要于是向民间筹措资本即向投资者发行债券,投资者购买债券随即和发行单位发生一种债权关系,双方按照事先约定,在借款期满后连本带利还给投资者,从而是双方都受益的一种借贷行为。 5。债券的投资成本较为丰富,但是它的风险和收益较为趋中,相对常见的债券包括有国家自主发行的国债,企业发行的企业债券以及一些地方根据自己的发展需要去进行一些地方融资性债券。相比之下,工薪阶层的资本投入还是更倾向于国债和有一定收益保证的企业债券。尤其是前者,因为它相比于存款来说有很大的优势,例如免税,收益率较高,而相对于股票而言又具有较好的信用保证和较强的社会信誉,往往深受广大工薪阶层人民的欢迎,更有甚者称其为“金边债券”。2.2.3基金 基金实质是一种非直接的投资途径,是投资者把自己的部分投资资金,由于自己的时间不足以去满足投资的时间需要,于是将自己的资金以托管的形式交给基金管理公司,通过双方的协议来履行对方的承诺,基金管理人运用资金从事商业性投资,然后基金商和投资人共同承担风险、分享收益 6。 基金是这几年刚刚发展起来的新兴金融投资产品,可以对其进行多种分类,大致分为:股票型基金、债券基金、货币基金。股票型基金相对其他两种产品来说投资收益率较高,一般可以达到8%左右,对于一年以上的投资较为适合。债券型基金一般收益率在2%-2.4%之间浮动,收益相对稳健,不会伤及本金,对于投资期也比较自由,但是考虑相应的费用和持有时间,对债券型基金的选择略微靠后,而货币基金是一种短期低风险的投资理财产品,收益率相对较低,因此有人又称他为银行储蓄的“替代品”,适合短期投资,当然一定情况下也可以作为一种过渡性投资品种。第 三 章 数据挖掘技术的概述数据挖掘就是在大量的数据中进行规律化的综合性分析,从中找出对事实发展较为有用的数据和物质发展规律,整体过程需要进行数据准备、规律性分析、得出结果等步骤,所涉及的方法较多例如相关性分析、聚类分析、异常性分析、演变分析等等它将传统的分析方法与海量数据的处理相结合数据挖掘是探查和分析大量数据以发现有意义的模式和规则的过程7。数据挖掘的目的是为了通过分析具体的大量数据,得出最有新颖、最不为人知、对今后次失误的发展会有重大影响的有价值信息,从而帮助需要此数据的部门快速提高分析效率,更好地帮助企业发展。在此期间用户必须借助相应的数据挖掘工具来发现并找出数据中隐藏的规律,为了做出决策提自动化的、供智能的辅助手段。3.1 数据挖掘技术的起源如果想发明一个东西,那么导致他的发明者能制造它出来的原因就是它非常的被人们所需要,即“需要是发明之母”,近些年来,由于中国经济快速蓬勃的发展从而带动中国的信息产业一路高歌猛进茁壮成长,“数据挖掘”这个词对于中国信息产业界不再是一个生僻词,越来越多引起人们对它的关注,一个很重要的原因就是在于目前网络中存在大量数据,并且这些数据可与广泛的去作为有用的资源去使用,同时迫切需要将这些数据转换成有用的信息和知识,从这些获取的信息和知识中可以广泛运用与各种生活应用,包括商务管理,市场综合性分析,工程设计,可靠研发,以及生产控制。3.1.1数据爆炸的形成电子信息技术高速发展,带动了整体数据库技术的发展,不再像以前一样只是用于科学研究和探讨,取而代之的使用在更多的实际现实生活当中,从而大量的信息数据被收纳到了现在的数据库中,虽然技术在不断成长,但是在统计以后的分析中的技术却尚未成熟,不能及时做好分析工作,这就导致了大量的数据涌入,而并不能及时处理,这样就造成了一个现象:各方面数据很充分但是实用性很低,造成了“数据大爆炸但只是很匮乏”的现象13。3.1.2数据挖掘逐渐演变的过程 和所有事物一样,数据挖掘也是一个不断在进化演变的过程,在电子数据处理的初期,人们就是用各种方法去实现自动的决策支持,在当时人们更多地关注焦点还是放在了机器的学习,让机器的学习顾名思义就是将一些已知的并且在过去已经成功解决的问题作为一个标准事例输入计算机,然后让计算机去自我学习同时自己把这些事例总结成自己的相应规则,同时这些规则之间又具有共性,使用它们可以解决某些相似的问题,后来,神经网络技术的问世,通过它的发展,又使人们把注意力转到了知识工程,不同以前的是,知识工程不再需要预先输入示例,而是直接向计算机输入代码(示例已被编为代码),计算机能够直接使用这些规则代码去解决各种问题。所谓的专家系统,就是采用这样的方法,但是它投资巨大但是效果并不理想,到了80年代,人们重新总结了神经网络理论,并在新的理论指导下,重新回到机器学习这个角度,并且人们将成果首次运用到了大型的综合商业数据库中,该技术由此成为了80年代末的新术语,即KDD。KDD泛指所有从数据源中发掘的模式或联系方法。但是最近人们开始使用某些统计方法来代替数据挖掘中的许多工作,并且他们认为最好的方法是将统计方法和数据挖掘有机的结合起来。3.2 数据挖掘技术的概念数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们视线不知道的、但又是潜在有用的信息和知识的过程8。3.2.1数据挖掘在商业层面的含义在商业层面,数据挖掘实际上就是对海量的商业数据进行更为有效和细致的分析方法,在以前来说,一般都是用于科学领域研究工作,随时间的发展也被更多的引用到民用商业方面研究,很多的数据其实都是偶然情况下产生的,并不是一种刻意的行为,分析这些目的是为了攫取更多的对商业有价值的信息,从中获得更多的商业价值,然后是企业得以发展得到更多利润,但是面对海量数据的处理,现有技术还是不能做到足够的完善,还是有很大的发展空间,发现这些偶然性的商业信息就相当于矿中掘金,因此,也将其命名为数据挖掘,其商业的目的也可以描述为,更好地帮助企业快速的发展成长更有效的去优化企业的整体。3.2.2数据挖掘的特点 数据挖掘分析方法最大的特点在于其挖掘、发现关键的信息这个过程中并没有明确的假设前提,并且所挖掘到的信息应具有一下三个特征即未知、有效、可使用。先前未知的信息是指该信息在之前从未预料到,并且没有靠直觉发现的信息和知识,甚至是违背直觉的信息和知识,所发现越有价值的信息往往越是出乎意料的,常人用直觉根本不能发现的。最为典型的代表就是在沃尔玛超市连锁店中发现成人的啤酒和儿童的尿布之间有着惊人的联系。3.3 数据挖掘的常用技术数局挖掘算法的优劣直接决定所发现的知识的价值性,以及所发现的知识的可实际应用程度。数理统计主要应用于对数据挖掘所挖掘出来的知识进行统计和评估,对于计算机来讲,它的学习也是人工智能的一个分支,即归纳推理,从所发现的规律中找出隐含的规则。数据挖掘技术能够有效的处理数据库中的海量数据,能够更好的对数据进行分析和挖掘,从而得出最精确的数据结果。数据挖掘中常用的方法有聚类分析、关联分析、回归分析、分类分析、预测分析、偏差分析。3.3.1 聚类分析所谓聚类即指把整体的一个数据库中的各种信息按照他们共有的特点将它们分为不同的群组。在同一组中的数据彼此相似,而不同组中的数据相差甚远,聚类分析可以通过建立宏观的概念,结合统计出来的数据特点,得出潜在数据属性之间的相互关系。此外,聚类分析还能够在其他算法中充当预处理步骤9。在聚类分析的时候很有可能一次的聚类分析并不能得出真正理想的结果,这时就需要多次聚集,并且找一个对业务很专业的业内人士来确定分群的定义,这样通过几次的删除或增加变量来影响分群的方式,才能最终得到真正理想的结果。聚类方法也可以细分为统计方法和神经网络方法。3.3.2关联分析关联分析是指在两个或多个事物之间存在一定的联系,通过对一个事件的预测可以得出另一个事件,进行关联分析的目的在于挖掘出深层次不为人知的且对发展有作用的数据。简单的,可以将关联分为单纯性关联、时间关联和因果关联,涉及到的参数可以引入兴趣度、相关性等等这样做的目的是为了是所挖掘的规则更符合实际。关联分析近似于序列模式分析,但侧重点不同于序列模式分析,关联分析更着眼于被分析数据前后的关联性。3.3.3 回归分析 回归分析在于确定某几种变数之间相互依赖的一种定量关系,应用实际中非常广泛,按照其自变量的不同可以大致分为一元回归分析和多元回归分析。考虑自变量和因变量也可以大致分为线性和非线性回归分析两种,一元线性回归指在回归分析中只存在自变量和因变量各一个,且二者关系近似,相反则成为多元线性回归分析10。3.3.4 预测分析 预测分析是指根据以往的历史数据从中找出变化规律,运用方法建立模型,通过此模型对未来数据的种类和可能产生的特点进行准确预测,我们通常使用预测方差这个方法来度量其预测结果的精度和不确定性11。3.3.5 分类分析 找出一个具有代表这个某类数据的整体信息,并对它的类别概念进行描述,通过这种描述来构造相关的模型,通常使用决策树或规则来表示,分类还可子啊规则描述和预测中进行更多应用。3.3.6 偏差分析 数据发展现状、数据本身的历史记录以及数据标准这三者存在显著变化,而偏差分析就是探测这三者之间的偏离,然后通过分析得出相应的结果并应用到实际的生产经营当中。第 四 章 多元统计对客户投资的细分4.1 多元统计在金融投资领域中的重要作用随着现代高新技术的发展,计算机信息技术已经发生了重大转变,从最初单纯地服务于行业的业务领域,逐渐转变为对业务和管理的各个方面的综合应用,在高速发展的今天,金融部门的数据量大大增加,单纯的人工分析统计已完完全全不能满足现在这个时代的一个基本要求,伴随着产生了我们现在的数据库系统,它可以有效的实现对数据的统计,查询以及录入,虽然提高了我们的工作效率,但是它仍然无法实现根据得到数据进行分析这一重要的行为,数据库并不能发现每个数据中隐含存在的关系和规则,并且它无法根据现有的数据区预测未来的发展走向,缺乏了这样的手段所面临的结果就是出现了“数据大爆炸但知识贫乏”的现象。这时候数据挖掘应运而生,作为信息技术发展的关键,正显现其巨大的商业价值,在金融领域也亦如此,中国的金融企业若想有所发展,就必须从“产品导向”的市场营销经营理念向“客户导向”转变。4.1.1 对目标市场的客户在分析市场的客户时候,采用分类和聚类的方法,可以将目标群里中的每个客户进行细分,通过他们数据本身所体现的特点将具有相似特点的客户放在一个目标群里,这样将所有的客户分成若干各组,这样通过有效的聚类和协同过滤方法可以更高效的提高对不同客户需求的分析,从而推动企业的营销成效。4.1.2对客户价值的分析在做这项分析行为之前,我们一般要选择分类客户,然后根据“二八原则”,从中找到我们所需要的重点客户(这里所提到的重点客户,是指为银行创造了八成价值中的客户中的两成的客户),对这些重点客户我们要实行最为优质的服务,创造我们的效益,对于如何这些重点客户这一难题,我们一般使用诸如系统数据处理、AI等数据统计分析技术来实现。通过一些重点指标来分析出客户的忠诚度,以及找到这些客户的共同需求,从而对这些具有相似特征的客户进行有效地弥补。4.1.3对客户行为的分析通过找到的重点客户,我们能够发现客户的行为偏好,从而根据他们的需要为他们定制专属的特色服务,从而提高客户对企业的忠诚度,对不同群组之间的客户进行交叉分析后,我们可以发现客户群体间的变化规律,并且通过对数据库的进一步分析和统计,我们会将最具代表性的数据放到我们的数据库中,从而让企业配合我们得到的数据结论,制定更加符合企业发展的市场策略。4.1.4 对业务关联分析 在大量的客户信息数据面前,我们可以对客户平时的个人素质、教育水平、工作性质、家庭收入、家庭支出、消费习惯等行为进行充分的分析,找出客户的潜在需求,同时通过这些结论,我们可以更好地发展一些中间业务,在更好地为客户服务的同时,进一步发展我们自己的企业。4.2 基于多元统计的数据处理流程首先进行前期的准备工作,包括数据信息的收集和预处理,收集就是搜索与工作对象有关的数据信息,并且从中选出最具代表性的资料以便通过分析得出最具代表性的答案,预处理就是进一步筛选信息,提高数据的整体质量,为接下来的分析做到充分的准备,确定要使用的统计操作类型。然后进行分析阶段,将筛选出来的数据输入计算机,运用SPSS软件使计算机进行自主分析,并且能进一步完善数据,最后是得出结论,对所得出的结果进行解释和评估,根据得到的结果进行相应的分析,并且制定相应的计划。 4.3 数据的采集和与处理过程本篇论文通过对天津市当地几家基金公司、证券公司、银行、以及期货公司中所掌握的部分重点客户信息的收集对其进行预处理,然后运用SPSS软件对相关数据进行深入挖掘分析,主要运用相关性分析,以及聚类分析对数据进行深入采集,为了便于数据的定量处理,进行的编码化,相关的数据维度以及编码含义如下表所示:表4-1 天津市金融投资客户数据样本维度及相关代码性别的代替数值男1女2投资额代替数值5W以下15W-10W210W-20W320W以上4投资品种基金1股票2期货3银行理财产品4储蓄5工作职业学生1教师2车企员工3银行4公务员5医生6外企7金融投资8退休9其他0图4-1 各项数据的无纲量化表示图4-2 各个数据的变量数据维度项4.4 金融投资数据的统计和分析4.4.1性别、年龄和投资额的统计分析(1)性别、年龄和投资额的相关性分析 表4-1 各数据的代替数值性别的代替数值男1女2投资额代替数值5W以下15W-10W210W-20W320W以上4注:由于年龄使用的是具体数值而不是范围,这里不在需要用数值代替。表4-2 性别、年龄与投资额的相关性分析性别年龄投资额性别Pearson 相关性1.052.037显著性(双侧).082.211N112711271127年龄Pearson 相关性.0521.573*显著性(双侧).082.000N112711271127投资额Pearson 相关性.037.573*1显著性(双侧).211.000N112711271127*. 在 .01 水平(双侧)上显著相关。由图4-5我们可以看出,性别与投资额的相关性为0.037,而年龄和投资额的相关性高达0.573同为正向相关关系,这说明,性别、年龄与投资额成显著相关关系,他们之间存在着相关性。(2)性别、年龄和投资额的二步聚类分析图4-3 性别年龄和投资额的二步聚类分析从图4-3以看出性别、年龄和投资额这三个维度,输入特征是3而通过复式4说明要把所分析的数据分为4类的情况是最好的,所以在K-均值类分析我们将其分为4类。(3)性别、年龄和投资额的K均值聚类表4-3 性别、年龄与投资额的最终聚类中心聚类1234性别1111年龄59483726投资额3332表4-4 每个聚类中的案例数聚类1142.0002218.0003484.0004283.000有效1127.000缺失.000由表4-3和表4-4的聚类结果可以知道,根据计算机所得出的结论,在1127个有效数据中,第一类为59岁左右的男性投资额在10W-20W之间,第二类为48岁左右的男性,投资额在10W-20W之间,第三类为37岁左右的男性投资额同样为10-20W之间,第四类为年龄在26岁左右的男性投资额为5W-10W。4.4.2年龄、职业对投资额的统计分析表4-5 各数据的代替数值职业学生1教师2车企员工3银行4公务员5医生6外企7金融投资8退休9其他0投资额5W以下15W-10W210W-20W320W以上4注:由于年龄使用的是具体数值而不是范围,这里不在需要用数值代替。(1)年龄、职业和投资额的相关性分析表4-6 职业、年龄与投资额的相关性分析职业年龄投资额职业Pearson 相关性1.523*.413*显著性(双侧).000.000N112611261126年龄Pearson 相关性.523*1.573*显著性(双侧).000.000N112611271127投资额Pearson 相关性.413*.573*1显著性(双侧).000.000N112611271127*. 在 .01 水平(双侧)上显著相关。由此图我们可以看出,职业、年龄与投资额的相关性为0.413和0.573这表明年龄和职业这个连个维度对投资额有绝对的相关性存在其中。(2)年龄、职业和投资额的二步聚类分析图4-4 职业年龄和投资额的二步聚类分析由图4-4中的两步聚类,计算机显示此聚类分析输入特征为3应分成4类最为有效,即提示我们将在K-均值聚类分析的过程中把所分析的数据设定为4类。(3)年龄、职业和投资额的K-均值的聚类分析 表4-7 年龄、职业和投资额的最终聚类中心聚类1234年龄4658362632职业675投资额333表4-8 每个聚类中的案例数聚类1236.0002161.0003462.0004267.000有效1126.000缺失1.000由表4-7和表4-8可知,在年龄、职业和投资额这三个维度做K-均值聚类分析的时得出结论,第一类投资额在20W4.4.3年龄、性别和投资品种的统计分析表4-9 各数据的代替数值性别男0女1投资品种的代替数值基金1股票2期货3银行理财产品4储蓄5注:由于年龄使用的是具体数值而不是范围,这里不在需要用数值代替。(1)年龄、性别和投资品种的相关性分析表4-10 性别、年龄与投资品种相关性分析性别年龄投资品种性别Pearson 相关性1.052.183*显著性(双侧).082.000N112711271127年龄Pearson 相关性.0521.139*显著性(双侧).082.000N112711271127投资品种Pearson 相关性.183*.139*1显著性(双侧).000.000N112711271127*. 在 .01 水平(双侧)上显著相关。由图4-7我们可以看出年龄、性别和投资品种具有相关性,性别对投资品种和年龄对投资品种的相关性分别为0.183和0.139根据规则成显著相关。(2)年龄、性别和投资品种的二聚类分析图4-5 年龄性别和投资品种的二步聚类分析通过二步聚类,我们不难发现,其输入特征为3,复式为2,则说明性别年龄对投资品种的最终聚类分为两类是最为有效果的。(3)性别、年龄和投资品种的K-均值聚类分析表4-11性别、年龄和投资品种的最终聚类分析聚类12年龄33135213性别投资品种表4-12 每个聚类中的案例数聚类1767.0002360.000有效1127.000缺失.000由表4-11和4-12我们发现,在最后的K-均值聚类分析中,第一类为男性平均年龄在33岁的人群投资品种多为期货投资,而第二类则为平均年龄在52岁左右的男性通常的投资品种为期货。4.4.4年龄对投资额和投资品种表4-13 各数据的代替数值投资额的代替数值5W以下15W-10W210W-20W320W以上4投资品种的代替数值基金1股票2期货3银行理财产品4储蓄5注:由于年龄使用的是具体数值而不是范围,这里不在需要用数值代替。(1)年龄和投资额、投资品种的相关性分析表4-14 年龄对投资额和投资品种相关性分析年龄投资额投资品种年龄Pearson 相关性1.573*.139*显著性(双侧).000.000N112711271127投资额Pearson 相关性.573*1.201*显著性(双侧).000.000N11271127
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025LED显示屏租赁合同范本
- 2025年短视频内容分发渠道合同协议(流量合作)
- 2025花卉买卖合同范本
- 保密协议书 著作
- 私募基金合伙人协议书
- 美容合资协议合同范本
- 承继协议书与补充协议书区别
- 2025年标准劳动合同范本下载
- 社区医疗合作协议书
- 物流分包协议书
- 仓储物流场所消防培训课件
- 《律师执业纪律与职业道德》考试复习题库(含答案)
- 《零售药店实务》期末考试复习题库(含答案)
- 人教版(2019)选择性必修第二册Unit 1 Science and Scientists Workbook Expanding Your World 课件
- 市值管理定制服务协议
- 如何做好转介绍
- 汉语拼音音节全表优质资料
- 支局长培训测试题附答案(商客)
- 2022福建泉州市丰泽区市场监督管理局公开招聘人员3人模拟试卷【共500题附答案解析】
- 幼儿园绘本故事:《我不知道我是谁》
- 船舶结构与设备课件——船体结构
评论
0/150
提交评论