




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于阿里云的购车用户画像分析姓名: xxx学院: 云学院专业: 大数据分析专业指导教师: xxx2018年8月19日摘要在大数据时代,数据成为了各行各业、各个领域发展的重要因素和底层驱动力,无论是产品的生产、销售还是股票涨跌的预测,人们越来越依赖于从大数据中挖掘信息、获得信息和展示信息。用户画像正是基于大数据的一种分析、模型构建技术。通过对大数据进行分析、挖掘,形成用户的多维度的特征标签,这些特征能够精准反映出用户的基本信息、消费能力和需求等特征,为企业的生成、销售等活动提供有效的依据,进而为企业带来可观的效益,同时也能够方面人们的生活。本文将以汽车行业为关注点,对汽车用户进行用户画像的构建。选择汽车行业是因为汽车行业是一个国家经济发展状况的晴雨表,随着我国社会、经济的不断发展,汽车走进了千家万户,汽车的制造、销售行业竞争也随之愈加激烈,要想在这个快速发展的市场中占得先机,大数据分析必不可少,而用户画像能够精准描述用户特征,为车企、销售商提供极佳的参考。本文中将利用阿里云的大数据开发套件MaxCompute、DataWorks等工具,以及数据可视化工具QuickBI针对汽车用户构建用户画像,并对数据进行具体的分析,为企业的生产、销售提供一定的参考。关键词:大数据 汽车 用户画像 MapCompute DataWorks QuickBI目录目录摘要I目录II第一章 绪论11.1 研究背景11.2 研究意义21.3 研究现状21.4 研究内容3第二章 用户画像分析概念和相关技术42.1 用户画像42.2 用户画像相关技术52.2.1 MaxCompute52.2.2 QuickBI62.2.3 DataWorks72.3 本章小结8第三章 需求分析93.1 汽车销售市场现状93.1.1 当前我国汽车总体现状93.1.2 不同类型汽车的需求103.2 用户画像技术需求分析113.3 本章小结12第四章 用户画像的构建134.1 用户画像模型134.2 基础数据的收集134.3 数据处理144.4 本章小结15第五章 基于阿里云的用户画像构建165.1 数据表的创建165.2 用户画像的构建175.3 本章小结20第六章 用户画像分析226.1 用户特征分析226.1.1 购车用户的性别和年龄分布226.1.2 用户的学历226.1.3 用户所处地域236.1.4 用户的年收入246.1.5 用户喜欢的车型246.1.6 购车用户的意向价格区间256.1.7 车载APP用户投票256.1.8 用户对新能源车辆的看法256.1.9 用户购车的目的266.1.10 用户所处的行业266.2 用户画像总结276.2.1 用户分类276.2.2 市场热点276.3 本章小结28第七章 总结与展望29参考文献30致谢31附录1 数据导入数据库Python脚本32附录2 部分MaxCompute数据操纵语句35III第一章 绪论1.1 研究背景汽车生产和销售行业是一个国家经济发展的晴雨表,近年来随着我国经济水平的不断发展,人民生活水平的日益提高,汽车逐渐走进了千家万户。数据显示,截止2017年,我国汽车保有量达到了2亿辆,占到了全球的20%,并且汽车产销量仍然保持着高速的增长。同时,随着互联网、云计算以及大数据技术的迅猛发展,移动终端、APP、小程序等新应用的普及,使得汽车的生产和销售逐渐从人力时代进入了云计算、大数据时代,无论何时何地,用户在网页上的每一次点击、每一次搜索都成为了企业积累的数据,企业根据这些海量的数据可以精确分析出一个用户的消费目标、性格偏好,从而更有针对性地进行推销、推广以及产品布局,既提高了自身的效率,同时也给客户带来了更好的消费体验。汽车销售行业是一个直面消费者的领域,而每一个消费者都有着不同的特点、心理、预期目标以及消费能力,这些特征又会根据不同的地域、行业而又有所不同,所以,汽车销售就是要针对不同的用户推销合适的产品,那么如何精准地刻画一个客户的特征并且制定相关的策略可以说是一笔交易能否达成的关键。而用户画像正是在大数据时代,用于精确刻画用户特征的一个强有力的工具。所谓用户画像,就是根据用户的社会属性、生活习惯和消费行为等信息抽象出的一个标签化的用户模型,如图1.1所示。通过用户画像,车企能对用户进行精确的定位,从而更好地把握消费者的特点和心理,提高客户的粘度和品牌忠诚度,并且发掘出他们真正的需求和消费能力。图1.1 用户画像模型用户画像技术离不开大数据的发展,2015年,我国首次提出“国家大数据战略”并发布了促进大数据发展行动纲要,2017年,大数据产业发展规划(2016-2020年)实施,2018年中国国际大数据产业博览会在贵阳举办,标志着我国的大数据战略的全面实施。可以说大数据的发展将会给各个行业带来新的挑战,但更多的是新的机会,而用户画像作为大数据技术中一个重要技术也将迎来更大的发展。目前业内有多家企业、机构和组织从事专业的大数据分析和用户画像构建等工作,每年都会有针对不同车型、地区、品牌的用户画像报告出炉,各家车企、销售机构对此也十分关注,由此带来的利润增长规模非常可观,因此该技术在市场上的需求很大并处于持续增长的状态。1.2 研究意义虽然中国目前的汽车保有量已经达到了2亿辆左右,但是要看到,我国每千人拥有的汽车数量约200辆,与发达国家相比仍然有着较大差距,仅为美国的约四分之一,日本的约三分之一。同时,汽车、能源等技术也在发生着飞速的变化,新能源汽车、车联网、自动驾驶技术等快速发展,得到了越来越多的推广应用和消费者的认可。同时国民收入不断提高,人民大众向往美好的生活,不断向着小康社会奋勇前进。因此,可以预见,中国的汽车销售市场仍然有着非常大的增长空间。那么如何在这个有着巨大潜力的市场中生存和发展,如何抓住并且留住客户的心是值得每个汽车生产和销售企业思考的问题,而在大数据时代,通过用户画像技术对用户建立精准的模型几乎是所有企业争夺市场的一个必由之路。用户画像分析不仅能对单一用户构建画像,也能对不同地域、不同行业的用户群体进行抽象建模,从而可以从更高的视角、更广的维度分析群体的消费能力、消费需求,根据相应的画像可以进行更有效的广告投放,并可以结合其他服务与车辆一同推销给目标客户,在提高销量的同时也提高了周边服务的利润,最终达到提高用户好感度好和粘度的目的,为企业带来更加长远的收益。用户画像有着直观性强、说服力强、展示全面的优点,通过对用户画像的研究和应用,企业将能够更全面地把握市场动态和用户特征,为企业效益的增长提供强大的动力。1.3 研究现状说到用户画像,就不得不说大数据。大数据这一概念由维克托迈尔和肯尼斯库克耶在2008年首次提出。大数据具有“5V”的特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。如今,各个行业的发展都离不开大数据,无论是销售行业、生产部门还是医疗等产业,大数据越来越成为驱动它们发展的底层和核心力量,并且这个趋势越来越明显,我们将逐渐由“信息时代”进入“大数据时代”。目前,很多大的互联网和科技公司都向云计算、大数据技术投入了大量的人力、物力、财力,亚马逊、Google、微软等大型跨国企业已经在这个领域深耕多年,技术积累非常丰富,而国内阿里云是较早涉足云计算的企业之一,并且在云计算、大数据领域取得了瞩目的成就。用户画像的构建离不开大数据技术的支持,阿里云作为目前国内市场份额最大、技术最先进的云计算服务提供商,自主研发了强大的云计算系统,能够向用户提供全套的大数据计算服务。阿里云的产品非常丰富,包括有着强大计算能力的MaxCompute系统,其能够对海量数据进行挖掘分析并能能够快速得到结果;用于存储的RDS数据库、OSS对象存储服务等,能够为用户提供安全可靠的数据存储、恢复备份等服务;用于报表展示的QuickBI、DataV等,能够帮助用户轻松自如地完成数据透视分析、自助取数、业务数据探查、报表制作和数据门户搭建等任务。目前,国内的云计算、大数据市场竞争激烈,许多公司都推出了云计算服务,并且国内公司在相关技术的积累上也取得了长足的进步。云计算、大数据代表着未来的方向,无论是个人还是企业都应该在这个时代不断提高自己,以在未来的市场上获得更好的发展。1.4 研究内容本文专注于汽车销售用户画像的构建,通过使用阿里云的产品MaxCompute、QuickBI等完成用户画像的构建和展示。主要研究内容如下:(1)用户画像的基本概念、原理、特征;(2)MaxCompute、DataWorks、QuickBI等的特点和使用方法;(3)构建用户画像相关的大数据算法,数据之间的关联关系分析;(4)生成报表后的发布等工作。37第二章 用户画像分析概念和相关技术2.1 用户画像画像是真实实体的虚拟代表,是建立在一系列真实数据上的目标的实体模型。每幅画像都有一个核心的实体,这个实体的每一个特征及相关的外部信息构成了该实体的特征空间,而这些特征都能在画像中得到展现。对用户画像而言,用户就是画像中的实体,该用户的基本信息、学历、工作以及个人信用、社会关系等都是这个用户的特征,用户画像就是在这些特征和数据之上构建出来的。图2.1 用户特征画像的构建离不开真实的数据,数据量越多、真实度越高,一幅画像的准确度就越高。画像有着非常广泛的作用,主要表现在:(1)精准营销:根据用户需求,精确推荐,提高成功几率,节约时间,提升体验;(2)数据挖掘:进行价格预估、成交预估、销售指导、定价指导评估;(3)统计分析:基于画像数据可以方便构建数据立方体,从各个角度进行分析解读;(4)业务运营:业务运营分析以及竞争分析,影响企业发展战略;(5)其他:对服务或产品进行私人订制、进行效果评估,完善产品运营,提升服务质量等可以看出,企业通过用户画像可以进行精准营销,能更好地服务用户,同时也能提高自身的效率和利润。2.2 用户画像相关技术阿里云提供了构建用户画像所需要的一整套解决方案,主要包括大数据计算平台MaxCompute、大数据应用开发环境DataWorks和报表展示QuickBI。2.2.1 MaxComputeMaxCompute (大数据计算服务,原名ODPS)是阿里云推出的一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。MaxCompute主要服务于批量结构化数据的存储和计算,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。在面对海量数据场景时,由于单台服务器的处理能力限制,数据分析者通常采用分布式计算模式。但分布式的计算模型对数据分析人员提出了较高的要求,且不易维护。使用分布式模型,数据分析人员不仅需要了解业务需求,同时还需要熟悉底层计算模型。MaxCompute的目的是为用户提供一种便捷的分析处理海量数据的手段,使用户从复杂的分布式计算细节中解脱,轻松达到分析大数据的目的。MaxCompute主要有以下几点优势:(1)大规模计算存储MaxCompute适用于100GB以上规模的存储及计算需求,最大可达EB级别。(2)多种计算模型MaxCompute支持SQL、MapReduce、Graph等计算类型及MPI迭代类算法。(3)强数据安全MaxCompute已稳定支撑阿里全部离线分析业务7年以上,提供多层沙箱防护及监控。(3)低成本与企业自建私有云相比,MaxCompute的计算存储更高效,可以降低20%-30%的采购成本。目前,MaxCompute在阿里巴巴内部已经得到了广泛的应用,每年的双十一天量的订单、资金等信息的处理都是依托MaxCompute完成的,并且MaxCompute以其优越的性能在世界上也赢得了多项荣誉。图2.2 MaxCompute性能对比2.2.2 QuickBIQuick BI是阿里云推出的一个基于云计算的灵活的轻量级的自助BI工具服务平台,其支持众多种类的数据源,既可以连接 MaxCompute、RDS、Analytic DB、HybridDB(Greenplum)等云数据源,也支持连接客户在ECS上的MySQL数据库,还支持本地文件的上传。QuickBI具有成本低、实时高效、操作便捷的特点。它通过智能化的数据建模工具,极大降低了数据的获取成本和使用门槛。通过拖拽式操作和丰富的可视化图表控件,帮助客户轻松自如地完成数据透视分析、自助取数、业务数据探查、报表制作和数据门户搭建等工作。QuickBI有着许多优点,最主要的有:(1)多:支持 RDS、MaxCompute、Analytic DB、本地文件等多种数据源。(2)快:亿级数据秒级响应。(3)强大:内置完整的电子表格工具,可以让您轻松完成复杂的中国式报表的制作。(4)易用:丰富的数据可视化功能,自动识别数据特征,自动智能为您生成最合适的图表。图2.3就是一个使用QuickBI制作而成的地域信息展示页面。图2.3 使用QuickBI制作的地域信息展示页面利用QuickBI可以非常方便地构建用户画像,这也是QuickBI应用较多的场景。图2.4 QuickBI可用于构建用户画像2.2.3 DataWorks数据工场DataWorks (原大数据开发套件Data IDE) 是基于MaxCompute作为计算和存储引擎的用于工作流可视化开发和托管调度运维的海量数据离线加工分析平台,支持按照时间和依赖关系的任务全面托管调度,支持每日千万级别的任务按照DAG关系准确、准时运行,提供可视化的任务监控管理工具,并且支持以 DAG 图的形式展示任务运行时的全局情况。DataWorks是阿里云数加重要的PaaS平台产品,它提供全面托管的工作流服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。从功能上来看,DataWorks主要包括以下几个方面:(1)全面托管的调度。提供强大的调度能力,支持按照时间、依赖关系的任务触发机制,支持每日千万级别的任务按照DAG关系准确、准时运行,支持分钟、小时、天、周和月多种调度周期配置。(2)支持多种任务类型。支持数据同步、SHELL、MaxCompute SQL、MaxCompute MR等多种任务类型,通过任务之间的相互依赖完成复杂的数据分析处理。(3)可视化开发。提供可视化的代码开发、工作流设计器页面,无需搭配任何开发工具,简单的拖拽和开发就可以完成复杂的数据分析任务。(4)监控告警。运维中心提供可视化的任务监控管理工具,支持以DAG图的形式展示任务运行时的全局情况,并可方便地配置短信、邮箱报警,任务发生错误可及时通知相关人员,保证业务正常运行。图2.5所示为使用DataWorks进行可视化开发的场景。图2.6 DataWorks可视化开发界面2.3 本章小结本章围绕阿里云MaxCompute、 QuickBI和DataWorks等产品的主要功能和特点进行了简明扼要的介绍和总结,并对构建用户画像中所涉及到的相关技术进行了介绍,为下一步的工作打下了理论基础。第三章 需求分析本论文聚焦于对购车用户进行用户画像的构建和分析,做好用户画像的构建涉及到两方面的内容,一是当前的汽车销售市场现状以及未来的发展,二是各个企业、销售商对用户画像技术的需求。3.1 汽车销售市场现状汽车行业是一个国家经济发展状况的晴雨表。近年以来,随着我国社会、经济的不断发展,汽车走进了千家万户,汽车的制造、销售行业竞争也随之愈加激烈。众所周知,我国是世界第一人口大国,并且我国经济处于一个高速发展的阶段,可想而知汽车销售在国内是一个多么庞大的市场。3.1.1 当前我国汽车总体现状数据显示,截止2017年,我国汽车保有量达到了2亿辆,占到了全球的20%,并且依然处于快速增长的阶段。从其他国家的情况看,号称“车轮上的国家”的美国,其目前汽车保有量为2.5亿辆左右,单从这一点上看,我们和美国的差距已经很小。图3.1所示为我国近6年以来的汽车销量和增速。图3.1 近6年我国汽车销量从保有量上看,我国的汽车市场已经接近美国,未来的增长似乎有限,但我国每千人拥有的汽车数量约为200辆,而美国的这个数字是800,日本则是591,所以从这个角度说,我国的汽车产业还有巨大的增长、发展空间,相对而言,这还是一个比较年轻的市场。从市场本身出发,近6年以来,我国汽车销量整体呈现快速增长趋势,平均增长速率在8%左右,虽然去年因为政策等原因增速降低,但依然在3%以上,而且从增速趋势可以预见,未来几年汽车销量仍会保持一个较高的水平。3.1.2 不同类型汽车的需求在汽车市场整体上升的趋势中,对不同车型、细分市场的现状和发展不可不察。数据显示,从车型上看,近几年SUV车型可谓火爆,相比之下MPV则较为惨淡,轿车销量则保持平稳增长态势,不同车型的销量可以从图3.2直观地看出来。图3.2 不同车型销量同时随着人们收入的提高,以前让人望而却步的豪车近年来销量快速增长,如图3.3所示,豪车销量增速大部分时间保持在10%以上,普遍高于汽车销售的整体增速,并且随着我国对外开放程度的不断加深,进口汽车的关税下降,相信未来进口豪车的销量会迎来一个高峰。图3.3 豪车销量新能源汽车在这几年的表现分外抢眼,耗油低、无污染等特点成为大众眼中的焦点,如图3.4所示,新能源汽车在2015年其销量增长甚至达到了300%以上,虽然充电桩等基础设施建设目前还不能完全满足新能源汽车的需求,而且国家的补贴政策有所调整导致去年的销量增速有所降低,但后期依然被普遍看好。同时互联网汽车、无人驾驶等酷玩意儿的加入也成了人们在购买汽车时的一个重要参考。图3.4 新能源汽车销量从上面的数据可以看出,经过了这么多年的发展,汽车销售市场在中国仍然有着巨大的增长空间,同时豪车、新能源车辆和SUV车型等是目前和未来一段时期内主要的热点领域,如何在这个快速增长的市场中抢占先机、占有一席之地是车企、销售商不得不考虑的问题。3.2 用户画像技术需求分析汽车销售是一个2C的行业,直接面对的是海量的消费者,每个消费者都有自己的特点和需求,如果能精准把握消费者的消费能力、购车愿望、预期等特征,那必将带来销量的提升和效益的提高,同时,不同地区不同行业内的消费群体一般有着一些共同的特点,如果能针对这些群体特点进行销售策略、投放车型等的精细化调整,那么在带来巨大收益的同时,还能提高效率,减少潜在的浪费和损失。而用户画像正是这样一种根据消费者的特点,为消费者以及消费者群体建立模型的技术和方法。通过用户画像,车企能更好地把握消费者的特点和心理,提高客户的粘度和品牌忠诚度,从而对用户进行精确的定位,发掘出他们真正的需求和消费能力。用户画像分析不仅能对单一用户构建画像,也能对不同地域、不同行业的用户群体进行抽象建模,从而可以从更高的视角、更广的维度分析群体的消费能力、消费需求,根据相应的画像可以进行更有效的广告投放,并可以结合其他服务与车辆一同推销给目标客户,在提高销量的同时也提高了周边服务的利润,最终达到提高用户好感度好和粘度的目的,为企业带来更加长远的收益。要想得到一个尽可能精确的用户画像,离不开大数据的支持,数据量越大、对数据的挖掘越深,得到的用户画像就越能反应出消费者的真实特点和样貌,对于企业而言也才能够更好的发展客户,提高效益。目前业内有多家企业、机构和组织从事专业的大数据分析和用户画像构建等工作,每年都会有针对不同车型、地区、品牌的用户画像报告出炉,各家车企、销售机构对此也十分关注,由此带来的利润增长规模非常可观,因此该技术在市场上的需求很大并处于持续增长的状态。3.3 本章小结本章首先对汽车市场的现状进行了总结,并通过数据展示了汽车市场当前的热点和未来的趋势,由此引出行业对用户画像技术的需求,说明了该技术在市场上有着很高的关注程度,用户画像技术有着非常好的前景和实用价值。第四章 用户画像的构建构建画像主要包括以下步骤:(1)确定目标(2)基础数据收集(3)数据质量保障(4)信息抽象及归类(5)画像信息计算与集成4.1 用户画像模型购车用户画像主要包含了两方面的内容,首先是用户本身的基本信息,包括年龄、性别、学历、收入等信息,其次是用户对车辆的要求、喜好和评价。论文中从多个维度对购车用户的特征进行了描述,如图4.1所示。图4.1 购车用户画像模型4.2 基础数据的收集在大数据应用中,数据的收集是一个非常重要的环节,首先,大数据应用所要求的数据量非常多、非常广,其次数据的准确性会对大数据分析的结果产生非常大的影响。得益于互联网的发展,数据的收集很多都可以通过网络搜索引擎、网络爬虫等方法解决,但是在涉及到用户隐私方面的信息,比如年龄、收入等信息时,数据的收集还存在很大的难度。为了尽可能准确、尽可能多地收集相关数据,本论文使用了网络搜索结合调查问卷的方式进行用户、车辆等相关信息的收集工作,最终收集到数据1500余条,用于本文中用户画像的构建。图4.2 用户调查表4.3 数据处理在完成所有数据的收集后,需要将数据进行一定的处理并进行归纳汇总等操作。对数据的处理包括缺失值的填充、过滤不合理数据等,以保证数据的完整性、正确性,提高数据的质量,然后,经过处理的数据还需要进行抽象、汇总,以将分散、凌乱的数据关联在一起,作为以后建模以及分析的基础。本论文中将最终的数据分成了两个表格,一个为与用户相关的信息,另一个为与汽车相关的信息。如表4.1所示,分别为用户信息数据信息和汽车数据信息以及对数据所进行的处理。表4.1 用户特征数据说明信息说明错误/缺失数据处理性别用户性别取众数年龄用户年龄取平均值年收入用户年收入取平均值学历用户学历取众数行业用户所在行业无车辆类型用户喜欢的车辆类型取众数价格区间用户购车的意向价格区间取平均数关注点用户对车辆的关注点无地区类型用户所在地区类型(一线、二线等)取众数APP用户需要的车载系统APP取众数购车目的用户购车的目的无是否会购买新能源车辆用户对新能源车的态度取“不确定”车辆销量按月份、车型所统计的销量取平均数车辆热度不同车型的热度无4.4 本章小结本章首先介绍了构建用户画像的一般方法和步骤,并从多个维度对购车用户进行了建模,然后重点阐述了数据的收集、处理以及归纳和总结,最终展示了论文中所用到的数据模型和数据表,为下一步进行用户画像的构建打下了基础。第五章 基于阿里云的用户画像构建这一章我们利用收集得到的数据,通过使用阿里云MaxCompute和QuickBI等产品进行用户画像的构建和展示。5.1 数据表的创建大数据应用的第一步就是要创建一个数据集,阿里云支持多种数据集,这里我们直接使用MaxCompute进行数据集的创建。在MaxCompute中可以进行数据表的创建任务,我们将前一阶段收集整理得到的数据放入两张表中,一张为车辆的销售数据表,另一张为用户信息表,这张表共有12个字段组成,包含了我们所获取到的全部用户信息。使用MaxCompute前必须进行必要的注册、申请等工作,在开通了服务之后我们进入阿里云数加平台,进入MaxCompute的工作区,如图5.1所示。图5.1 MaxCompute工作区在工作区我们能够进行很多类型的工作,在这里我们选择“脚本任务”,并在其中输入相应的建表语句建立数据表,并插入数据。其中,用户信息数据表的具体创建语句为:CREATE TABLE IF NOT EXISTS car_user_all_info( gender string , age_field string comment A.18-25岁,B.25-35岁,C.35-45岁,D.45-55岁,E.55岁以上, income_field string comment A.0-10万,B.10-20万,C.20-40万,D.40万以上, top_education string comment A.初中及以下,B.高中/中专/技校,C.大学专科,D.大学本科,E.硕士及以上, field STRING comment 从事行业, car_type string comment A.SUV,B.MPV,C.轿车,D.其他, prefer_price string comment A.5-15万,B.15-25万,C.25-50万,D.50万以上, focus string comment A.动力,B.配置,C.安全性,D.舒适性,E.外观,F.其他, district string comment A.一线城市,B.二线城市,C.三线城市,D.四线及以下地区, app string comment A.旅游类,B.办公类,C.理财类,D.新闻类,E.多媒体视听类,F.其他, dest string comment A.方便上班,B.旅游,C.为了结婚,D.其他, think_new_energy string comment A.会,B.不会,C.不好说,看形势 );create table district_info ( district string , count BIGINT )insert OVERWRITE table district_info select district,count(*) from car_user_all_info group by district在完成了数据的插入上传之后,根据需要的内容从数据表中选择需要的信息建立其他的表,如我们将用户的地区信息建立一张新的数据表并获取相应的数据,得到用户地域分布信息:其他方面的信息我们以类似的方法进行处理,最终得到所有相关的数据表,这些数据表从各个维度对用户特征进行描述。5.2 用户画像的构建在MaxCompute中创建了数据集之后,我们就能通过QuickBI进行用户图像的构建。使用QuickBI构建用户图像的过程如下,首先我们要申请开通QuickBI服务,然后在QuickBI中选择相应的数据源,这里我们直接选择在MaxCompute中创建的数据集即可,如图5.2所示为我们进入QuickBI创建项目并选择相应的数据源,最后选择合适的图标类型进行用户画像的构建。图5.2 QuickBI选择数据源在正确开通了服务之后,我们选择在MaxCompute中创建的数据表,并分别在其上创建QuickBI数据源,为下一步构建画像进行数据的准备,如图5.3所示为我们最终建立的数据集列表。图5.3 QuickBI数据集列表在数据集建立完成之后,我们就可以进行最终的用户画像的构建。首先进入QuickBI的仪表板工作区,新建仪表板,在这里我们会看到各种不同类型的图表,每种图表都有自身适合的场景。我们以用户地域分布信息为例,首先选择相应的数据集(已在上一步中创建),经过分析,用户的地域信息适合使用饼图来进行展现,于是我们就选择饼图图表向工作区中添加一个新的饼图,然后将相应的用户地域信息数据集与饼图进行绑定并设置维度轴和值轴,最后我们得到用户的地域分布信息如下所示:图5.4 使用QuickBI构建的用户地域分布图QuickBI的一大优势就是操作简单功能强大,通过简单几步就能得到内容丰富的图表。与用户地域信息类似,我们通过相似的操作即可完成其他信息的展示,并构成最终的用户画像。图5.5即为我们最终构建得到的用户画像的部分内容。图5.5 使用QuickBI构建的用户画像5.3 本章小结本章我们通过使用阿里云MaxCompute和QuickBI等工具完成了用户画像的构建,主要内容包括数据表的建立、数据集的创建以及图表的选择和展示等,得益于阿里云运算功能强度大、操作使用方便的有点,用户画像的构建成为了一项简单而富有生趣的过程。最后我们完成了用户画像的发布。第六章 用户画像分析在基于阿里云提供的各种服务完成用户画像的构建后,我们对用户数据和画像进行了分析和总结,并得到了一些有用的结论。 6.1 用户特征分析6.1.1 购车用户的性别和年龄分布性别和年龄属于购车用户的自然属性。在我们获取到的数据中,购车用户的性别以及年龄的分布如图1所示。 图6.1 购车用户性别分布从图中可以看出,从性别上来说,购车用户中男性占了绝大多数,而从年龄上来说,25-35岁的用户占了多数,其次是18-25岁。从这两组数据中可以知道,男性和年龄在25-35岁之间的人群,对于车辆的购买意愿是最强烈的,这类人群普遍面临着安家置业、创业经营等显示需求,所以这类用户在购车用户中所占比例最大,销售企业应该根据这些特点,对这类人群倾注更多的关注。6.1.2 用户的学历在收集到的用户数据中,统计表明本科学历占总人数的比例最高,达到了57.47%,如图6.2所示。从学历分布来看,本科及以上学历对汽车的关注度较高,并且购买车辆的意愿也较为强烈,对于企业而言学历可以作为一个客户购买潜力大小的一个重要参考。图6.2 用户学历6.1.3 用户所处地域按照一、二、三线城市和其他地域对用户进行分类统计,如图6.3所示。结果表明处于二线城市的人占了绝大多数,一线和三线城市人群比例基本持平,其他地区则占比较少。从地域角度可以看出,地区的发展水平越高,人们的购买意愿和购买能力也较高,特别是二线城市,虽然不如一线城市发达,但城市的未来潜力更大,且相较一线城市发展空间也更广,所以企业应更加关注二线城市。当然,三线以下城市潜在购车人群占比少并不意味着这些地区没有前景,也许以后这些地区的机会更加广阔,只是现在的需求并没有得到完全释放,所以企业在发展的同时也应该对这些地区进行关注。图6.3 用户地域分布6.1.4 用户的年收入用户的收入情况能够直接反应一个用户的购买力水平,为此,我们专门对用户的年收入情况进行了统计,结果如图6.4所示。从中可以看出购车用户的收入水平大部分集中在0-10万之间,其次为1020万,因此在制定销售策略时如何发掘该部分用户的消费潜力非常重要。图6.4 用户的收入水平6.1.5 用户喜欢的车型我们以用户较熟悉的轿车、SUV和MPV等车型为类别,统计了用户对不同车型的喜爱程度,如图6.5所示。从结果中可以看出,国内用户对SUV车型的喜爱程度较高,远远高于轿车和MPV,同时MPV车型的关注度最低。从用户对不同车型的喜爱程度可以看出,SUV车型将是现在和未来市场上最受关注的车型,这也意味着SUV在市场上的占有率将会进一步提高,未来的销量将会非常可观。所以从销售商和厂家的角度来看应该提高对该车型的研发和推销力度,同时,从用户的角度来看,一个车型在市场上关注的人越多,意味着企业的竞争越剧烈,产品的质量也会更好,企业对产品的优惠力度、售后服务等也会有所提高,所以多关注热点车型对于自身也是非常有利的图6.5 用户对不同车型关注度6.1.6 购车用户的意向价格区间图6.6所示为我们统计的购车用户的意向购买价格区间,从中可以看出大部分购车用户的意向价格集中在5-15万和15-25万之间,因此车企在推出新车型以及销售商在推广时应重点关注这两个价格区间。图6.6 购车用户意向价格区间6.1.7 车载APP用户投票目前汽车正朝着智能化、车联网、高科技等方向大步发展,汽车不再仅仅是一个代步工具,而是逐渐成为了一个娱乐、生活工具,所以在本次任务中,我们也对目前市场上的车载APP进行了用户投票,如图7所示。结果表明,用户对旅游类、多媒体视听类APP最青睐,其次为新闻类,企业应当对这几类APP投入更多精力,研发体验更好的APP,为用户带来方便的同时也能够增强自身产品的用户友好度。图6.7 用户对不同APP的喜好6.1.8 用户对新能源车辆的看法目前,新能源车辆是市场的热点,也是国家、社会重点发展的方向之一,为此,我们特地收集了用户对新能源车辆的看法的数据,如图6.8所示。结果表明,大部分用户对新能源车辆的未来是非常看好的,比例达到了56.32%,但是不看好的人也不在少数。据此,企业在发展新能源车辆的同时,应更加注重对新能源产品的宣传,打消人们对于新能源车辆的疑虑。对于用户而言,应该多关注一下新能源车辆,毕竟,无论是从政府层面还是市场层面,以及大众心理层面,新能源车辆都将在未来取得巨大的发展进步。图6.8 用户对新能源车辆的态度6.1.9 用户购车的目的在此次任务中,我们也对用户购车的目的进行了调查分析,结果如图6.9所示。从中可以看出,因为婚姻而购车的用户比例占有绝对优势,可以预见,在有购车意愿的人群当中,即将结婚的人会占据大多数,这也为销售上制定销售策略提供了一定的参考和依据,同时,以旅游出行为目的的购车人也不在少数,这类用户一般工作生活较为稳定,且注重提高当前的生活质量。图6.9 购车用户购车目的6.1.10 用户所处的行业我们对购车用户所处行业进行了统计,结果如图10所示。从结果中我们可以看出,身处IT、政府等行业部门的人占比最多,说明了这两个行业内的人有着较高的消费能力,是销售商需要重点挖掘的购车群体。图6.10 购车用户所处行业6.2 用户画像总结通过以上对购车用户的归纳分析,我们得出了以下几个结论。6.2.1 用户分类通过聚类分析,我们把用户主要分成了以下几类:(1)消费能力很强,买车意愿很足。该类用户具有以下特点,25-35岁,本科或以上学历,在二线城市的IT或政府部门工作生活,收入普遍在15-25万之间,且将要面临婚姻大事;(2)消费能力较强,买车意愿较足。该类用户具有以下特点,35-45岁之间,大专或以上学历,收入在5-25万之间,工作收入较稳定,且有较强的改善生活质量的意愿;(3)其他用户。除了以上两类用户特点比较鲜明,其他用户占比相比较少,特征不够明显需要有更多的数据对其进行分析。分析结果表明,学历越高、收入越高的人对于车辆均有着更好更高的追求,也愿意为车辆投入更多的资金,而地域与收入之间呈现出明显的正相关关系。因此,企业在制定销售策略时,可以针对不同地域、不同学历、不同收入的人进行更加个性化的推销和宣传,针对用户的不同特征,分析该用户的消费潜力、目标类型等,进行更加精准的营销。6.2.2 市场热点1. SUV将是未来市场上的热点。从数据上可以明显看出,无论是用户的喜爱程度,还是市场销量的增速,SUV车型都处于一个快速的发展阶段,在以后的市场上会占据很大比重。2. 新能源汽车正在得到越来越多的人的看好,随着社会科技的发展进步,新能源汽车将会在未来快速成长,而企业应该加强对新能源汽车的投入,销售商则应加强对新能源汽车的推广。6.3 本章小结本章在前面所做工作的基础上,对用户数据和画像进行了分析总结。通过总结归纳,我们将潜在的购车用户群体进行了分类,为厂家提供参考,同时我们分析了未来汽车市场的热点车型和方向,这对于车辆生成和销售企业而言有着重要的价值。第七章 总结与展望本文以当前汽车产销市场的需求为牵引,使用阿里云提供的大数据产品和服务,完成了购车用户画像的构建和分析。本文中主要完成的工作主要有以下几点:(1)阐述用户画像的基本概念、用途以及构建过程;(2)详细介绍了阿里云的相关产品,如MaxCompute、QuickBI等;(3)对当前的国内汽车产销市场进行了调查分析,并对未来的发展进行了一定的分析预测;(4)基于阿里云完成了用户画像的构建,并对用户数据进行了详细分析。虽然我们完成了很多工作,并最终完成了用户画像的构建,但目前仍然存在着一定的缺陷和不足,突出表现在:(1)数据的收集手段较为单一。限于当前的条件和客观环境,我们只能在一定的范围内,通过比较简单的方法进行数据的收集工作,一来导致数据的来源较为单一,二来也导致数据量也较为不足,对最终的结果造成了不利的影响;(2)对数据的挖掘不够深入。目前我们主要完成了数据的基础分析工作,但对数据信息的挖掘还不够,下一步,我们应当深入挖掘用户各个维度数据之间的隐藏关系,更深层次地对数据进行分析,这样得到的结果也会更加准确可靠。用户画像有着直观、清晰、简洁明了的特点。对企业而言,用户画像能够帮助企业制定更加有效可行的生产计划和销售策略,对于客户而言,用户画像同样能提供有用的信息,使得客户在选购适合自己的产品时能拥有更多的参考。由此可见,用户画像有着巨大的实用性和经济价值。人类社会已经从IT时代走进了DT时代,大数据在未来的生活、生产方面必将会对我们每个人的生活、工作产生深远影响。这是一个变革的时代,大数据就是这个时代最鲜明的特点,也是未来人类前进的方向,希望我们能在这个伟大的时代站上浪潮之巅。参考文献1 顾炯炯. 云计算架构技术与实践M. 北京:清华大学出版社, 2014. 215-2392 阿里云帮助文档. 云数据库 RDS 版:MySQL版EB/OL. /product/26090.html?spm=a2c4g.750001.2.34.ZUPgu43 阿里云帮助文档. Quick BI EB/OL. /product/30343.html?spm=a2c4g.750001.4.20.KwvPiN4 阿里云帮助文档. MaxCompute EB/OL. /product/27797.html?spm=a2c4g.750001.4.23.ugvqPy5 阿里云帮助文档. DataWorks(数据工场)EB/OL. /product/30254.html?spm=a2c4g.750001.4.26.iTYJa46 汽车行业大数据分析报告/view/d98fca35fd4ffe4733687e21af45b307e971f95e.html?rec_flag=default&mark_pay_doc=1&mark_rec_page=1&mark_rec_position=5&mark_rec=view_r_1&clear_uda_param=1&sxts=15273101919297 The Connected Vehicle: Big Data, Big Opportunities/content/dam/SAS/en_us/doc/whitepaper1/connected-vehicle-107832.pdf8 基于大数据的用户画像构建/view/f9a3373982c4bb4cf7ec4afe04a1b0717fd5b349.html致谢经过近半年时间的学习探索,我终于完成了这篇论文,这也是我人生中第一次与大数据直接打交道,回首一路来的历程,感慨良多。首先,感谢阿里巴巴开发的大数据平台,一直以为大数据是一个有着很高技术难度的行业,但是在使用了阿里巴巴的工具后,我被这些工具的易用性折服了,如果没有这些工具,试想一个初入门的菜鸟怎么可能尽快掌握大数据分析、开发的要领呢。阿里巴巴是一家伟大的公司,祝愿你越来越好!其次,我要感谢我的导师,xxx老师。每次有了问题,老师都能及时为我提供准确的解答,排除我的疑惑。老师对工作认真负责,即便工作忙,也会抽出时间解答我的疑惑,甚至有时候在很晚的时候,依然为我提供帮助。可以说,没有老师的帮助,我的毕业设计将会寸步难行。同时,老师每次都会与同学们积极互动,得到了同学们的一致好评。再次感谢张老师,祝您生活愉快,生活幸福。最后,我要感谢大数据分析专业的同学们,虽然我们未曾谋面,但你们依然让我感觉到了家庭的温暖,谢谢你们。再次感谢帮助过我的每一个人,谢谢你们!没有你们,我真的不知道我是否能够坚持到最后。在生活的重压下、在职场的奔波中,是你们让我感受到了久违的温暖。愿我们永远青春永驻,实现我们的梦想。附录1 数据导入数据库Python脚本# -*- coding:utf-8 -*-import pandasdef createTable(tableName): sql = CREATE TABLE IF NOT EXIS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版家庭住宅短期租赁合同
- 二零二五年度旅游宣传广告投放合同范本
- 2025版水利工程建设项目施工合同制定与论文分析
- 2025版节能型卷帘门安装与能效检测合同
- 2025版美甲店员工试用期聘用合同规范模板下载
- 二零二五年度医药电商平台合作协议
- 二零二五年度珠宝首饰经销商代理销售合同范本
- 二零二五年度住宅室内装修及智能家居系统合同
- 二零二五年北京专业租车服务合同细则
- 洗浴中心薪酬体系管理办法
- 核心素养下小学数学项目式学习的设计与实施
- 2025年广东省职工劳动合同书模板
- 短绒加工合同协议
- AI在化学史教学改革中的应用与探索
- 智能医疗设备使用者免责条款协议书
- 《工业战略性新兴产业分类目录(2023)》
- DB32-T4743-2024重点化工企业全流程自动化控制配备和提升规范
- 腺垂体功能减退 教案
- 交通银行个人消费贷款合同(格式文本)
- 2025睿实消防自动跟踪定位射流灭火系统说明书
- 绿色施工管理体系与管理制度模版
评论
0/150
提交评论