2016建模国赛B题.doc_第1页
2016建模国赛B题.doc_第2页
2016建模国赛B题.doc_第3页
2016建模国赛B题.doc_第4页
2016建模国赛B题.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

. 2017高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2017 年 9 月 17 日赛区评阅编号(由赛区组委会评阅前进行编号):2017高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): “拍照赚钱”的任务定价摘要本文就企业做市场调查时采取的“拍照赚钱”模式的定价规律展开研究。我们绘制了任务点在地图上的位置后,发现任务点围绕深圳、广州、佛山、东莞四个城市的中心点呈散射状分布,并根据城市具体情况及会员信息逐步建立更加适应实际情况的任务定价模型。对于问题一,我们应用KMEANS算法和聚类分析的思想以城市为主划分出四个区域,研究得出任务定价与距城市中心点的距离、人口密度、交通状况等因素呈现正相关,并建立了最小二乘法线性拟合模型得出广州市任务定价与距离的关系式:。最后根据收集到的信息分析出任务未完成的原因有:定价不合理,交通不便、APP推广率不够高、不同城市的人面对兼职心理状态不同等原因。对于问题二,我们筛选任务成功的点的经纬度以及定价数据建立多元回归模型,再将未完成任务点的经纬度数据带入模型求解其合理的定价。回归模型的定价函数:。接下来建立模糊综合评价模型得出新的定价方案可以提高任务的完成度,更具有合理性。对于问题三,我们将附件一中距离最近的三个任务点打包在一起,利用欧式距离算法算出三个任务点到其所对应的中心点距离的最小值。其次,增加限定条件:达到规定的信誉度额的用户才可以领取打包任务。打包定价模型函数式为:。最终任务的完成度没有改变,而需要投入的成本减少了。针对问题四,我们利用BDP数据分析平台对附件三中经纬度数据进行处理,发现任务点位于广州区域以及深圳区域,运用聚类分析对任务点进行分区,。利用问题三的打包定价模型以及问题二的多元回归模型分别求出各任务点的定价。之后运用模糊综合评价模型评价两个模型得到的结果,发现打包定价模型更具有优越性。最后本文给出了误差分析并提出了改进方案,并讨论了本模型的优缺点。关键词:BDP 最小二乘法线性拟合 多元回归 任务完成度 模糊综合评价模型一、 问题重述 随着移动互联网时代的兴起,一定程度上更优于传统市场调查方式的“拍照赚钱”进入人们的视野。这种基于移动互联网的自助式劳务众包平台,大大节省调查成本,确保了调查数据的可靠性,又缩短了市场调查的周期。用户在APP上领取并完成需要的拍照任务,便可获得对应任务所标定的酬金。而为了保证商品检查的成功,APP中的任务定价便尤为重要:问题一:根据附件一中包含任务位置、定价及完成情况的已结束项目的任务数据,探究任务的定价规律,分析任务未完成的原因。问题二:为附件一中的项目设计新的任务定价方案,并与原方案进行比较。问题三:在实际操作情况下,多个任务可能因为位置比较集中而造成用户的争相选取,考虑将这些任务打包发布。由此对问题二中确立的定价模型进行修改,研究这种考虑对最终的任务完成情况产生的影响。问题四:对附件三中的新的检查项目任务数据给出任务的定价方案,并评价该方案的实施效果。二、 问题分析从宏观上来看,问题一、二、三、四其核心问题均是对众包系统定价的研究,且相互之间又有一定的联系。我们以众包系统的定价为起点做出对整个问题研究的思维导图。2.1 问题一的分析为了更加直观的观察任务点的位置,我们利用BDP工具找出了各个任务点在地图上的位置,得到了各个任务的完成情况分布点图。我们根据任务分布点的密集程度将全部的任务区域划分为以深圳市、广州市、佛山市以及东菀市为主的四个区域。选取四个区域的中心点,画出每个区域内各点与中心点之间距离与价钱的关系线性图,通过拟合线性曲线,得出任务定价的变化规律为:任务点距中心点距离由近至远依次增大。根据分布点图我们发现未完成点具有一定的密集性,以深圳市、佛山市以及广州市的部分区域为代表,以人均收入水平、交通状况以及人均空余时间为纬度定量的研究该地区未完成的原因。2.2问题二的分析在问题一中我们已经得知价格合理性需要从距离、会员的位置、APP的推广状况以及潜在劳动力这四个维度的进行考虑,将附件一中已完成的点选取出来默认其价格的合理性,即就是以此为标准,分别在问题一中所划分的四个区域内进行回归分析,求出其新的定价规律。建立模糊综合评价模型对新模型进行评价,比较之前的模型评价改进效果2.3问题三的分析我们将附件一的数据将任务点重新进行打包分类,在四个区域内计算各任务点两两之间的距离,将距离最近的三个任务点打包在一起,利用欧式距离算法算出三个任务点到其所对应的中心点距离的最小值,求最小距离点与其余两点之间的距离之和加上最小距离,以此为新的距离。此时APP的普及率并不发生变化。利用在问题二中计算出的公式带入即可新任务点的价钱的制定,其次增加一个限定条件,设定一个信誉度额只有在这个信誉度额以内的人才可以选取任务。2.4问题四的分析我们利用BDP软件对附件三所给数据进行处理,对其所对应的任务点进行化区,发现任务点属于广州区域以及深圳区域。利用问题三所定义的新的定价模型求出各任务点的定价与线性回归模型求出的定价进行比较。三、 模型假设1.假设没有人跨城市做任务;2.假设任务完成的任务点定价合理;3.不考虑任务执行期限;4.假设所有任务都在同一时间开始发放;5.不考虑交通状况对任务完成的影响;6.假设题设给出的任务都由同一平台提供;四、 符号说明符号含义各任务点到城市中心的距离任务点所在纬度城市中心点纬度任务点所在经度城市中心点所在经度任务点到城市中心点间的距离CFHuixi lij线性拟合待定系数任务定价会员位置任务的完成率潜在劳动力随机干扰项潜在劳动力,APP的推广状况线性回归方差任一任务点第i个指标第j级评语的隶属度第i个目标权系数深圳、广州、佛山及东菀的模糊矩阵会员到中心点的距离任意两任务点之间的距离五、 模型的建立与求解5.1 问题一5.1.1任务点分区域附件一给出的项目数据包括:纬度、经度、定价以及任务的完成情况。我们利用BDP数据分析平台找出任务点在地图上的位置,探究任务点的定价规律与任务点位置的关系,得到如图1的任务分布情况。其中蓝点表示任务完成情况为“0”,即该任务未完成;相应的,绿点表示该任务完成。图1 任务点在地图上的分布点图由分布图我们可以直接观察出任务点都分布在我国广东省境内,以深圳市、广州市、佛山市以及东菀市四个城市为主,且任务点围绕四个城市分布,具有一定的密集性。在考虑任务的完成情况下,我们将上图划分为四个区域(具体划分方法见下文步骤2、3),确定各个区域的中心点,再求出各任务点距中心点的距离,利用MATLAB画出定价与距离的关系进行线性拟合,具体操作步骤如下:第一步,城市中心点的确定。在深圳市、广州市、佛山市及东菀市的城市中心分别确立一个点作为该城市的中心点。利用KMEANS算法原理计算出各城市中心点,其经纬度分别取为: 第二步,计算各任务点到每个城市中心的距离。根据附件一所给出的任务点的经纬度数据求出各点距上述4个中心点的距离,具体的计算公式为: 其中 表示任务点到中心点的距离,表示任务点所在的纬度,表示中心点所在的纬度,表示任务点所在的经度,:表示中心点所在的经度。将附件一中任务点经纬度数据及各城市中心点经纬度数据带入公式得出各个城市中心点到任务点的距离数据,绘制如下表格。(正文中只截取了部分数据,全部距离数据见支撑材料)表1 任务点到城市中心点距离对比表格任务号码任务gps 纬度任务gps经度距各城市距离/m深圳广州佛山东菀A000122.56614225113.98083687006.01796042.84103714.2571337.75A000222.68620526113.940525217763.5883993.5893929.2743173.28A000322.57651183113.9571986304.73693507.92101036.155279.92A000422.56484081114.244571132838.74116972.3127925.570952.5第三步,区域的划分。比较任务点与各城市中心点之间的距离。任务点距离哪个城市的中心点最近便划入该市区域内研究定价规律。5.1.2最小二乘法线性拟合模型第四步:线性拟合。我们采用线性最小二乘法对距离和价格进行拟合,具体操作步骤如下: 其中表示任务点到中心点间的距离;表示待定系数;表示任务的价格。寻求使的值最小选取为该线性拟合曲线,利用MATLAB得到 p1 = 0.0001433 (0.0001149, 0.0001716),p2 = 66.59 (66.04, 67.15)其中p1、p2括号为该变化范围,我们取均值进行计算。所以任务点价格拟合函数为:我们先以广州市为例,利用MATLAB软件绘制出广州市区域内各任务点与城市中心点的距离与定价变化的折线图,并绘制拟合曲线(如下图2)。图2 任务点定价随距离变化折线图东莞与佛山的拟合曲线与广州市类似,而深圳与之不同的是:中心点聚类不甚明显,定价主要沿铁路分布。点的大小代表价格由高到低。图3 深圳市任务点定价分布图定价规律:广州市任务点的定价是以城市的中心向外逐渐增加。虽然有个别点的价格突变,但大体上呈现上升趋势。即在人口密度较大,交通较为便利的城市中心定价低,最低为65元;随着距离城市中心越来越远,任务定价也逐步上升,最高为85元。此外在机场、公园、郊区附近这类偏远的地区,任务定价也在一定程度上进行提升。此外,由深圳市的任务分布图还可以看出沿着铁路路线,公交车路线分布的任务点定价较低,交通不便利的山区、郊区等地定价高。 5.1.2任务未完成原因的分析根据上文我们发现任务定价与距城市中心点距离呈正相关,再综合我们收集到的信息得出:距离、会员的位置、APP的推广状况以及潜在劳动力对定价具有一定的影响力。接下来分析深圳、广州以及佛山完成率较低的原因。会员的位置:通过附录2得到的会员的经纬度即为会员的位置。会员的疏密程度会影响到该地任务的完成状况;APP的推广状况:以任务完成率衡量。APP的普及率会直接影响该任务的完成情况;潜在劳动力:通过对以日结算的低门槛兼职数据(浏览量、申请量以及需求量)的收集,以衡量当地潜在劳动力的水平。潜在劳动力大提升价格效果明显,相反潜在劳动力小提升价格并不会有明显的效果;表2 四个城市的潜在劳动力情况表浏览量申请量需求量广州市29491492646963佛山市53133169912022深圳市22202070453674东莞市28151887886800表3 APP的推广状况表广州市佛山市深圳市东莞市任务完成率0.59930.63790.32810.9884以下为会员位置总体状况图由上面的信息我们可以分析出任务未完成的原因有:1.不同城市的人面对兼职的心理状态不同。佛山市的APP推广度高于深圳及广州,但该区域内的人对兼职信息不感兴趣,致使任务完成率低。2. APP推广率不够高,已有的用户时间精力有限,无法完成全部任务。广州以及深圳潜在劳动力状况良好,但APP的使用并不普及致使任务完成点较少。从而也反面的证明了指标的选取对于价格的合理性具有一定的影响作用。3.任务点位置偏僻,交通不便利。用户认为花费时间和金钱去完成任务不值得,任务点定价不够合理。4.工作忙碌,空余时间较少,没有时间精力。或者用户认为价格距离自己预期差太多,不屑于做。5.2问题二的建立与求解在问题一的分析中,我们已经得出任务点距城市中心点的距离、会员的位置、APP的推广状况以及潜在劳动力对合理定价的制定具有影响明显,现在我们就这四个因素建立多元线性回归模型,制定出合理的定价方案。假设某地任务完成便可看作为该地定价合理,只取已经完成任务的点的经纬度以及定价数据建立模,再将未完成任务点的经纬度数据带入模型求解合理的定价。之后为了分析新的定价方案对任务完成度的影响,我们建立模糊综合评价模型对新的定价方案进行评价,再与问题一最小二乘法线性拟合所求的定价方案进行比较,具体步骤如下:5.2.1多元线性回归模型第一步,设定新的定价方案。在问题一分区域的基础上,确定各个区域再估计定价随距离、会员的位置、APP的推广状况以及潜在劳动力的变化方程为:其中d:任务点到中心点的距离C:会员的位置F:APP的推广状况用区域任务的完成率来代替H:潜在劳动力:随机干扰项做如下辅助性回归(ui为残差)由于假设里包涵了异方差的情况,可以证明从辅助回归算得(n为样本容量) 逐渐服从辅助回归中回归元个数的分布即就是: (df=4为自由度水平)若上式中的值值超过选定水平的的临界值,则说明该存在异方差,否则不存在异方差即就是: (i=1,2.n) (i=1,2.n)通过whit得出故存在异方差利用whit给的异方差效正方程带入数据,在带入数据时默认任务完成点为价格匹配程度最高,筛选出附录1中的完成点分区进行计算,由于数据较多这里仅给出数据来源。图表2:潜在劳动力状况 与图表3:APP推广状况在问题一中已经插入过;任务点到中心的的距离表与会员到中心点的距离表数据见支撑材料。我们用MATLAB软件编程将成功任务点的数据带入多元线性回归模型中,求解的出新的定价规律为:5.2.2模糊综合评价模型第二步,建立模糊综合评价模型。并与原方案进行比较:列出模糊矩阵其中表示第i个指标第j级评语的隶属度。对m个目标进行综合模糊评价时,设第i个目标权系数为,满足综合模糊判断矩阵:在第一步中我们已经知道距离、会员的位置、APP的推广状况以及潜在劳动力在定价方程中所对应的系数分别为(0.007326,0.00072,0.00043,0.32)。将其调整为对权重分别为(0.02230361,0.00188285,0.00112448,0.83682008)即将以四个区域为基准进行分块,其中 其中分别表示深圳市、广州市、佛山市以及东菀市的模糊矩阵,数字分别代表各区的标号。分别表示在该区域内会员的个数。分别为各任务点到中心点的距离;表示会员到中心点的距离; 当表示潜在劳动力表示APP的推广状况利用附表一中的数据得到问题二的多元回归定价模型的判断矩阵值用同样的方法可以得到问题一中的线性拟合定价模型所得到的判断矩阵值很明显中各数值的和很明显大于各数值的和,即新的定价方案较原来的定价方案更为合理有效。5.3问题三的建立与求解在问题二中我们已经求出价格随距离、会员的位置、APP的推广状况以及潜在劳动力的数值变化的表达式,而问题三中任务的打包只会对定价规律计算式中的距离造成影响,而会员的位置、APP的推广状况以及潜在劳动力并不会随任务点的打包发生变化,所以距离的选取即是该问题的核心。其次由于任务点的集中打包对威客客户点个人能力的要求也会上升,所以在执行任务的人的信誉度上做要求,即增加限定条件,只有满足某个信誉度额的用户才能获取打包任务。具体的操作步骤如下:5.3.2距离的选取以及计算第一步,距离的选取。1) 打包方式的选取:求出附件一中同一个区域内所有点的距离(具体数据见支撑材料)。取确定两点以为基准展开,找到距最近的两个点对比取最小点与所组成的为一组记为一个任务点,依此类推则可以得到最终所划分过后的任务点的个数。2) 距离的计算:取任意一组任务点,算取其到中心点的最小距离,考虑新的任务打包其成本必须低于原来的成本,且在威客客户端对新定价满意即就是新的定价要高于原来三个点中任意一个任务点的定价,所以对其距离进行调整,令距离为距中心点最小距离加上最小距离点到其余两点间的距离其中,由三角形的特性可知该距离的选取具有合理性。如上图最短距离为db,因为db+dabda,db+dbcdc所以db+dab+dbcda,db,dc由问题二我们得到的定价规律为:即距离与价格存在正相关,所以以上距离的选取具有合理性即就是最终定价大于其中任意一任务点的定价,最终公式为:(2) 限定条件:结合附表2所给的的会员信息对会员进行分类对附表2进行数据处理得到会员信誉度的最小值为0.0001最大值为67997.3868。将其划分为8个等级如下表:表4 会员信誉度等级划分表等级HGFEDCBA信誉值08500850017000170002550025500340003400042500425005100051000595005950068000在打包完成后对于离散点没有等级的限制,即低等级用户可以在第一轮任务选取时只显示离散任务点,用户可以通过做离散点的任务提升自己的信誉值进而提升自己的等级。而对于已经打包的任务点只有在F等级及以上才可以选取该任务,通过筛选得出会员数与所调整后的任务数量进行比较,发现会员数量远远大于任务点数量,所以并不担心任务供过于求的局面。即综合以上可以得出该模型为:5.4问题四的建立和求解给出定价方案 并评估效果如何1.将地区打包好2.由数据知,在剔除掉低信誉值的会员后,打包任务个数任然小于会员数目,故在将任务打包时,优先给出距离较近的任务提供给高信誉值的用户,并相应的减少价格,再将偏远地区以及打包三点任务距离较远的任务交给其他信誉程度的用户,通过减少任务数并增加可完成任务人数来增加偏远地区的任务完成率并相应降低价格。且通过这种会员信誉值优先选择的制度,能促进用户良好行为的发展,增强平台的发展能力。3.任务的完成时间很大程度上决定了每件任务的价位,及用户在单位时间内所能赚取的佣金数,我们以单位时间赚钱佣金数为指标衡量,影响其的有用户信誉值所产生的期望值,接远距离单的人与单数的比值,价钱将影响其转化率,我们将价钱控制在一定的合理度,使得出资能保持一个较低值而又不至于使得任务完成率低于一个高水平值。p0=(k1*log(W)+k2*L+k3*e(p1/p2)*t/(t+L/k4)W 信誉值L 完成任务所需路程t 完成三个任务所需的时间/小时p1 任务数p2 用户数p0 单位时间价格通过多元线性拟合,我们得到k1 k2 k3 k4分别为0.0062873 1.225672 6.78263 0.0234581七、 模型的评价7.1 模型的优点1.模型考察因素合理多样,符合实际情况,图形美观清晰。问题三的多元回归模型考虑指标不仅包括距城市中心点的距离、会员的位置以及APP的推广状况可直接或间接从附件一和附件二中提取出来因素,还包括从网上收集到的重要因素:潜在劳动力。2.算法简单,地域针对性强。问题一和问题二中用到的最小二乘法线性拟合和多元回归算法清晰易懂,且对不同的城市进行了分区域计算,对不同的城市针对性更强,更符合不同7.2模型的缺点1.没有考虑会员任务开始预定时间对模型的影响。2.所有的模型数据来源仅限于广东省,地域性过强,推广程度不高,不具有广泛性。八、 参考文献1 吴瑞杰,孙鹏,孙昱.分布式任务计划动态调整模型及算法.系统工程与电子技术,2007,39(2):322-3282 林素芬.众包商业模式特殊性的理论诠释.长春大学学报,2013,23(5):544-5463 张晓峒.应用数量经济学.机械出版社,20094异方差的white检验及处理方法/view/9947b46e011ca300a6c39079.html2015-9-115宋天舒,童咏昕,王立斌等.空间众包环境下的3类对象在线任务分配.软件学报,2017,28(3):611-6306孙信昕.众包环境下的任务分配技术研究(硕士学位论文).扬州大学,20167 Arnold J, Kchel P. Evolutionary Optimization of a Multi-location Inventory Model with Lateral Transshipments C/ Proceedings of Ninth International Working Seminar on Production Economics. Lynkoping: University of Lynkoping, 1996: 401-412.8 Ester M, Kriegel H P, Sander J Xu X. A density-based algorithm for discovering clusters in large spatial databases C/ Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD96), Portland, Oregon, USA, Aug, 1996: 226-231.9王惠文,叶明.多元线性回归模型的聚类分析方法研究.系统仿真学报,2009,21(22):7048-7059九、 附录9.1.1 问题一绘图代码%以Sx开头的文件均为预处理文件 在对应代码中所用到的参数Sx系列时,需要手动将Sx类的文本数据导入到matlab的数据表中%使用matlab导入附件1for i=1:835if Sx(i,6)20000breakendenddisp(i) c = polyfit(a, b, 2); %进行拟合,c为2次拟合后的系数 d = polyval(c, a, 1); plot(a,d,r) hold on plot(a,b,g)9.1.2各市任务完成率代码%各市任务完成率运算Min,index=min(Sx(:,6:9),2);Gd0=0;%属于广州市的任务数Gd1=0;%广州市完成的任务数Fs0=0;%属于佛山市的任务数Fs1=0;%佛山市完成的任务数Sz0=0;%属于深圳市的任务数Sz1=0;%深圳市完成的任务数Dg0=0;%属于东莞市的任务数Dg1=0;%东莞市完成的任务数for i=1:835if index(i)=1; Gd0=Gd0+1; if Sx(i,5)=1 Gd1=Gd1+1; endendif index(i)=2 Fs0=Fs0+1; if Sx(i,5)=1 Fs1=Fs1+1; endendif index(i)=3 Sz0=Sz0+1; if Sx(i,5)=1 Sz1=Sz1+1; endendif index(i)=4 Dg0=Dg0+1; if Sx(i,5)=1 Dg1=Dg1+1; endendendGdw=Gd1/Gd0%广州市完成率Fsw=Fs1/Fs0%佛山市完成率Szw=Sz1/Sz0%深圳市完成率Dgw=Dg1/Dg0%东莞市完成率%结果%Gdw = 0.5993 Fsw = 0.6379 Szw = 0.3281 Dgw = 0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论