易居网盟小区数据中心建设.doc_第1页
易居网盟小区数据中心建设.doc_第2页
易居网盟小区数据中心建设.doc_第3页
易居网盟小区数据中心建设.doc_第4页
易居网盟小区数据中心建设.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

易居网盟小区资料建设方案2012年9月9日建设方案目录一、建设目标:完善八类网盟基础数据库3二、现有网盟内容存在的问题剖析4三、针对各类问题的解决方案5四、规范物料建设与操作标准7五、具体实施操作流程8 1、全面梳理现有网盟小区数据8 2、打通CRIC系统新房数据与网盟小区数据9 3、竞争对手资料采集与完善9 4、采集估价系统所需小区房号、面积等资料10 5、内容建设平台搭建与系统模块开发10 6、操作流程图121)历史小区文字整体梳理流程122)小区别名/推广名补充流程133)系统图片梳理流程144)CRIC楼盘资料库转化梳理流程144)CRIC楼盘资料库转化梳理流程155)经纪人图片再利用流程(二次审核流程)166)监测竞争对手资料再利用流程177)新收录小区资料整理流程18六、分阶段分步实施时间表19七、团队构架21附件1(城市小区资料质量情况)22附件2(小区图片标准)24附件3网盟小区图片资料采集要求25内容摘要: 网盟二手房的发展需要有扎实的内容来支撑,本次内容建设主要是对现在网盟内容上存在的诸多问题,提出了针对性解决方案。 建立涵盖小区文字、图片、价格等各类型内容建设标准和操作流程规范,从八个方面着手建设,为网盟二手房提供高质量的内容基础。 采用最经济的手段,使用互联网内容采集途径,通过整合内部资源、扫描监测外在资源两方面入手,开展网盟小区内容建设,为网盟二手房提供最扎实的底料内容支撑。 协同克而瑞信息中心一起完成魔鬼估价内容资料的收集,同时又实现补充完善网盟基础数据资料。 计划年底前分3个阶段完成9个城市57305个小区资料、32043373张小区照片的整理工作,9月底前完成北京、上海、杭州的1700万张图片整理工作,使小区图片资料得到极大丰富。 本次网盟内容质量提升工作累计需要约1200个人工。魔鬼估价资料收集约需要2000个人工。一、建设目标:完善八类网盟基础数据库围绕小区建设,提供最齐全、最精准的易居网盟小区数据源,为网盟二手房提供最扎实的基础数据。涵盖:1小区文字涵盖小区名称、地址、建筑面积、物业类型等15个主要字段,细化总计600个字段2小区图片a、图片类别(小区图、房型图、装修图)b、图片时效(新楼转来的、后续拍摄时间)c、图片来源(系统图、经纪人图片)3小区价格每月市场小区均价4小区房源质量把控、智能识别:出售、出租房源5小区空间(房间号)城市空间模型建立,为每个小区每个房间建立编号,形成数字化城市6小区房屋交易价格历史交易价格,供趋势分析7小区资讯小区评价、优缺点、新鲜事等8房产百科交易手续、贷款税费、租赁、装修、政策法律等建立严格的 一 一 对应的关系,确保准确无误。二、现有网盟内容存在的问题剖析1小区文字a、部分小区项目缺失b、小区重复出现c、小区字段内容不完整d、小区别名体系不健全2小区图片a、部分小区图片缺失b、图片归类不清晰:(新楼在建图、乐居活动图、08、09年等收录的图片与现状不符)c、图片质量:精度、大小、尺寸等不统一d、外源图片:有其他竞争对手logo、经纪人字样水印3小区价格a、更新频率不及时,目前几乎不在更新b、人为设定价格变动,程序随机产生4小区房源a、重复度:单人发布同套房源多次b、不合理性:单价200元/平方米,面积为c、几平方米,房源挂牌价远离市场价,如慧芝湖花园单价11万的房源等d、房源分布不均:冷僻小区房源缺失e、房源分散:eju房源、一起搜房源搭配使用5小区空间(房间号)a、城市部分小区有,大部分缺失6小区房间交易价格a、目前只有上海、北京有,其他城市缺失b、成交案例与小区的匹配问题7小区资讯目前为空白8房产百科目前为空白三、针对各类问题的解决方案解决方案1小区文字a、互联网采集(百度百科、搜索快照)b、同类网站数据挖掘c、集团其他采集数据源的整理(如新房资料向二手房的转换)d、小区名、别名体系严格规范,杜绝重复2小区图片a、现有底图的梳理(整理现有图片的时效性、重复性、大小、尺寸、清晰度、其他水印等)b、互联网采集,对比入库(百度图片)c、经纪人图片采纳入库d、集团其他采集数据源的整理(如现房图片)e、组织人工拍摄补充3小区价格a、小区价格初始化(参照现有价格、竞争对手价格、魔鬼估价价格)b、定期(每月)计算,形成价格体系c、建立小区、板块、区域网状价格关联关系d、人工干预机制(程序计算出的价格与上月基准价格的差异幅度超5%,进行人工干预)4小区房源a、房源关键字段重复识别体系(如同小区、价格、面积、楼层、房型等字段内容重复时识别)b、与小区关联控制,如单价与小区价格保持在一定浮动幅度内c、房产常识性指标过滤,如面积为个位数或几十万,价格为零等d、冷门小区房源预警提醒e、Eju房源、一起搜房源资源搭配使用5小区空间(房间号)a、新楼房屋房间资料转换b、组织人员进小区实地调研c、小区房屋成交资料补充6小区房间交易价格a、各地方(交易中心)购买b、经纪人上传交易记录c、交易记录与小区房间号匹对归档7小区资讯a、创建业主论坛b、竞争对手网站相关资料扫描入档c、经纪人参与,发表、解答问题d、每日网页扫描小区关键词新闻8房产百科a、创建Eju房产字典库b、分类,挖掘网站常见问题c、引导经纪人参与,发表、解答问题四、规范物料建设与操作标准1、全国统一使用网盟小区管理平台2、小区内容(文、图)统一为一个出口3、明确小区所需整理内容字段(另附件)4、统一小区文字整体标准:对每一个字段作出定义,所填内容有标准(另附件)5、统一小区图片质量标准:图片大小、尺寸、类型、时效、来源、精度、清晰度等详细标准(另附件)6、严格按照操作流程和规范执行(另附件)1)小区资料新增、修改、删除2)图片资料新增、修改、删除3)小区价格新增、修改、删除7、对各城市进行指标考核1)小区资料齐全率/内容丰富度2)图片齐全率/图片丰富度3)小区价格齐全度/准确度8、文字、图片、价格三类数据接口同步,满足网站展示应用9、黄金眼等小区统一采用网盟小区平台中的小区ID10、将新添加的小区评价、优缺点、新鲜事统一到网盟平台11、小区推广名统一到新网盟小区平台12、增加设置一个小区默认图片13、小区分级定义设置功能五、具体实施操作流程从内、外两方面同时开展网盟小区内容建设,两方面建设,实现小区内容建设最规范、最完善。内部 外部 1梳理规范现有网盟数据文字、别名、图片等2Cric楼盘库内容转化同步应用到网盟小区3竞争对手数据监测扫描AnjukeFangjiaSoufun其他地方性网站4估价相关资料小区房间号小区照片1、全面梳理现有网盟小区数据目标:全面梳理现有小区资料,小区内容(文字、图片)标准规范统一1)、制定文字、图片标准规范定义字段内容、字段重要度,图片大小、尺寸、精度2)、开发小区处理工作平台开发一套工作平台,可以同时处理多渠道(网盟小区、cric、leju、竞争对手)小区数据3)、数据质量筛选内容缺失率高的小区优先处理,重点小区优先处理4)、小区系统图梳理按照图片标准,清洗现有小区系统图库,去重、无效、水印等5)、经纪人图片转化进库再利用经纪人上传的照片,合理补充录入系统图库2、打通CRIC系统新房数据与网盟小区数据目标:充分转化利用cric中小区,新房内容按需同步到网盟二手房小区库1)、开发cric与eju之间数据交换接口,实现同步更新2)、新增两套数据内容自动对比工作平台3)、对有改动变化的字段内容进行人工审核干预:新建小区或修改内容3、竞争对手资料采集与完善目标:实现小区内容人有我有且更优1)、确定挖掘对象:全国性网站:安居客、搜房、房价网 地方性网站(如有特殊需求由地方提出申请)2)、开发网络扫描工具,按月定时扫描3)、新增扫描数据与历史数据对比工作平台4)、对有改动变化的字段内容进行人工审核干预:新建小区或修改内容4、采集估价系统所需小区房号、面积等资料1)、确定所需小区名单小区名单由信息中心和网盟二手房共同确定已有房号的小区数目标小区数差额小区数(约)上海30004000100006500北京200050003000杭州500200015002)、组织人员进行实地拍摄采集信息中心制订具体执行标准、操作模型(已经完成)网盟二手房根据网盟需要,提出需求,合并后同时进行克而瑞数据中心组织人员进行拍摄采集,一次完成所有资料收集每人每天可以采集6个小区,约需要2000个左右人工3)、房号及图片录入网盟二手房负责将小区图片同步到网盟小区库,并进行人工筛选去重。5、内容建设平台搭建与系统模块开发1基本管理模块a、基本的输入、编辑b、小区分级c、相关模糊名设定d、图片审核e、图片新增入库f、小区价格管理2质量预警模块小区资料质量提醒3定向筛选模块针对各项功能需求,定制自动筛选4网络扫描对比模块按需扫描各类网站,并进行关键词对比5监测、考评模块对各项工作的进度、质量进行量化考核6任务权限控制模块操作权限定向到人,记录工作日志6、操作流程图无有1)历史小区文字整体梳理流程房源转移到保留的小区中有无无重名是否有经纪人房源标注删除补充资料百度检索资料是否完整补充资料导出全部小区是否有黄金眼百度检索保留资料是否完整根据小区名在平台内模糊检索重名1、 小区的推广名字2、 小区名前加城市名3、 小区名后加小区或住宅字样4、 小区名后加小区字数最长为12个字2)小区别名/推广名补充流程提交保存补充别名小区条件:无别名/推广名的小区筛选小区3)系统图片梳理流程图片标准/数量质量控制时效性提交保存设置封面图筛选 过滤平台检索到该小区导出有系统图片的小区名单4)CRIC楼盘资料库转化梳理流程提交保存补充完善eju小区对比资料(图、文字)创建到eju中eju中有的小区eju中没有的小区筛选出cric中与eju中有差异的小区5)经纪人图片再利用流程(二次审核流程)挑选出合格的经纪人上传对图片提交保存入小区系统库设置封面图小区符合条件:小区系统图5张有经纪人上传的小区图筛选小区名单6)监测竞争对手资料再利用流程提交保存补充完善资料对比eju数据库导入临时表扫描监测竞争对手数据7)新收录小区资料整理流程提交保存质量筛选上传到相关小区文件夹形式打包传送回上海组织收集整理所需小区名单(分等级)网盟增加所需收录内容:1、 小区图2、配套图等六、分阶段分步实施时间表1、总共9个城市,分3个阶段完成上海、广州、深圳、武汉、杭州、沈阳、成都 北京、天津分两批进行:第一阶段,9月30日前完成:北京、上海、杭州小区图片和魔估资料第二阶段,10月30日完成:北京、上海、杭州小区文字内容资料补充和完善第三阶段,12月30日完成:广州、深圳、武汉、沈阳、成都、天津小区图片文字内容资料补充和完善2、全面解决小区内容补缺小区字典、小区内容更丰富、小区图片更齐全,创建最优秀的小区字典小区历史均价、楼栋房间估价易居网盟数据建设issue1632012-09-09 工作时间安排事项第一阶段第二阶段第三阶段9月7日9月9日9月14日9月15日9月 30 日10月 30 日12月30日1拟定小区资料规则规范资料规范制订2搭建小区工作平台小区平台功能原型技术人员组建平台开发3资料整理完善人员到位人员培训上海、北京、杭州(286人工),需要20个人上海、杭州(450人工),需要20个人深圳、广州、成都、武汉、沈阳、天津(430人工),需15人 (1)现有小区系统图片梳理(上北杭)501398/4000(张)=125人工334680 /4000(张)=83人工 (2)经纪人上传图片利用(上杭)5676/200(小区)=28人工4770/200(小区)=23人工 (3)小区价格补充完善(上北杭)11300/500(小区)=23人工29006/500(小区)=58人工 (4)魔估资料转换利用(上北杭)11000/100(小区)=110人工待定 (5)现有小区文字梳理(上杭)18039/80(小区)=225人工22646/80(小区)=283人工 (6)竞争对手资料扫描补充(上杭)数据大约同上,约需225人工数据大约同上,人工数约需283人工 (7)其他日常维护工作其他日常维护工作其他日常维护工作小区平台功能新增三大体系、六个模块备注:克而瑞、网盟共同确定魔估小区名单,各自拟定资料需求,汇总后由克而瑞统一招募小蜜蜂去采集,网盟对资料进行审核后共享使用。七、团队构架附件1(城市小区资料质量情况)城市小区总量有系统图的小区数量无系统图有经纪人图片的小区数量无图片的小区数量房源10套的小区数量房源10套的小区数量系统图数量经纪人图片数量上海1517310917480813021497218932017612636511北京1027026851407931704937138429426609深圳4140335097897810983088710525707390杭州2856208972829310811775969284266601广州537646576272027383007754696199635天津6360458020233259399924735215439南京344626892025761559188755044439949重庆36852265500970795218954496430207成都628648802009200949222767779412033854长沙2421683998901128211802047679258青岛18451317393462894124630344976371石家庄233710235668551086101218995699714苏州1853938511662870107019390299693武汉340721825028261690172534911216838无锡697697102333541114692414济南1384715506226242116321363882569长春1069104716765046322047679263大连16211296502219725109127298633482哈尔滨11181117114077111449431033郑州14141168153305472111914990322073沈阳3437167763412292033141027955349164西安3078969766146519221169376977128348656052941155612304239038354891111235371309017城市小区指标量化汇总城市小区总量有系统图的小区数量无系统图有经纪人图片的小区数量无图片的小区数量房源10套的小区数量房源10套的小区数量系统图数量经纪人图片数量上海1517310917480813021497218932017612636511深圳4140335097897810983088710525707390杭州2856208972829310811775969284266601广州537646576272027383007754696199635成都628648802009200949222767779412033854武汉340721825028261690172534911216838沈阳34371677634122920331410279553491644067529752102866657150591596163338031409993人均工作量配比每人日历史小区梳理80个小区小区补充3050个小区系统图片梳理4000张图片系统图片补充(经纪人)200个小区小区价格梳理500个小区小区价格补充100150个小区小区图片拍摄6个小区魔估资料转化利用100个小区以上工作进度需建立在一个完善的工作平台基础上。附件2(小区图片标准)一、小区系统图梳理规范1、 同一个小区,小区图片数量最多20张。2、 小区图片尺寸大小:大于480*360像素,比例:4:33、 小区图片要求实景拍摄,不能是效果图,沙盘图等非实景拍摄的房源图片。4、 小区图片不能有其他网站的水印,比如:安居客,捜房等网站。5、 小区图片不能含有经纪人名字和联系方式的图章,或者是公司的名称等。6、 小区图片要求清晰、内容角度正确,传的图片要求清晰可见,而且图片内容不能严重偏移或倾斜。 7、 小区图片要求与内容相符,上传的图片要与主题相关,不能上传房型图、室内图或人物照片,或者上传不是该小区的图片等不相关的图片。8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论