已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据处理规范数据库中的数据,是一个搜索类产品的核心内容。数据的质量,更加直接的影响用户的最终体验和日后基于用户行为分析的数据挖掘的能力和准确性。基于此,建立一套合理规范的数据录入方案及标准是非常重要的。本文用以指导蓝页系统运营期间数据导入,从而从源头上保证数据录入的质量,最终提升搜索的速度与精度。文档版本控制:版本修改人日期备注V1.0沈沉2012.1.3创建大纲V1.1沈沉2012.1.6完善与外包数据相关的流程及数据规范V1.2沈沉2012.1.7添加标签规范,修改维护流程V1.3沈沉2012.1.11创建BD维护流程和数据精度审核流程V1.4沈沉2012.1.12重新更改流程,取消BD在系统中的维护工作目录数据处理规范11数据处理流程41.0人员角色定义及权限控制41.1网络数据收集录入流程51.2 BD数据收集流程71.3数据精度审核及制度82 数据收集规范92.1普通商家数据收集规范:92.2菜单数据收集规范:10附录:111范例菜单及饭店数据源:112.美食类分类与标签内容121数据处理流程此部分重点规范数据处理的流程。1.0人员角色定义及权限控制在各数据处理流程中,涉及的相关人员给出如下定义:商务开发(BD)人员:澳洲各地的商务开发人员。同时负责在系统中录入开发的商家数据。人员职责LDM系统权限商务开发(BD)人员澳洲各地的商务开发人员,与商家联系,同时负责在系统中录入新开发的商家数据查看商家数据审核人员负责在LDM系统中审核商务开发人员提交的“待审核”数据,并进行纠错,最终确定需要正式导入系统的数据审核商家,修改商家。查看商家。外包数据团队由产品经理负责监督和联络,对网络来源的信息进行录入。创建新商家,修改商家,查看商家。数据库管理人员负责协调数据的导入,解决数据库技术问题全部权限1.1网络数据收集录入流程说明:1, 武汉团队直接在LDM系统中维护商家,蓝页数据审核员负责审批数据完整度和准确性。2, 数据审核员要在提交之后24小时之内审核,被审核员拒绝的商家数据要在审核员审批拒绝之后24小时内重新提交。3, 武汉团队需要处理系统中的重复数据问题,技术方案与支持由蓝页提供。风险:1, 系统重复数据能否保证全部找出?2, 武汉团队对应分类,标签等需要进行人为判断归类的数据能否保证准确性?3, 蓝页应当如何掌控武汉工作团队(例如,有人离职了的数据重新培训?对报酬要求的提高?)4, 武汉团队的系统维护时间无法控制,审核员面对的是一个不停动态变化的数据库,审核的精度和效率如何保证?1.2 BD数据收集流程说明:1, BD人员按照系统设计的数据收集模板(电子表格)收集数据,之后在DropBox中的特定位置(暂定为“BD上传待审核数据”文件夹)建立名为“BD人员名字_创建日期_商家简称”的文件夹,放入电子表格和收集的图片。2, 数据审核人员每天上班开始时review dropbox 文件夹,COPY所有待审核数据,进行审核纠错。当天需要将有问题数据邮件发送至相对应的BD,将审核通过数据发送至数据维护人员。被审核员拒绝的商家数据要在审核员审批拒绝之后24小时内重新提交。3, 数据录入人员需要排除系统中的重复数据问题,技术方案与支持由蓝页提供。风险:1, 系统重复数据能否保证全部找出?2, BD对应分类,标签等需要进行人为判断归类的数据能否保证准确性,谁来负责此类数据的准确3, 过于严格的系统要求会不会伤害商家的积极性?BD对数据的完整性有多大的处理权限?数据审核员从系统管理出发和BD从业务拓展出发的不同动机是否会有矛盾?4, 武汉数据维护的人员难以面对面的管理,会不会影响流程的进行?1.3数据精度审核及制度此处建议建立与收入关联的数据精度审核制度用以规范武汉团队和BD的系统操作。武汉团队:每月只结算一次通过的“待审核”商家。系统需要能统计出“一次通过的”且“由武汉账号维护的”新增商家数量。2 数据收集规范此部分内容用来规范数据收集的格式。此类规范对武汉团队的数据维护和BD的数据收集维护均有约束。2.1普通商家数据收集规范:根据目前的数据库设计架构,一条规范且高质量的商家数据需要包含:商家名称信息:商家英文名称,商家中文名称:两者至少填一个。商家地址信息:必填项目:商家门牌号,商家街道号,商家街道名,商家所属区/市,商家所在州, 商家邮政编码商家联系方式信息:必填项目:主要商家电话选填项目:备用商家电话,商家移动电话,商家传真电话,商家email,电话号码统一格式:固定电话:03 9888 8888 手机 0430 000 000商家描述信息:文字(必填):中文or英文图片(每个餐馆需要5张,其余不强求),图片需要有合理的名字付款方式:(若后期优化后,应当作为标签信息之一)营业时间:周一周二周三周四周五周六周日6:00AM 7:00PM6:00AM 7:00PM6:00AM 7:00PM6:00AM 7:00PM6:00AM 7:00PM11:00AM 7:00PM11:00AM 7:00PM商家分类信息:商家所属C1分类(必填),指商家所属的一级(较大)分类商家所属C2分类(必填),指商家所属的二级(较小)分类标签输入规范:标签目前氛围三大类:C2分类专门标签,C2分类公用标签及个性标签。具体包含的标签情况请见附录表格.l 专门标签(从标签库中选取):包含维度: “菜品特点”和”特色就餐”这两项对应商家不可均为空。商家在这两个维度下,每个维度最多选择3个标签。l 公用标签(从标签库中选取):包含维度“餐厅氛围标签”:必填,最多选择2个“人均消费标签”:必填,最多选择1个“消费人群标签”:必填,最多选择3个“特色服务标签”:选填,最多选择12个l 个性标签:自行维护,选填,最多3个。2.2菜单数据收集规范:l 菜单信息菜单对应商家:必填菜单收集日期:必填菜单来源网站:必填l 菜品信息菜品名称:中文 or 英文。:必填菜品价格:必填菜品类别:店内分类(若店内菜单没有分类,可以选填)附录:1范例菜单及饭店数据源:Menu Book (Perth).au/.au/.au/guide/?action=search.au/guide/index.cfm?action=searchTravel.au/.au/zh/hostels/search/state.cfm?stateid=6Primary School.au/search-result.phpATM/au/personal/en/cardholderservices/atmlocation/index.html/locator/global/SearchAction.do;jsessionid=B34268F6A8475961D60233FF82E3D8E4.fta-web4_aAU美食/7fan8/ *重点*http:/www.oz
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 私人借车协议合同范本
- 税务工勤人员合同范本
- 焦炭运输协议合同范本
- 独院房屋建造合同范本
- 电气设备供应合同范本
- 短篇小说签约合同范本
- 深圳劳务派遣的协议书
- 珠宝采购购销合同范本
- 燃气公司入户合同范本
- 2025管理人员安全培训考试试题附完整答案【各地真题】
- 河南省青桐鸣大联考2024−2025学年高二上学期10月联考 数学试卷含答案
- 上海市普陀区2024-2025学年九年级上学期期中考试化学试题
- 日本宠物药膳课程设计
- 九师联盟2025届高三10月联考 英语试卷(含答案解析)
- ISO 22003-1:2022《食品安全-第 1 部分:食品安全管理体系 审核与认证机构要求》中文版(机翻)
- 《软件分析与设计》教学大纲
- 《人体损伤致残程度分级》
- NB-T+42043-2014高压静止同步补偿装置
- 供应链合作协议合同范本
- 人教版初中(九年级)数学:数学公式大全
- 2024年-广西内陆渔业船员基础知识及技能培训参考幻灯片
评论
0/150
提交评论