陕西移动IMEI信息数据挖掘项目报告_第1页
陕西移动IMEI信息数据挖掘项目报告_第2页
陕西移动IMEI信息数据挖掘项目报告_第3页
陕西移动IMEI信息数据挖掘项目报告_第4页
陕西移动IMEI信息数据挖掘项目报告_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

陕西 移动 IMEI 信息管理平台功能规划方案 第 1 页 共 43 页 陕西移动 IMEI 信息 管理平 台 功能规划方案 陕西中海华晟信息技术有限公司 2008.12 陕西 移动 IMEI 信息管理平台功能规划方案 第 2 页 共 43 页 目录 一、 项目背景 . 4 二、 项目概述 . 7 三、 通话用户 IMEI 数据提取 . 10 3.1 前期数据调研工作 . 10 3.2 目前提取通话用户 IMEI 信息存在的问题及解决方案 . 11 3.2.1 确定 IMEI 数据维护的字段长度 . 11 3.2.2 剔除异常 IMEI 数据减少维护复杂性 . 12 3.3 形成 IMEI 号段及包含用户数的清单和文档 . 12 四、扩充 IMEI 信息数据的来源 . 14 4.1 概述 . 14 4.2 工信部 IMEI 信息数据表(工信部泰尔实验室) . 15 4.3 WAP 网关机型信息 . 16 4.4 国际 IMEI 专业网站信息(欧洲型号验证中心) . 21 4.5 DM 平台数据 . 21 4.6 终端厂家提供数据 . 22 4.7 对“山寨机”等非正常渠道的终端 IMEI 信息进行维护 . 22 五、各来源数据的综合比对 . 23 六、抽样外呼校验 . 24 6.1 根据不同分类的 IMEI 制定不同的外呼策略 . 24 6.2 外呼问卷的设计 . 24 6.3 外呼用户的取数规则 . 25 6.4 外呼结果的数据处理 . 26 6.4.1 对外呼结果的数据处理 . 26 6.4.2 外呼校验判断规则和流程 . 27 七、终端业务参数维护 . 29 7.1 建立和维护 IMEI 信息与终端功能匹配表 . 29 7.2 建立和维护 IMEI 终端信息成果表 . 32 7.3 建立和维护 IMEI 信息与终端功能聚类分析表(终端功能对应 IMEI 信息表) 32 陕西 移动 IMEI 信息管理平台功能规划方案 第 3 页 共 43 页 八、 IMEI 终端信息成果表的运用(引入支撑系统) . 34 九、第二轮后简化的 IMEI 维护流程 . 35 9.1 概述 . 35 9.2 各来源数据的处理 . 35 9.3 外呼数据的分析 . 37 9.4 型号库的更新 . 37 9.5 总表的维护 . 38 十、项目的服务内容及 实施流程 . 39 10.1 第一阶段:数据调研 . 39 10.1.1 统计陕西移动各数据业务的沉默用户比例和活跃度分析(结合 09 年 KPI 考核指标分析) . 39 10.1.2 陕西移动通话用户 IMEI 号段按号段包含用户数统计分析并确定 IMEI 号段维护用户基数标准 . 39 10.1.3 陕西移动业务受理渠道统计与分析,即统计直接与用户接触机会的情况(按照电子渠道和实体渠道分别统计) . 40 10.2 第二 阶段:提出分析系统的功能模型并确定数据分析工具的选型方案 . 40 10.2.1 通话用户 IMEI 数据的收集 . 40 10.2.2 根据各种渠道获取 IMEI 数据,补充现有数据库 . 40 10.2.3 对 IMEI 各来源数据进行清洗和处理 . 41 10.2.4 对各来源信息数据进行综合比对,遵循分类维护原则 . 41 10.2.5 采用一定的校验方法,对验证结果为不确定的数据进行维护 . 41 10.2.6 维护机型的功能、参数、业务信息,进行应用层的字段维护 . 41 10.3 第三阶段:流程固化 ,数据分析工具选型 与软件开发阶段 . 42 10.3.1 利用实际应用,完善维护相关流程 . 42 10.3.2 利用数据分析结果,支撑实际工作 . 42 10.3.3 固化规则,进行程序开发 . 42 10.4 第四阶段:定期更新维护及应用服务 . 42 陕西 移动 IMEI 信息管理平台功能规划方案 第 4 页 共 43 页 一、 项目 背景 当今移动通信涌现出越来越多的新业务需要终端的支持和适配,业务发展面向的潜在用户是所支持终端的使用用户,目标用户群的成功挖掘依赖于对用户终端的知晓度,我们面对的不仅是客户,而且还有业务使用的 载体 终端 。 目前在各项数据增值 业务的发展中,“重定制、轻使用,重捆绑、轻发展” 的现象较为突出, 导致各个业务都有大量的沉默 用户。同时在新业务 开通前缺乏对用户终端情况甄别,业务营销政策与用户终端的支持率不匹配,缺乏有效针对性手段。 在实际的营销过程中, 我们的客服、营业人员每天都在与大量客户直接沟通。这当中存在着极大的业务推荐机会, 如果 充分利用接触客户的机会,了解客户的需求, 就可以 向用户推荐客户所持终端支持的业务, 但是 进行针对性的主动营销 就 需要前台人员掌握用户的终端信息。 今后的移动增值业务的发展会朝着 “业务与终端功能”互为导向 的方向发展。量质并重是业务可持续发展的关键因素,注重用户的使用量和活跃度,提升用户使用新业务的粘性,才能 避免新业务客户的流失,避免新业务规模的虚高依赖于对客户所使用终端的识别率。 下 面两张 图 显示了 移动现有数据业务的发展图系,大部分数据业务的深度营销和精确营销均依赖于对用户终端 IMEI 信息和数据的比对和分析。 09 年 KPI考核 指标中 更是 有 多个业务是与终端机型的支持相关的,如手机电视, 号簿管家等。 陕西 移动 IMEI 信息管理平台功能规划方案 第 5 页 共 43 页 IMEI(International Mobile Equipment Identity)是国际移动设备身份码的缩写,是由 15 位数字组成的 “电子串号 ”,每一部手机在组装完成后都将被赋予一个全球唯一的一组号码,依 靠 IMEI 我们可以准确识别每一部终端,并最终定位用户终端的相关的信息。 进行 IMEI 数据信息维护的目的 是 加强对 IMEI 数据的管理,有效提升对终端信息的管理能力和应用水平 。具体可以分解为:提高 IEMI 数据维护准确率,构建完善的 IMEI 数据分析体系和提升数据挖掘结果应用水平三个方面,具体内容如下: 陕西 移动 IMEI 信息管理平台功能规划方案 第 6 页 共 43 页 目前,由工信部下发的 IMEI数据在准确性和覆盖性方面都存在一定的问题,离支持实际应用尚存在一定距离,因此有必要建立一套完善的 IMEI 数据维护流程和系统,掌握较为完整和准确的 IMEI 终端信息数据,来满足深度营销和用 户精确营销的需求。 陕西 移动 IMEI 信息管理平台功能规划方案 第 7 页 共 43 页 二、 项目概述 建设基于 IMEI终端信息数据深度挖掘的移动用户信息业务深度运营系统 其根本目的 在于建立有效的 IMEI 数据维护机制,不断提高用户终端机型信息的完整性和准确性,进一步通过用户终端 IMEI 信息确定其终端功能 和所支持的业务类型 ,进而为开发和推广新的数据业务提供基础数据支持,形成良性的“ 手机终端功能 -数据业务互为导向 ”的发展模式。 建设基于 IMEI终端信息数据深度挖掘的移动用户信息业务深度运营系统在 建设与维护中需要坚持以下五个原则 : 1、 针对现有通话 IMEI 数据确立维护目标,以提高维护效率 针对现网通话用户 IMEI 数据进行分阶段维护,先维护包含用户数较多的 IMEI 号段,逐步向包含用户数较少的 IMEI 号段延伸,以提高维护效率。 2、扩充 IMEI 信息数据的来源,以提高完整性 在原有支撑系统所采用的信产部定期下发 IMEI 信息数据的基础上,增加 WAP 网关日志信息、 IMEI 国际专业网站信息、 DM 平台提供数据信息、以及终端厂家提供信息等多个来源的数据,以提高 IMEI 信息数据的完整性。 3、对各来源信息数据进行综合比对,遵循分类维护原则 陕西 移动 IMEI 信息管理平台功能规划方案 第 8 页 共 43 页 第一轮的 IMEI 数据维护需要对各来源数据进行汇总,掌握各来源数据共有号段、共有号段中对应机型的一致情况、根据一致情况将号段予以分类,以采取不同的外呼校验策略。 4、以外呼为手段进行数据的抽样校验,以提高准确性 在收集各来源数据并进行分类的基础上,进行随机抽样外呼,确认IMEI 数据的准确性,经过该环节后,才能真正确认 IMEI 号段的机型信息。 5、维护机型的功能、参数、业务信息,进行应用层的字段维护 IMEI 信息数据的维护不仅包括 IMEI 号段对应的机型信息,更重要的是包括机型的功能、参数和支持的自有业务信息。 整个项目 的 的基本驱动流程如下图所示: 陕西 移动 IMEI 信息管理平台功能规划方案 第 9 页 共 43 页 根据该流程图,整个 IMEI 数据信息挖掘工作可以分为 6 个主要部分, 其具体工作内容及要求如下: A 部分 , 对现现网通话用户 IMEI 信息的提取工作 ; (确定维护对象,提高维护 效率) B 部分 , 对扩充 IMEI 信息来源数据的比对处理和挖掘; (扩展数据来源进行综合比对,提高数据完整性进行分类维护) C 部分 , 对各个 IMEI 信息来源的数据进行抽样外呼校验; (进行数据校验,提高数据准群行) D 部分 , 结合终端功能参数维护表形成 IMEI 终端信息成果表 ; (维护业务参数进行字段层维护,奠定 IMEI 信 息应用基础) E 部分 , 将 IMEI 数据信息终端成果表与通话用户 IMEI 信息表进行关联,得到通话用户的终端信息列表 F 部分, 根据实际运营情况对 IMEI 终端信息成果表 的“ IMEI-机型信息” 按照“第二轮后简化的 IMEI 信息维护流程”进行动态更新和维护。(为 IMEI信息的持续应用和深度运营支撑提供保障) 下面的章节,将对上述 6 个部分的工作进行详细的说明,并提出相应的解决方案。 陕西 移动 IMEI 信息管理平台功能规划方案 第 10 页 共 43 页 三、 通话用户 IMEI 数据提取 3.1 前期数据调研工作 统计陕西移动各数据业务的沉默用户比例 和活跃度分析 (结合 09 年 KPI 考核指标分析) 。 通过对陕西移动现有 各项数据业务的经营情况进行分析 ,重点对沉默用户 和 活跃用户 所占比例 一级用户细分等 情况进行统计,同时结合 09 年各项 业务的 KPI 考核 指标 ,确定 IMEI 数据 (终端识别率) 维护的具体目标 值 。 形成的结果数据如下: a.全省及各个地市各个数据业务现有的沉默用户数; b.全省各个数据业务对用户终端的支持需求列表; c.09 年 KPI 重点考核业务指标分析以及对用户终端功能支持列表需求; d.确定近期 IMEI 数据 信息(终端识别率)维护的准确率指标。 陕西移动通话用户 IMEI号段按号段包含用户数统计分析并确定 IMEI号段维护用户基数标准。 根据提取的在网通话用户 IMEI 号段分布情况 ,对当月用户 IMEI 号段的分布情况以及用户数量进行统计和分析 ,同时结合 IMEI 数据的维护目标值,确定 IMEI 号段维护用户的基数标准以及对应的目标用户群数量(占总用户的比例)。 形成的结果数据如下: a.全省通话用户的 IMEI 号段数量; b.分别按照 1000, 900, 800, 700, 600 和 500 户为用户数量基数筛选相应的 IMEI 号段数量; c.分别根据上述 6 个用户基数筛选出来的 IMEI 号段统计各自划分标准下对应用户所占全体用户的比例; d.根据维护准确率目标, IMEI 维护号段用户基数单元以及各自对应用户数量(比例)确定最优的 IMEI 号段维护用户基数标准。 陕西 移动 IMEI 信息管理平台功能规划方案 第 11 页 共 43 页 陕西移动业务受理渠道统计与分析,即统计直接与用户接触机会的情况(按照电子渠道和实体渠道分别统计)。 通过对用户获取服务的渠道进行统计和分析,可以发现不论是营业厅受理还是 10086 热线受理 我们的客服、 营业人员每天都在与大量客户直接沟通,这当中存在着极大的业务推荐机会 。 充分利用接触客户的机会,了解客户的需求,向用户推荐客户所持终端支持的业务,进行针对性的主动营销 。 形成的结果数据如下: 实体渠道(营业厅)和电子渠道(网上营业厅及 10086 热线)中直接接触用户的机会 数量 以及所占的比例。 3.2 目前提取通话用户 IMEI 信息存在的问题及解决方案 原有 IMEI 数据在完整性方面存在以下几个问题:缺少针对性,导致用户匹配率较低 ; IMEI 号段位数参差不齐(同时存在六位、八位等 IMEI 号段),影 响IMEI 维护的效率,并容易导致一些显性错误对应问题 。 数据业务深度运营要求掌握现网 IMEI 号段的用户占有量的分布情况, 因此需要 确立维护目标,同时掌握维护进展。 当前存在以下问题: IMEI 数据应该按照多少位维护? 如何剔除异常 IMEI 数据,减少 IMEI 维护初期的复杂性问题? 如何按照通话 IMEI 清单进行分阶段维护? 3.2.1 确定 IMEI 数据维护的字段长度 截取 IMEI 号段的前 8 位形成用于维护的 8 位基准 IMEI 号段( IMEI 号段结构 为 TAC + FAC + SNR + SP。 前 6 位数 (TAC)是 型号核准 号码 ,一般代表机型 ;接着的 2 位数 (FAC)是 最后装配号 ,一般代表产地 ; 之后的 6 位数 (SNR)是 串号 ,一般代表生产顺序号 ; 最后 1 位数 (SP)通常是 0,为检验码,目前暂备用 )。 由于 IMEI 的前 8 位即可确定用户的机型和产地(用于区别不同产地同一型号机型在功能上可能存在的差别),因此在对在网通话用户 IMEI 数据处理过程陕西 移动 IMEI 信息管理平台功能规划方案 第 12 页 共 43 页 中截取其前 8 位即可获取我们需要的有关终端信息) 。 掌握现网通话用户 IMEI 数据按前 8 位号段的分布情况 后即可按照下面的流程进行提取 :提取通话用户 IMEI 数据 截取前 8 位形成 IMEI 号段 形成IMEI 号段及包含的用户数清单文档 。 按照欧洲型号认证中心的最新规定,统一按照八位进行 IMEI 数据的维护。 3.2.2 剔除异常 IMEI 数据减少维护复杂性 确定异常 IMEI 确认标准 ,在维护过程中,我们认为下面的 IMEI 属于异常 IMEI 记录。 含字母、第 8 位 /含第 8 位起连续为 0 以及 IMEI 字段长度在 13 位以下 ; 对 14、 15、 16 位的 IMEI 数据,只取前 14 位(根据 IMEI 号段的组成规则,前 14 位即可确定用户手机的型号,产地及生产串号)。 IMEI 号段在用户分布上具有很强的集中度, 因此,在 形成的 IMEI 号段及包括的用户数清单文档的基础上, 结合前期数据调研阶段确定的 IMEI 号段用户基数维护标准,可针对基数标准数 以上 IMEI 号段先行进行维护。 3.3 形成 IMEI 号段及包含用户数的清单和文档 确定用户 IMEI 数据信息的取数规则: 取用户最近一条 IMEI 记录; 剔除 IMEI 为空的用户,统计剔除的数目 ; 剔除异常 IMEI(含字母、第八位 /含第八位起连续为 0、 13 位以下),统计剔除的数目; 对 14、 15、 16 位的 IMEI 数据,只取前 14 位 (根据 IMEI 号段的组成规则,前 14 位即可确 定用户手机的型号,产地及生产串号) ; 剔除一个 IMEI 对应 4 次及以上用户号码的数据 ( 该 IMEI 对应的终端频繁更换用户号码,不可能作为稳定营销的目标客户) ; 截取前 8 位形成 8 位 IMEI 号段和对应 通话 用户数文档 。 确定 IMEI 号段和对应通话用户数文档模板 陕西 移动 IMEI 信息管理平台功能规划方案 第 13 页 共 43 页 通话用户 IMEI 号段清单 : xxxx 年 xx 月 注意: 在此表中“用户号码”和“ IMEI 号码”是严格的一一对应关系,但是“ IMEI 号码”与“用户号码”不是严格的一 一对应关系。 例如,对于 IMEI 串号为“ 3550 121”的终端,本月共有两个手机号 码使用,则分别形成 2 条对应的 IMEI 记录。 根据 IMEI 数据维护的进展情况,可按月为单位 定期 提取通话用户 IMEI 号段 清单文档。 按照以上需求和模版 定期 从经分系统 导出 IMEI 前 8 位号段及包含的通话用户数 数据, 以 进行后续 分析处理 ,并针对 已经确定的 IMEI 号段 维护用户基数 先行进行维护。 前 8 位 IMEI 号段 包含的通话用户数 陕西 移动 IMEI 信息管理平台功能规划方案 第 14 页 共 43 页 四 、 扩充 IMEI 信息数据的来源 4.1 概述 由于 IMEI 数据是动态数据,需要对其进行动态维护和扩充,因 此在通话用户 IMEI 号段清单的基础上确立目标维护 IMEI 号段后,应进行这些 IMEI 号段对应机型信息的收集 和整理 工作 。 如何 完整地得到尽可能多的 IMEI 号段对应机型信息 成为 IMEI 扩展库建设的主要目标。 通过扩充 IMEI 信息数据的来源 , 在原有 工信 部 IMEI 信息数据基础上,增加 WAP 网关日志信息、 IMEI 国际专业网站信息、 DM 平台提供数据信息、终端厂家提供信息 以及对“山寨机”等非正规渠道终端信息 等数据 来源 ,以提高 IMEI信息数据的完整性。 对上述各个数据来源的综合评估结果如下 : 工信 部 下发的 数据完整性和准确性 相对较低,在功能参数方面只有基础的参 数和功能字段可供参考。 WAP 网关 IMEI 数据完整性、准确性最高,但处理最复杂,占用周期最长。 IMEI 专业网站数据的完整性、准确性介于信产 IMEI 表和 WAP 网关数据之间。 DM 平台 的 数据 目前提供的数据较少,但准确性极高。终端厂商的终端信息 ,由于 目前基本限于与我们有定制关系的终端厂家,厂家数量有限,而且也有准确率问题,初期如果没有获取厂家信息可暂不考虑该来陕西 移动 IMEI 信息管理平台功能规划方案 第 15 页 共 43 页 源的数据。 4.2 工信 部 IMEI 信息数据表 (工信部泰尔实验室) 从业务支撑系统导出 工信 部 定期下发的 IMEI 数据, 表结构如 下 : 字段 名称 类型 IMEI IMEI 段 VARCHAR2(20) TELE_FAC 手机厂商 VARCHAR2(80) TELE_TYPE 手机型号 VARCHAR2(80) SN 序列号 VARCHAR2(80) MARKET_DA 上市时间 VARCHAR2(20) STATE 停产标志 VARCHAR2(40) IS_GPRS 是否支持 GPRS VARCHAR2(4) IS_MMS 是否支持 MMS VARCHAR2(4) IS_JAVA 是否支持 JAVA VARCHAR2(4) IS_WAP 是否支持 WAP VARCHAR2(4) IS_CMCC 是否支持 CMCC VARCHAR2(4) IS_ONENET 是否支持 ONENET VARCHAR2(4) IS_PUCKER 是否支持 PUCKER VARCHAR2(4) IS_CAMERA 是否支持 CAMERA VARCHAR2(4) DISPLAY 显示屏幕 VARCHAR2(40) REMARK 备注 VARCHAR2(200) 以上数据中“ IMEI 段”、“手机厂商”、 “手机型号”是 IMEI 号段及对应机型信息 ,是本环节需要参考的信息 ,其他字段在后续的参数、功能维护中予以参考。 由于工信 部 IMEI 数据 同时存在六位和八位号段,而且 存在显性错误问题,即 相同号段对应不同厂商和型号 ,因此使用工信 部 IMEI 数据前要先进行以下处理: 将 6 位号段扩充到 8 位 ; 将相同 8 位号段对应不同机型的 IMEI 数据予以剔除 ; 陕西 移动 IMEI 信息管理平台功能规划方案 第 16 页 共 43 页 取其中 通话 IMEI 号段 中已有( 已经确定的 IMEI 号段维护用户基数 以上)号段予以维护 。 4.3 WAP 网关机型信息 从 WAP GW( 网关设备 ) 导出最近一个月的日志数据,每 WAP 网关每天一个日志文件 。 日志文件包括当日使用过 WAP 网关相关业务的用户 MSISDN( The Mobile Station ISDN number。 MSISDN 号码是在公共电话网交换网络编号计划中 , 唯一能识别移动用户的号码 。 根据 CCITT 的建议 , MSISDN 由以下部分组成 : MSISDN=CC+NDC+SN( CC=国家码 (中国为 86), NDC=国内目的码 , SN=用户号码 。 若在以上号码中将国家码 CC 去除 , 就成了 终端 的国内身份号码 ,也就是我们日常所说的 “ 手机号码 ” ) 。 及其手机 UA( 用户代理 (User Agent))信息 , UA 包含了终端厂家和型号信息。 WAP 网关日志信息中只有用户号码和 UA 信息(品牌和机型),没有用户所使用终端的 IMEI 数据,因此需要从用户通话话单中找到用户的 IMEI 数据从而将 IMEI 数据和 UA 信息关联起来。如下表所示: WAP 网关日志 通话用户 IMEI IMEI 的 UA 信息 将 日志记录通过用户 MSISDN 与用户通话 IMEI 关联, 建立 IMEI 和 UA 关联关系 。为在关联过程中尽可能地剔除各种复杂情况,减少 IMEI 机型维护过程中可能出现的误差和差错,制定 的 处理规则如下: 陕西 移动 IMEI 信息管理平台功能规划方案 第 17 页 共 43 页 其具体的处理流程如下图所示: 当月 WAP GW 日志数据导出 对 WAP GW日志 数据的处理 提取 WAP GW用户 的通话 IMEI数据 共 31个日志文件 有用户的 MSISDN和手机型号信息 ( UA) 规则: 对手机号码和手机型号 (MSISDN和 UA)联合剔重 对 UA信息按照一定的规则把品牌和型号分开 进行规整 (建立品牌和其型号的对应文档 ) 提取其中一个号码只对应有一个 WAP GW型号的记录 ( MSISDN-UA) 规则: 剔 除 各 种 非 正 常IMEI(含字母、第八位 /含起连续为 0、 13位以下 ) 取通话 IMEI中只有一条 IMEI记录 的数 据( MSISDN-IMEI) 剔除一个 IMEI对 应 4个及以上号码的数据 WAP GW日志数据 与通话 IMEI的关联 规则: 对处理后的 WAP GW数据和通话 14位 IMEI数据通过 MSISDN进行关联 删除一个 IMEI对应多个手机型号的情况 删除异常手机型号的情况(可在二中一起规整) 一 二 三 四 陕西 移动 IMEI 信息管理平台功能规划方案 第 18 页 共 43 页 终端 具体的步骤包括: (1)提取 WAP GW 日志文件(每月 31 个,包含用户 MSISDN(用户号码)和UA(机型信息); (2)对 MSISDN(手机号码)和 UA(机型信息)进行联合剔重: 即 : 以 MSISDN 和 UA 为联合剔除条件进行剔重,如: 一个手机号码对应两个机型信息的记录,按 2 条记录处理; 135 123-UA1 135 123-UA2 4.按照 MSISDN 与 UA“一对一”的标准提取记录 1.当月 WAP GW 用户记录 2.按照用户号码和终端 型号联合剔重 3.对用户终端型号进行规整处理,并与第 2 步结果进行关联 5.对 当月 WAP GW 用户记录 ,以用户号码为索引进行单独剔重 6.对 当月 在网通话用户记录进行剔除异常及其他数据预处理 7.按照用户号码为索引条件进行匹配,提取 WAP GW 用户的通话 IMEI 数据 8.按照 MSISDN 与 IMEI “一对一”的标准提取记录 9.以 MSISDN 为关联条件将两张表进行关联 10.剔除一个 IMEI 对应多个终端型号的记录 11.剔除终端型号异常的记录 陕西 移动 IMEI 信息管理平台功能规划方案 第 19 页 共 43 页 同样,一个机型信息对应两个手机号码的记录,也按 2 条记录处理; UA1-137 285 UA1-139 886 (3)按照规整型号文档对剔重后的 UA 数据进行规整处理(例如 :将 N95, n95 和 N95+等机型信息进行规整 ),并将规整后的 UA 信息与 联合 剔重后的MSISDN 数据进行关联。 (4)在第 3 步关联 的基础上,筛选出“ MSISDN-UA”对应关系为“一对一”的记录 (以用户号码为唯一索引条件进行过滤) 。 (5)对当月 WAP GW 用户记录按照用户号码( MSISDN)为惟一索引条件,对记录进行索引,形成 MSISDN-UA 的关系表(有“一对一”和“一对多”两种情况)。 (6)对当月的在网通话用户按照提取 IMEI 信息记录工作的要求和取数规则进行处理。 (7)提取当月 WAP GW 用户的 14 位 IMEI 通话记录信息(并剔除异常 IMEI 记录以及 1 个 IMEI 对应 4 个以上号码的记录)。 (8)在第 7 步筛选的基 础上,过滤出“ MSISN-IMEI”对应关系为“一对一”的记录。 (9)将第 4 和第 8 步所得的关联记录按照“ IMEI-UA”的匹配原则进行匹配和关联。 (10)和 (11)对关联结果进行处理(剔除一个 IMEI 对应多个 UA 的记录)以及异常手机 UA 信息的记录。 按照以上处理规则进行处理后,输出的数据结构如下: 14 位 IMEI UA 品牌 UA 型号 由于 WAP GW 日志记录与通话用户 IMEI 信息进行关联后可能会存在一些误差,因此 进一步的处理如下: 陕西 移动 IMEI 信息管理平台功能规划方案 第 20 页 共 43 页 截前 8 位形成 IMEI 号段 及对应的机型信息以及包括的 WAP 网关使用用户数 。 具体说明如下: 对 14 位的 IMEI 及对应的 UA 品牌和 UA 型号数据截取前 8 位后,会出现同一 8 位号段包含不同 UA 机型的情况, 主要 原因包括:通过 MSISDN 将 UA 信息和 IMEI 关联时可能存在的误差(例如用户上网时和通话时分别使用不同的终端);部分厂家在生产终端过程中并没有严格按照所生产机型名称填写 真实的 UA 信息 ,导致 UA 信息的不准确。 对 14 位的 IMEI 及对应的 UA 品牌和 UA 型号数据截取前八位后虽然会出现同一八位号段包含不同 UA 机型的情况,但可能存在一个占主流情况的 机型,并统计该主流机型在该号段 WAP 使用用户数的占比情况 ,具体例示如下: 可 按照号段包括 的 主流 机型 的 占比 情况进行分类 。 90%以上主流机型、 70-90%主流机型、 50-70%主流机型、 50%以下主流机型等几种情况 , 如下表所示: 8 位 IMEI号段 主流 UA 品牌 主流 UA 型号 主流类别 陕西 移动 IMEI 信息管理平台功能规划方案 第 21 页 共 43 页 4.4 国际 IMEI 专业网站 信息 (欧洲型号验证中心) 通过该 IMEI 国际专业网站可获取一定 IMEI 号段对应机型信息 ,表结构如下: 8 位 IMEI 号段 机型信息 使用 IMEI 国际专业网站 IMEI 数据 ,需要对数据进行如下的预 处理: 将 6 位号段扩充到 8 位 ; 将相同 8 位号段对应不同机型的 IMEI 数据予以剔除 ; 按照一定的规则把品牌和型号分开进行规整 ; 取其中通话 IMEI 号段中已有( 已经确定的 IMEI 号段维护用户基数 以上 )号段予以维护 。 4.5 DM 平台数据 集团 将 DM(移动定制 终端业务管理平台 Device Management) 平台 数据 定期下发 给省数据部门, DM 平台 采集到的定制 DM 终端 相关信息 如下: 字段 名称 ID 编号 用户号码 MSISDN IMEI 14 位 IMEI 厂商 手机厂商 型号 手机型号 版本 软件版本号 有效 是否有效 响应时间 响应时间 归属省 归属省 归属城市 归属城市 DM 平台数据:目前提供的数据较少,但准确性极高 。由于 DM 提供的信息相对少,初期可暂不考虑该来源数据 。 陕西 移动 IMEI 信息管理平台功能规划方案 第 22 页 共 43 页 进一步的处理规则如下: 截前 8 位形成 IMEI 号 段及对应的机型信息以及包括的 DM 终端 使用用户数 ; 剔除掉可能存在的相同 8 位号段对应不同机型的数据 。 4.6 终端厂家提供数据 可要求 终端厂家 定期 提供 IMEI 数据,具体表结构可根据需要自行制作。 得 到各来源 IMEI 号段对应机型信息后,即可进行后续的综合比对环节。 4.7 对“山寨机” 等非正常渠道的终端 IMEI 信息进行维护 国内终端市场纷繁复杂,存在各种 山寨 机、翻新手机、克隆手机等,这些终端的用户数量也相当可观,同时在一个 相当的时期内,各种非正规渠道的终端将与正规渠道的终端共存。因此对于这些非正规渠道终端的 IMEI 信息进行维护,对这些终端的用户进行深度营销亦有一定的价值和意义。 由于非正规渠道的终端在 IMEI 信息编码上比较混乱,没有一个基本规则可循,因此 目前对于非正规渠道终端 IMEI 信息的收集和维护工作还在探索之中,前期考虑 通过 手机卖场等销售终端,使用“终端型号 -IMEI 信息” 穷举法 的办法,建立基础的 IMEI 数据库,同时探索进行动态维护的方法和流程。 陕西 移动 IMEI 信息管理平台功能规划方案 第 23 页 共 43 页 五 、 各来源数据的综合比对 对各来源得到的 IMEI 数据进行 汇总,对比 IMEI 号段在各来源数据中对应的机型是否一致, 按照 IMEI 号段在各来源数据中对应机型的一致性情况 进行分类, 以便在后续流程中进行分类维护和参考确认 。 具体综合比对流程如下: (1)确定 对各来源 IMEI 数据比对的标准,目前确定按照“ IMEI-机型”对应关系进行维护; (2)对各来源的 IMEI 数据信息根据比对条件(“ IMEI-机型”)进行过滤和筛选 ; (3)对分类匹配和筛选结果进行汇总和分析; (4)对各来源 IMEI 数据信息进行分类维护。 初期以 工信 部数据、 WAP 网关信息、 IMEI 国际专业网站信息三个来源的数据为主,综合比对后进行 分类 , 模版如下 : 类别 清单 说明 三个 及 以上来源都一致 列清单 三个或三个以上来源对应的机型一致 两个来源一致 列清单 两个来源对应的机型一致 各来源都 不相同 列清单 各来源对应的机型各不相同 综合比对后的数据清单如下表所示: 8 位 IMEI 号段 来源 1 机型 来源 2 机型 n 来源机型 类别 以上对各来源综合比对结果和清单是后续对外呼结果判断时的重要的参考文档。 陕西 移动 IMEI 信息管理平台功能规划方案 第 24 页 共 43 页 六 、 抽样 外呼校验 在对各来源 IMEI 信息的综合比对基础上,需要进行抽样外呼校验,对 综合比对的结果进行验证 。 在对各来源 IMEI 信息的综合比对基础上 :根据各来源数据比对后的一致性分类情况,予以不同的外呼策略,高效利用外呼资源 ; 用户抽样外呼取数时取相对稳定使用用户 ; 外呼完成后剔除掉外呼期间的换机用户样本,减少外呼带来的误差 。 6.1 根据不同分类的 IMEI 制定不同的外呼策略 考虑到外呼本身的成功率、以及知道自己机型的用户占比并不高,制定外呼样本数量时要留一定的余量 ; 对于一致性高的 IMEI 号段(如三个以上来源都一致的 IMEI 号段),可随机抽取的外呼用户数量相对少一些 , 如每号段 5080 个用户 ; 相反,对于一致性不高的号段如(各来源数据都不相同的 IMEI 号段),可随机抽取的外呼用户数量相对多一些 ,如每号段 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论