版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年转正工作总结自我评价参考2026年转正工作总结·自我评价——北京云脉数据科技有限公司·数据中台事业部·数据治理组·李奕辰一、试用期任务全景回溯1.组织定位2025年7月1日入职,职级P5,岗位“数据治理工程师”,直属上级为数据中台事业部总监王骁,虚线汇报给质量委员会。试用期目标由HRBP、直属上级、质量委员会三方于OKR系统锁定,共5项O,拆解为17项KR,权重100%。2.目标与权重O1建立企业级数据资产目录(权重30%)O2完成主数据管理平台二期上线(权重25%)O3制定并落地数据质量检核规则≥200条(权重20%)O4支撑经营分析部临时数据需求≤2人日/单(权重15%)O5取得CDGA(数据治理工程师)认证(权重10%)3.时间线T0(入职第1周):完成环境开通、堡垒机、Git、Confluence、Jira、Tableau、ApacheAtlas、DataHub、StarRocks、Kerberos、Ranger权限拉齐。T1(1个月):完成业务访谈36人次,输出《数据资产盘点报告V1.0》,识别核心数据域7大、数据表3820张、字段9.3万个。T2(3个月):主数据管理平台完成供应商对账、客户、物料三大主数据模型重构,接口性能由800ms降至210ms,准确率由92.3%提升至99.1%。T3(5个月):数据质量检核规则上线218条,覆盖采购、销售、库存、财务、人力5大域,累计拦截异常数据7.4万条,直接挽回资金差异298.7万元。T4(6个月):以93分通过CDGA认证,完成试用期OKR闭环评审,绩效评级A。二、核心项目深度复盘1.企业级数据资产目录1.1痛点公司过去3年并购3家子公司,系统异构、字段同名不同义、缺少业务语义,导致经营分析部每月人工核对口径耗时120人时。1.2方法采用“业务-技术-管理”三维盘点法:①业务维度:以价值链为主线,拆解L1-L4流程,输出《业务流程-数据矩阵》;②技术维度:使用ApacheAtlas元数据采集,对接MySQL、SQLServer、Oracle、StarRocks、Hive、Kafka、API共7类数据源,自动抽取技术元数据;③管理维度:引入GB/T36326-2018数据能力成熟度模型,设计《数据资产分级标准》,将字段划为P0-P4五级,P0字段变更需走CCB评审。1.3实施步骤Step1制定盘点方案:明确范围、角色、模板、节奏,发布《数据资产盘点管理制度》V1.2,制度包含罚则:逾期未提交扣当月绩效5%。Step2工具部署:基于Atlas二次开发“中文血缘解析插件”,解决存储过程、临时表血缘丢失问题,准确率由63%提升到91%。Step3业务访谈:使用“5W1H+场景故事”法,引导业务方说出报表缺口,沉淀业务术语578条,同义词112对。Step4元数据清洗:开发Python脚本,调用Jieba+自定义词典,实现字段中文名相似度聚类,辅助人工合并,节省人工80人时。Step5资产目录发布:输出Web端+小程序双端,支持业务方“搜表-看口径-申请权限”一站式,上线1个月PV1.9万,收藏量2400+。1.4量化结果数据发现耗时由平均2.8人日降至0.3人日;元数据完整度由57%提升至93%;业务满意度调研4.7/5。2.主数据管理平台二期2.1目标解决“供应商编码一对多”导致的重复付款风险,2025年Q3审计报告披露差异金额431万元。2.2方案引入“黄金记录”算法:①使用改进的Soundex+余弦相似度混合模型,对供应商名称、税号、地址、银行账户四要素打分;②设定阈值0.82,自动合并候选组;③对冲突字段引入“可信度权重”:工商总局>天眼查>业务录入;④合并后生成MDM_ID,写入Kafka,实时同步至ERP、SRM、财务共享、费控、资金5套下游系统。2.3实施流程需求评审→模型设计→开发→数据迁移→性能压测→UAT→上线→复盘,共7阶段48项任务,采用Scrum,2周一个冲刺。开发规范:a.代码提交强制关联Jira,提交信息格式“MDM-1234|feat|简述”,否则GitLab自动拒绝;b.单元测试覆盖率≥80%,由SonarQube门禁;c.数据迁移采用蓝绿策略,灰度10%、30%、100%三阶段,每阶段留存快照,支持秒级回滚。2.4风险预案若GoldenRecord误合并导致付款异常,触发条件:单日付款失败率>1%且金额>50万元,30分钟内启动回滚,由值班DBA执行预置脚本restoresnapshot,同时冻结MDM合并服务,业务降级为“人工核对”。2.5结果供应商主数据由6.2万条归一为4.1万条,重复率下降33.9%;付款差异金额由431万元降至132万元;接口P99延迟210ms;项目获得公司级“卓越运营奖”。3.数据质量检核规则3.1规则分类四大类218条:唯一性46、完整性55、准确性84、一致性33。准确性规则示例:“采购订单税率”字段,取值范围只能为0、6、9、13%,触发条件为“订单状态=已审批”,如命中则推送企业微信至采购部负责人,2小时内修正。3.2技术实现采用GreatExpectations+Airflow+StarRocks:①GE内置Expectation78条,自定义UDF140条;②Airflow每日0点、6点、12点、18点四轮调度;③异常数据写入StarRocks表quality_bad_rows,保留7天,自动过期;④对连续3天异常率>5%的表,触发“数据质量红灯”告警,自动创建Jira工单,指派给表Owner,SLA24小时。3.3制度保障发布《数据质量考核细则》V2.0:a.异常率=异常行数/总行数,月异常率>2%即扣表Owner绩效5%,连续两月亮红灯,表Owner需向质量委员会书面说明;b.对主动发现规则缺陷并提交PR的员工,每条奖励200元京东卡,上限1000元/季度。3.4成效数据质量综合得分由78提升至93;经营分析部月度对账时间由4人日降至0.5人日;财务月结提前3天完成。三、个人能力成长曲线1.技术栈后端:Python(Pandas、PySpark、FastAPI)、Java(SpringBoot)、SQL(StarRocks、Hive、MySQL调优);数据治理:ApacheAtlas、DataHub、GreatExpectations、ApacheGriffin;DevOps:GitLabCI、SonarQube、Jenkins、ArgoCD、Terraform、Ansible;质量工具:Jira、Confluence、SonarQube、Allure。2.认证与荣誉2025年9月通过CDGA认证(93分);2025年Q3获得“卓越运营奖”(团队);2025年Q4获得“最佳文档奖”个人,Confluence阅读量部门第一。3.软技能①跨部门沟通:采用“利益相关者地图”+“RACI表”,将采购、财务、审计、IT四方职责写死,减少扯皮;②演讲:在2025数据治理大会上分享《GoldenRecord实战》,现场反馈4.8/5;③英语:每日朗读30分钟,撰写英文DesignReview文档5篇,获得美国架构师认可。四、工作亮点与价值创造1.直接经济价值数据质量拦截差异298.7万元;主数据合并减少重复付款299万元;经营分析提效节省人力约2FTE,按人均成本25万/年计算,年节约50万元。2.间接战略价值数据资产目录成为公司“数据要素流通”试点基础,入选北京市经信局2026年数据要素×典型案例;为后续数据资产入表、数据对外流通提供元数据支撑。3.知识沉淀输出《数据资产盘点作业指导书》《GoldenRecord设计规范》《数据质量规则开发手册》3部内部标准,已被质量委员会纳入公司级《数据治理规范》V3.0。五、尚存差距与根因分析1.技术深度对StarRocks内核向量化执行、CBO优化器掌握仍停留在应用层,未能根据trace改写plan;根因:日常任务以交付优先,缺少大块时间源码级研究。2.业务洞察对“库存周转天数”业务口径仅停留在定义层,未与供应链同事一起跑仓、实盘,导致规则设计时遗漏“在途库存”场景;根因:缺少深入一线的业务体感。3.项目管理冲刺后期需求变更3次,虽按期上线,但团队加班>30小时;根因:需求冻结点未写进合同,变更流程形同虚设。六、改进计划与落地路径1.技术提升①每周三晚20:00-22:00参加StarRocks社区Meetup,认领issue≥2个/月;②在测试环境搭建perf-debug集群,使用perf、flamegraph生成火焰图,Q2输出《StarRocks慢查询优化白皮书》。2.业务下沉①申请2026年4月轮岗至顺义仓,跟班作业2周,完成《库存业务全景图》V2.0;②与供应链总监签订“影子计划”协议,每周五下午现场办公,持续3个月。3.项目治理①修订《需求变更管理办法》V1.3,将“冻结点”写进SOW,变更需CCB+财务双重批准,否则不予排期;②引入Jira插件“ChangeApproval”,变更自动计算影响故事点,>20点自动升级至部门总经理。七、转正后三年职业规划1.2026年(当前)目标:晋升P6,带领4人小组,负责数据治理工具链自研。关键结果:KR1自研“数据质量一站式平台”替换GreatExpectations,节省授权费38万/年;KR2申请发明专利≥1项,题目《一种基于多源可信度的黄金记录融合方法》。2.2027年目标:晋升P7,成为数据中台数据治理Sub-TL。关键结果:KR1主导公司数据资产入表试点,完成无形资产确认≥5000万元;KR2建立数据治理委员会秘书处,统筹全集团制度,发布《集团数据治理白皮书》。3.2028年目标:晋升P8,出任数据治理专家岗,跨BG赋能。关键结果:KR1对外输出,出版专著《实战数据治理:从方法到工具》;KR2担任工信部数据治理标准工作组成员,推动行业标准立项≥1项。八、个人自评结论试用期6个月,我按时保质完成全部17项K
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 故乡的风景画作文13篇
- 新兴业务孵化承诺函(4篇)
- 电子商务领域服务保障承诺书6篇
- 起重机械培训课件张优
- 货品基础知识
- 写字楼电梯群控系统优化合同协议2025
- 2025年社会化工作者面试题库及答案
- 2025年医院会计硕士免笔试及答案
- 2025年水城区事业单位英语考试及答案
- 2025年嵌入式工程师面试题库及答案
- 文物建筑勘查设计取费标准(2020年版)
- 《分析化学》课程思政教学案例(一等奖)
- 绩效管理流程培训
- 北京市通州区2023-2024学年九年级上学期期末考试语文试卷(含答案)
- 2024年医院副主任竞聘演讲稿模版(3篇)
- 施工现场实施信息化监控和数据处理方案
- 2024年普通高等学校招生全国统一考试政治试题全国乙卷含解析
- 医学影像设备更新项目资金申请报告-超长期特别国债投资专项
- 20以内加减混合计算400道及答案
- 2024 年咨询工程师《工程项目组织与管理》猛龙过江口袋书
- 医院妇产科医学病例汇报PPT
评论
0/150
提交评论