Fintech前沿应用探索专题:星光不问赶路锻造中信证 券研究投研图谱_第1页
Fintech前沿应用探索专题:星光不问赶路锻造中信证 券研究投研图谱_第2页
Fintech前沿应用探索专题:星光不问赶路锻造中信证 券研究投研图谱_第3页
Fintech前沿应用探索专题:星光不问赶路锻造中信证 券研究投研图谱_第4页
Fintech前沿应用探索专题:星光不问赶路锻造中信证 券研究投研图谱_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、CONTENTS目录需求爆发的确定性:数字化提速,投研场景数据应用智能化爆发供给错配的复杂性:受限技术边界,专业机构投研端供需错配创新锻造的科学性:首发投研图谱,自下而上聚焦基本面投研联合发展的必然性:最大化应用效率,最优化竞争壁垒2行业需求爆发:数字化提速,投研场景数据应用智能化爆发资料来源:Wind,艾瑞咨询(含预测),各公司公告,中信证券研究部证券公司IT投入规模+头部证券公司IT资本开支数据+国内证券公司金融科技投入细分场景金融IT投入稳步提升,头部机构持续投入引领数据需求升级银行IT投资规模增速趋稳于10%,非银IT规模小但增速高;金融科技投入稳定升级,头部机构加码自研开发投入;综合

2、国内金融行业需求端对于数据+AI与信息技术的整体投入趋势和预算增速看,投研图谱的专业市场需求有望随着AI投入进入业务应用层而引来全面爆发,To B视角看,短期头部券商与资产管理机构有望率先开启探索。-0.2-0.100.10.20.30.40.50.602040608010012014016020122013201420152016201720182019证券公司IT投入(亿元)增速(右轴)02461081214161820国泰君安华泰证券中信证券海通证券广发证券招商证券20182019202001234567820192020E2021E2022E2023E云计算与大数据 AI 区块链 智能

3、自动化 其他3投研需求爆发:投研加速数字化+数据资产深度数字化+智能化集成资料来源:中信证券研究部投研图谱数据底层分类+数据资产深度数据化分类投研加速数字化+数据资产深度数字化+智能化集成三大数据集群应用增长快速提升,多源数据应用持续升维;投研场景的 Data+Tech“超融合”;数据资产化驱动图谱融合。在数字化的趋势下,投研图谱应用优势:(1)方便研究部门进行数据治理;(2)通过跨领域的数据交互挖掘潜在的投资机会;(3)构建数字化的统一投研框架。数据字典融合个股数据与产业数据,会计数据与另类数据行业与标的指向性打通数据源融合个股数据与产业数据,会计数据与另类数据集 群化服务数据交互融合内部应

4、用与外部需求结合,数据库与应用工具 深度结合数据服务扩展跨产业、跨国界,穿越周期数据 基础 设施4CONTENTS目录需求爆发的确定性:数字化提速,投研场景数据应用智能化爆发供给错配的复杂性:受限技术边界,专业机构投研端供需错配创新锻造的科学性:首发投研图谱,自下而上聚焦基本面投研联合发展的必然性:最大化应用效率,最优化竞争壁垒5投研图谱供给的约束三角资料来源:中信证券研究部投研图谱的供给约束三角投研领域知识图谱应用的搭建,我们认为目前主要存在以下几个难点:(1)技术准确率的边界与短期需求间的矛盾;(2)应用供给与用户需求错配的矛盾;(3)数据分布分散与数据对齐困难导致数据资产整合推动慢。6市

5、场现阶段流行的主流投研领域图谱产业链资料来源:数库,智管有方官网市场产业链图谱的应用案例产业链图谱重在刻画各个产业部门之间的经济关联,包括价值链、企业连、供需链、空间链四个维度。宏观角度看可以很好地对所有产业结构进行固化和可视化;短期观角度看当产业链某个节点发生变动时,图谱结构可以很直观地看出变动的传导。数据规模大,维护成本高,质量应 用存疑。数据层面:包括价值链、企业连、 供需链、空间链四个维度。维护层面:自建和证券公司联合共 建的形式构建了多个产业链图谱, 专家访谈+人工搭建为主,一次建 设后,更新相对频率较低。产业/市场变化带来的投资逻辑重 构:新兴行业的核心基本面因子不 定期存在调整可

6、能,图谱的实际应 用质量存疑。7市场现阶段流行的主流投研领域图谱工商+舆情资料来源:企查查,中投顾问官网,中信证券研究部市场工商+舆情图谱的应用案例工商信息图谱是发展较完善的图谱。以此为业务的相关公司例如企查查、天眼查等,大型金融公司内部也都会自发构建工商企业图谱,从而辅助 风险控制、关联企业查询等工作。舆情事件通常基于新闻等海量文本进行实体提取、事件提取、关系提取从 而构建基于新闻舆情的事件图谱。事件图谱可以几乎实时地跟踪市场发生的新闻事件,并基于图谱结构给出 事件可能影响的实体范围,做出的风险提示可以辅助投资决策尽量避开一些突发风险。数据规模大,维护成本适中,质量 应用场景受限。数据层面:

7、企业链、供需链、关联 企业等。维护层面:自建为主,基于新闻等 海量文本进行实体提取、事件提取、 关系提取。产业/市场变化带来的投资逻辑重 构:微观看,风控方向相对因子变 化不多,应用场景以风控为主。8技术准确率的边界与短期需求间的矛盾。投研领域的边界广、难度高,当前的人工智能模型优势在于封闭领域的应用,人工与计算机辅助的结合应当是中短期相 当长一段时间内投研领域的局面,导致单纯基于数据的大规模图谱很难落地,与研究人员有交互的图谱对准确率要求高, 高准确率又会碰到当前的技术边界,从而导致大规模图谱的人工维护成本高。面向机构用户应用的供给与需求错配的矛盾。机构专业研究人员在市场获得的信息大致可以分

8、为:信息、观点、知识。当前市场上存在大量金融行业知识图谱、产业 链图谱等产品,覆盖了大量客观事实或知识,形成了对专业投资者进行科普的现状。对于事实或领域基础知识的科普类图谱工具定位个人投资者应当更加合适,而面向专业投资者或研究员的图谱,提供的 服务应该是海量信息的专业提炼或融入知识的关键信息。从产业链图谱看投资应用,图谱中的节点与投资标的的距离相对更远,基于自动化提取完成大而广的图谱很难提供收敛且横向可比的核心因子,从而对投资和研究失去了直接的指导意义。数据分布分散与数据对齐困难导致数据资产整合推动慢。对于数据管理方面,机构研究部门当前的数据管理相对分散,大多数据会以不同的形式分布在不同人员手

9、中,数据共享 难度较高。对于数据形式方面,数据资产之间来源不同会导致数据字典不对齐,而数据融合和对齐也是一大难点之一。此外,不同 情况中还有人为因素、财力因素等等其他因素导致的数据资产整合难、图谱构建覆盖的数据不全等问题。9专业机构投研端供需错配CONTENTS目录需求爆发的确定性:数字化提速,投研场景数据应用智能化爆发供给错配的复杂性:受限技术边界,专业机构投研端供需错配创新锻造的科学性:首发投研图谱,自下而上聚焦基本面投研联合发展的必然性:最大化应用效率,最优化竞争壁垒10中信证券研究部数据科技组图谱构建框架中信证券投研图谱核心框架资料来源:中信证券研究部定位专业投资逻辑和高频核心因子,力

10、争图 谱的专业性和准确性。图谱构建的不可能三角:规模大、质量高、 维护好,由于服务用户的投研专业性极强, 所以我们放弃图谱的大范围覆盖,聚焦于 自下而上的研究需求,融合专业研究员的 领域知识、稀缺的另类数据因子和一定的 可视化方法,对特定热点领域和热点标的 进行覆盖,力求保障投资逻辑的专业性、 核心因子的适时准确和稀缺性、数据和结 构维护的及时性。以长期基本面投资为方向,自下而上,用专 业的逻辑和因子透视毛利和估值等核心指标。基于三元组架构,头结点为中信二/三级行 业(参数关注长期空间),尾结点为标的(参数关注短期盈利指标),关系聚焦当 期估值核心逻辑做头尾链接(参数描述聚 焦中期竞争格局描述

11、)。形成宏观偏行业- 中观重赛道-微观聚公司图数据体系。1112自动化构建领域知识图谱基本流程中信证券投研图谱构建技术路径全面自动化构建的知识图谱距离投资应用尚 存距离。针对“自动化从非结构性文本中挖掘并区 分高价值的知识+非结构化文本中存在相 关的知识描述”两个问题。借助研报数据 优势,将研报文本数据进行结构化拆解成 为标题、结论、分析流程、推荐标的等内 容,同时在研报生产系统增加前置标签。 利用基于预训练模型的序列标注模型对文 本中的实体、主题词、既有实体相关的实 体进行提取,可以作为研究员构建图谱的 一个很好的辅助,基于海量的研报可以及 时跟踪所有市场变化对投资逻辑的潜在影 响,提供给研

12、究员判定是否对投研逻辑进 行修正。算力聚焦另类核心因子构建将图谱高频化, 摆脱科普属性距离投研一线更近一步。资料来源:复旦大学知识工厂肖仰华教授演讲领域知识图谱落地实践中的问题与对策,中信证券研究部中信证券投研图谱数据集群分类中信证券投研图谱构建数据路径围绕投研逻辑和实际应用,形成数据逻辑底 层和投资逻辑底层建设方向。围绕三大数据 集群奠定图谱的完整性、有效性、稀缺性。标准财务核心数据集群:标准财务数据集 群数据公司指向性明确且财务相关度高, 获取自动化容易且数据来源明确,但对于 投资来看附加价值较低;行业专家闭环数据集群获取成本高但数据有效且稀缺,具有结构化程度低的特点;传统特色另类数据标准

13、化程度适中,对投 资一般具有高频和前瞻的优势,但部分数 据的可持续性不明确。专业核心因子提取:对于投资逻辑的底层建 设,基于我们的底层数据架构,主要分成两 个核心模块/标签的建设。一方面是盈利表现 核心因子模块,另一方面是估值方向核心因 子模块。资料来源:中信证券研究部13中信证券投研图谱案例:抗癌创新药资料来源:中信证券研究部医药+创新药行业研究数据底层+核心因子提取自动化应用字典抗癌创新药市场长期关注方向,慢变量和高成长特征兼具:技术架构支点:行业级别超融合报告(半自动化)+数据仓库(自动化),形成头尾实体+关系描述备选标签集群高频更 新。支持半自动投资框架提取。数据架构支点:自下而上公司

14、财务和相关销售数据连续跟踪(月/季度);自上而下,找寻细分赛道估值核心影响因素,精细图谱头尾实体的关系定位。14中信证券投研图谱数据集群分类(抗肿瘤创新药为例)静态案例中信证券投研图谱案例:抗癌创新药以抗癌创新药为例,我们以靶点作为拆分逻 辑的原因在于,创新药公司按照存量药品和 在研管线的现状和布局进行估值,拥有更优 质管线储备的公司将享有更高的市场估值溢 价。一方面,我们需要关注已上市药品的销售放 量的情况,另一方面更要对其在研管线的数 量、在研的进度、覆盖的适应症等核心因子 进行跟踪和评价,以此来对同一赛道上的不 同标的进行横向对比,在领域内得到局部最 优解从而得出投资结论。在此基础上,我

15、们 的图谱遵循该行业研究逻辑,从抗肿瘤管线 的视角重点梳理了市场热门靶点,以及对在 该靶点进行布局的药企,分别跟踪其上市药 品的销售和在研药品的研发情况。输出方式看:投研图谱既是动态研报,也是 行业精确数据库。资料来源:中信证券研究部15中信证券投研图谱案例:美妆资料来源:中信证券研究部美妆+大消费行业研究数据底层+核心因子提取自动化应用字典美妆是市场近期+长期关注方向,慢变量和高成长特征兼具:技术架构支点:行业级别超融合报告(半自动化)+数据仓库(自动化),形成头尾实体+关系描述备选标签集群高频更 新。支持半自动投资框架提取。数据架构支点:自下而上公司财务和相关流量+销售数据连续跟踪(月/季

16、度);自上而下,找寻细分赛道估值核心影响因素,精细图谱头尾实体的关系定位。16中信证券投研图谱数据集群分类(美妆为例)静态案例中信证券投研图谱案例:美妆以美妆为例,我们结合消费者认知、产品功 效以及政策监管作为拆分逻辑,针对不同皮 肤需求的美妆赛道享有不同的市场空间和消 费者支付溢价的愿意程度,因此其所能获得 的估值溢价也不尽相同。而聚焦到公司层面我们重点去量化品牌的营 销力与产品力,例如营销力我们主要通过拆 解与追踪品牌在B站、小红书、抖音、快手 等平台的供给量和观看数作为核心因子,横 向和纵向的对比品牌占领用户心智的程度, 产品力则主要通过核心产品价格带变化、产 品用户评价与产品销量来构建

17、因子,寻找出 能持续获得消费者复购的品牌。在此基础上,我们的图谱遵循该行业研究逻 辑,量化了美妆品牌的营销力与产品力,梳 理了美妆集团的战略布局以及其品牌的消费 者心智认知情况。输出方式看:投研图谱既是动态研报,也是 行业精确数据库。资料来源:中信证券研究部17框架+技术+有效性定位:放弃图谱的大范围覆盖,聚焦于自下而上的研究需求,融合专业研究员的领域知识、稀缺的另 类数据因子和一定的可视化方法,对特定热点领域和热点标的进行覆盖,力求保证投资逻辑的专业性、核心因子的适时 准确和稀缺性、数据和结构维护的及时性。逻辑架构:基于三元组架构,头结点为中信二/三级行业(参数关注长期空间),尾结点为标的(

18、参数关注短期盈利指 标),关系聚焦当期估值核心逻辑做头尾链接(参数描述聚焦中期竞争格局描述)。形成宏观偏行业-中观重赛道-微观 聚公司图数据体系。数据架构:基于投研三大数据集群,从数据仓库+数据超融合产品矩阵,迈向数据图谱。技术架构:机器辅助,半监督学习优化投研逻辑和关键因子提取。产品模式/定位:新动态研报。新数据库赋能。现阶段相对局限性:行业横向覆盖延展性。可视化相应效果。18中信证券投研图谱定位CONTENTS目录需求爆发的确定性:数字化提速,投研场景数据应用智能化爆发供给错配的复杂性:受限技术边界,专业机构投研端供需错配创新锻造的科学性:首发投研图谱,自下而上聚焦基本面投研联合发展的必然性:最大化应用效率,最优化竞争壁垒19共享数据生态,聚焦行业标准一体化,拓展业务边界资料来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论