金融科技行业2024春季策略报告:支付竞争格局改善金融大模型加速落地_第1页
金融科技行业2024春季策略报告:支付竞争格局改善金融大模型加速落地_第2页
金融科技行业2024春季策略报告:支付竞争格局改善金融大模型加速落地_第3页
金融科技行业2024春季策略报告:支付竞争格局改善金融大模型加速落地_第4页
金融科技行业2024春季策略报告:支付竞争格局改善金融大模型加速落地_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

请参阅附注免责声明2ICONTENTS005风险提示请参阅附注免责声明3•随着近几年监管趋严和行业持续竞争,牌照数量持续下行:自2015年起,央行开始清理存量支付牌照。此外2021年10月,央行出和特约商户管理并加强收单业务检测。表表1:支付牌照相关政策时间政策央行注销3张支付牌照,结束了第三方支付牌照“只发不央行对非银行支付机构实施风险专项整治工作《中国人民银行关于加强支付受理终端及相关业务管理的《非银行支付机构监督管理条例》数据来源:中国人民银行、国泰君安证券研究图图1:支付牌照数量0数据来源:中国人民银行、国泰君安证券研究请参阅附注免责声明4随着支付牌照收紧及259号文件出台监管趋严,中小收单机构持续出清,行业供给侧改革加速。图2:支付牌照注销数量增加图2:支付牌照注销数量增加432150数据来源:中国人民银行、国泰君安证券研究请参阅附注免责声明5•各家支付公司收单净费率均出现提升。分析拉卡拉、新大陆、新国都、图图3:各家支付公司平均收单净费率均出现提升6请参阅附注免责声明6图5:拉卡拉收单净费率处于较低水平图5:拉卡拉收单净费率处于较低水平0.112%0.124%0.139%0.129%图4:拉卡拉公司流水领先于同业(单位:亿元)图4:拉卡拉公司流水领先于同业(单位:亿元)02020H12020H22021H12021H22022H1数据来源:公司公告、国泰君安证券研究数据来源:公司公告、国泰君安证券研究数据来源:公司公告、国泰君安证券研究请参阅附注免责声明7表3:净利润增量测算(单位:亿元)提价幅度易量/银表3:净利润增量测算(单位:亿元)提价幅度易量/银行卡收单交易量0.01%0.03%0.05%0.07%0.09%%0.341.011.682.353.03%0.451.342.243.144.03%0.561.682.803.925.04%0.672.023.364.716.05%0.782.353.925.497.06表2:收入增量测算(单位:亿元)表2:收入增量测算(单位:亿元)提价幅度提价交银行卡收单交易量0.01%0.03%0.05%0.07%0.09%30%1.123.365.607.8410.0840%1.494.487.4710.4613.4450%1.875.609.3413.0716.8160%2.246.7211.2015.6920.1770%2.617.8413.0718.3023.53数据来源:国泰君安证券研究数据来源:国泰君安证券研究请参阅附注免责声明8请参阅附注免责声明9金融数据金融数据图6:金融信息服务产业链图6:金融信息服务产业链 金融软数据 分析金融数各类数 据信息呈现金融数数据来源:国泰君安证券研究请参阅附注免责声明10图7:投资决策活动的核心在于信息的获取、逻图7:投资决策活动的核心在于信息的获取、逻辑的构建和对交易因素的把握数据来源:国泰君安证券研究请参阅附注免责声明11垂直金融行业大模型和通用大模型在算法训练和使用成本、更新迭代速度方面有不同表现。表4:垂直金融型大模型和通用大模型在不同表现指标上各有优劣表4:垂直金融型大模型和通用大模型在不同表现指标上各有优劣所需数据量较少较大算力占用较小较大自主程度自主可控受限于基座大模型的研发进度、以及开源或授权使用情况较大,需搭建底层架构,具有较高难度,研发效果不及预训练和使用成本较低,后续产品落地后更新迭代成本优势更显著较高,后续产品落地后更新迭代成本预计进一步提升更新迭代速度低成本+自主可控底层架构,有助于提升更新迭代速度高成本+非自主可控基座大模型,更新迭代速度数据来源:国泰君安证券研究请参阅附注免责声明12•通用大模型典型代表:国外:•垂直金融大模型典型代表:国外:BloombergeGPT;国内:同花顺HithinkGPT、东方财富妙想、恒生电子LightGPT表表5:垂直金融型大模型和通用大模型的典型代表练和部署,适用于商业产品和研究实验。LLaMa2是一个开放、免费、多功能和安全的模型,参数量分别为7B、13B、70B,数据载,允许企业进行微调并保护隐私。其多种尺寸适应性强,通过全面测试保障安全和负责任的AIGoogleGemini1.5Pro参数量高达175Kimi模型参数量约2000亿,数据量大约4-5TB。该模型在上下文输入长度上取得技术突破,支持200万字通义千问参数量在千亿级,数据量超过3万亿tokens。该模型能够快速地理解用户问题并提供精准答案,文心一言参数量为260亿,数据量为5TB。该模型主要用于搜索建议,能够快速地理解用户的搜索需求并给出相关的搜索建议,同时支持多语言搜索和根据用户搜索历史和地理位置等因素提供更加精准的搜索建议。BloombergeGPTBloombergeBloombergGPT参数量为500亿,数据量为7000亿。该模型专注于提供高质量的金融领域NLP服务,具有生成BQL等专有功能,以提高金融从业人员的工作效率。其训练数据广泛可现出色,通过多个主流Benchmark测试集的性能超越了主流开源模型,同时在金融领域中表现优异请参阅附注免责声明13数据来源:国泰君安证券研究请参阅附注免责声明14表6:金融客户关心的问题可以分为信息获取和逻辑判表6:金融客户关心的问题可以分为信息获取和逻辑判断两类选基金1)今年哪些基金净值增长最大?2)近7年最大回撤<10%的基金1)最好的前十名AI概念基金选股票1)选出净利润增长90%的公司2)上海市值大于100亿的公司1)推荐能上涨的十只股票2)从XX、XX、XX三只股票中选出最好的一个诊股票1)XX股票主力持仓成本1)XX股票基本面分析2)XX股票k线形态分析看大盘2)复盘一下今天的涨跌停情况1)今天的超短情绪氛围怎么样2)中长期大盘怎么走挑板块2)今天涨停家数最多的行业1)今天热门的板块有哪些2)医疗板块未来有投资价值吗看宏观1)中国最新的CPI数据2)上海人均GDP1)猪肉价格走势分析读新闻1)医疗反腐的最新消息是什么1)公司回购对市场有什么影响2)贵州茅台最近有什么利好学投资1)什么是费用比率1)股票被套了之后怎么解套2)怎么判断板块的持续性金融垂直大模型在信息的获取方面优势明显,主因公司深耕金融行业积累了海量的金融相关信息和数据。表7:金融客户关心的信息获取方面问题的得分及测表7:金融客户关心的信息获取方面问题的得分及测试情况分析产品选基金选股票诊股票看大盘挑板块看宏观读新闻学投资总分测试情况分析65882077对于一般数据的搜索能力较强,但对于主力持仓成本这种无法直接获得的数据无法得到,且其基于数据筛选出的个体数量较少通义千问6833361具有一定的搜寻基本数据的能力,但是存在数据不全以及样本过少的问题文心一言675820874在数据获取方面的表现优秀,对于一般数据的搜索能力比较优秀,但是搜寻出来的样本过少,且无法对筛选出的数据进行排序和综合分析同花顺HithinkGPT5895在数据获取方面的表现最优,数据全面且更新速度快,难以获得的数据也可以准确筛选出,基本可获得测试期间最新的数据内容东方财富妙想020588364在数据获取方面的表现较优,基于数据筛选出的数量多且内容全面,尚不支持基金功能造成总分略低,预计后期会基于自身基金数据补充相关功能注:根据不同产品对上述问题的回答进行评分,分数为0——10分。可以对问题进行回复的答案为5分以上,再根据回答内容的完整度细分;无法对问题进行回答,但是提供了解决思路的答复为3——5分;既没有对问题进行回答,也没有提供解决思路的答复为0。其中东方财富不支持基金功能,因此其“选基金”部分的得分为0;东方财富将“医疗反腐”设置为敏感词汇,因此查询不到相关信息。数据来源:国泰君安证券研究请参阅附注免责声明16逻辑判断方面,各个大模型各有千秋,金融大模型对客户问题的回答更为丰富和详细。表8:金融客户关心的逻辑判断方面问题的得分及测试情况分析表8:金融客户关心的逻辑判断方面问题的得分及测试情况分析产品选基金选股票诊股票看大盘挑板块看宏观读新闻学投资总分测试情况分析3820110kimi的逻辑判断能力是通用大模型类中表现最好的,其在选股票和看大盘方面的能力远强于其他通用大模型类产品通义千问82020101通义千问在选基金和看大盘方面比较短板,其他方面的能力表现出色文心一言320109文心一言在挑板块、看大盘方面的逻辑判断能力突出,但是其在选择股票和基金方面的逻辑判断能力存在不足同花顺HithinkGPT2020127对于逻辑判断方面问题的分析,同花顺与东方财富妙想之间的差异不大,都会针对问题进行环绕式的全面回答,不仅提供AI分析以后的结果,还会提供详细的数据,便于询问者直观看到不同个体之间数据之间的差异大小东方财富妙想02020202020128根据综合分数评价,东方财富在逻辑判断方面的表现最优。其针对逻辑判断问题的输出结果内容详细,很多结果包含了文字、数据以及图形三部分组成,既报告了AI的结论,也便于询问者根据数据的具体信息进行自己的主观判断注:根据不同产品对上述问题的回答进行评分,分数为0——10分。可以对问题进行回复的答案为5分以上,无法对问题进行回答,但是提供了解决思路的答复为3——5分;既没有对问题进行回答,也没持基金功能,因此其“选基金”部分的得分为0。数据来源:国泰君安证券研究请参阅附注免责声明17 2024国泰君安上市公司见面会暨春季策略会•金融大模型相比通用大模型拥有更多的金融数据,通过预训练实现对金融领域问题的更好理解和解答。表9:金融大模型的金融数据更丰富表9:金融大模型的金融数据更丰富大模型金融数据分析月之暗面的Kimi支持200万字的无损上下文输入,金融数据搜索能力和金融逻辑分析能力在通用大模型中较强,但在金融数据方面积累不足。通义千问金融逻辑判断能力中等。文心一言文心一言参数量为260亿,数据量为5TB。受制于金融数据积累不足,对金融数据的搜集能力较为优秀但搜寻样本过低且无法进行分析,金融逻辑分析能力有短板。同花顺HithinkGPT同花顺利用自身过去十几年的数据积累以及市场上公开的金融数据,预训练金融语料达到万亿级tokens。此外还拥有一套自动化的流程,用于数据获取、清洗以及数据质量的验证,每月可新增数千亿tokens优质预训练数据以及数十万条优质微调数据,确保数据的实时性和准确性。东方财富妙想妙想金融大模型储备了超4万亿高质量可用数据,其中金融语料达12000亿,涵盖行情、财务、资金、百科、资讯公告、研报、问董秘等数十个维度、上万种数据品类;且每月高质量数据几千亿token稳定增长,为金融专属任务性能优化提供了优质数据资产。数据来源:国泰君安证券研究请参阅附注免责声明18数据优势主要有两个构成因素:1)丰富的业务场景2)数据的治理能力,前者决定了初始语料的多寡,后者决定了多少语料可以被提取成可供模型训练的高质量数据。表10:做好垂直金融行业需要广泛的数据来源和积累数据类别具体内容金融市场数据包括股票市场、外汇市场、基金市场、债券市场、宏观经济等数据,有助于模型理解市场状况,预测市场走势。包括在金融终端上投资者之间、投资者与智能投顾机器人、顾问等进行的会话数据,金融会话数据通常产生的,有助于模型保持时效性。金融新闻和评论包括金融新闻、市场评论、专家分析等文章,这些文本可经济报告和研究包括经济学家、研究机构和金融分析师发布的报告和研究,涵盖宏观经济、行业分析、公司财报包括金融监管机构发布的法规、政策文件,以及与金融合规相关的规定,这有助于模型理解金融市场的规要求。资料来源:国泰君安证券研究请参阅附注免责声明19良好的数据治理能力可以最大化利用丰富业务场景积累的原始数据,更好积攒训练数据,提高大模型性能。表表11:将初始语料转换为可供训练的数据所需要的步骤流程步骤具体操作初始语料可能包含噪声、错误或不一致的数据。数据清洗是指对数据进行预处理,包括去除重复项、处理缺失数据、对于自然语言文本,需要对语料进行标注和标准化。标注是指对文本进行语义和结构的标记,例如词性标注、命名实体识别等。标准化是指对文本进行规范化,如拼写纠正、词形还原、句法分析等,以便模型能够更好地对于文本数据,需要将句子或段落进行分词,将其划分成词语的序列。然后,将词语转换为向量表示,通常使用词嵌数据增强是指对训练数据进行扩充,以增加数据样本的多样性和数量。常用的数据为了训练和评估模型,需要将数据划分为训练集、验证集和测试集。训练集用于模型的参数训6、数据索引和读取为了高效地访问和读取数据,在构建大模型时通常需要建立数据索引或使用数据加资料来源:国泰君安证券研究请参阅附注免责声明20同花顺、东方财富、恒生电子较早深耕数据业务,在金融行业高质量训练数据上有深厚积累,具备较为强的数据治理能力。同花顺在2009年成立iFind事业部;东方财富在2013年上线Choice数据产品;恒有庞大的海量数据库,具有多元及多样化的金融数据资产,其中公司数据来源既有互联网的结构化数据和非结构化数据,也有来自政府、科研院所、宏观经济研究机构和专业行业数据公司等相关单位、公司的公开和授权的数据。另外,同花顺和东方财富在C端金融信息服务市场具有广泛的活跃用户,在金融语料的获取能力方面领先于同行。图8:同花顺与东方财富图8:同花顺与东方财富APP的MAU大幅领先于同类产品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论