tfdatatoolsskill介绍:自然语言驱动的金融数据提取工具_第1页
tfdatatoolsskill介绍:自然语言驱动的金融数据提取工具_第2页
tfdatatoolsskill介绍:自然语言驱动的金融数据提取工具_第3页
tfdatatoolsskill介绍:自然语言驱动的金融数据提取工具_第4页
tfdatatoolsskill介绍:自然语言驱动的金融数据提取工具_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录tfdatatools简介 4tfdatatools功能模块介绍 4模块1:原始SQL数据提取 5模块2:获取清洗后的量价数据 6模块3:港股数据查询 6模块4:获取行业分类 7模块5:ST、*ST股票查询 7模块6:时态分类数据 8模块7:一致预测数据 8模块8:通用提取 9模块9:智能缓存 10模块10:因子与组合回测 10tfdatatoolsskill使用示例 示例1:跨表查询 11示例2:查询多只股票的时间序列数据 13示例3:获取股票的行业分类 15示例4:提取行业股票的经营数据 16示例5:提取股票一致预测数据 17示例6:获取陆股通股票名单 18示例7&8:提取基金重仓股数据 19示例9:筛选基金并提取基金净值 21风险提示 图表目录图1:tfdatatoolsskill系统架构 5图2:模块1原始SQL数据提取示例 5图3:模块2获取收盘价宽表示例 6图4:模块3港股数据查询示例 6图5:模块4股票行业查询示例 7图6:模块5获取ST、*ST数据示例 7图7:模块6获取时态分类数据示例 8图8:模块7获取一致预测数据示例 8图9:模块8通用提取示例 9图10:模块9智能缓存示例 10图11:模块10因子与组合回测示例 10图12:例1查询结果(1) 11图13:例1查询结果(2) 12图14:例2查询结果(1) 13图15:例2查询结果(2) 14图16:例3查询结果 15图17:例4查询结果 16图18:例5查询结果 17图19:例6查询结果 18图20:例7查询结果 19图21:例8查询结果 20图22:例9查询结果(1) 21图23:例9查询结果(2) 21tfdatatools简介tfdatatools是天风金工团队开发的基于 数据库的金融数据提取skill它支持自然语言交互,用户只需用日常语言描述数据需求,AI即可自动生成SQL并返回结果,大大提高了数据提取的效率全面涵盖了A股行情公司财务行业分类ST状态等多种金融数据。提供从底层原始SQL到上层语义化API的多种调用方式满足不同技术背景的开发需求。设计理念为让金融数据提取像对话一样简单。tfdatatools的目标用户是需要频繁读取 数据库的投研、量化和数据分析人员。传统流程中,一个简单需求往往需要经历“理解业务含义、找表、找字段、确认日期字段、确认报表类型、写SQL、透视宽表、检查口径”的多步操作。tfdatatools将这些步骤沉淀为skill路由表和语义化接口,使用户可以直接提出业务需求,例如:“提取贵州茅台和宁德时代2024年ROEFY1“提取过去1年每个月港股净利润TTM数据,并生成panel“用复权收盘价生成20日波动率因子并测试RankIC系统会先识别任务类型,再选择优先函数或核心表,并按对应日期字段、代码字段和报表口径执行。Skill共包含10个核心功能模块,支持策略回测和数据PIT处理等功能。tfdatatoolstfdatatools系统架构包含6层,分别为用户层:用户自然语言输入,AI理解用户意图;AI尝试的过程;语义层:根据语义判断是否可以调用现有的业务API,get_prices、get_financials、get_hk_financial_pit等;通用提取层:用于获取原始数据;治理层:进行数据字段校验、日期校验、报表类型校验等;缓存+数据层:从缓存或MySQL数据库中将数据提取出来。图1:tfdatatoolsskill系统架构天风证券研究所模块1:原始SQL数据提取功能:直接执行SQL语句,返回DataFrame/List/Dict格式的查询结果。图2:模块1原始SQL数据提取示例天风证券研究所模块2:获取清洗后的量价数据功能:量价数据自动去重、转换日期、透视为宽表(日期×股票代码矩阵。图3:模块2获取收盘价宽表示例天风证券研究所模块3:港股数据查询功能:港股唯一代码转换,获取港股量价数据,获取港股财务PIT数据。图4:模块3港股数据查询示例天风证券研究所模块4:获取行业分类功能:获取五大标准的行业分类,中信、申万、中证、国证、长江,支持一二三级行业查询。图5:模块4股票行业查询示例天风证券研究所模块5:ST、股票查询功能:获取股票ST、*ST数据。图6:模块5获取ST、*ST数据示例天风证券研究所模块6:时态分类数据功能:获取行业分类、停复牌、指数成分股等时态分类数据。图7:模块6获取时态分类数据示例天风证券研究所模块7:一致预测数据A股的滚动一致预测数据RONGTE支持F0/1/2/F3/TTM/GR。图8:模块7获取一致预测数据示例天风证券研究所模块8:通用提取功能:声明式数据提取,主要用于提取原始的数据表格。图9:模块8通用提取示例天风证券研究所模块9:智能缓存功能:对数据进行内存+磁盘的两级缓存,避免重复提取,提高查询效率。图10:模块9智能缓存示例天风证券研究所模块10:因子与组合回测功能:自动提取数据进行因子和组合的回测。图11:模块10因子与组合回测示例天风证券研究所tfdatatoolsskill使用示例示例1:跨表查询例年3季报ROE大于30小于50的股票年4月16日的开盘主动买入金额数据。图12:例1查询结果(1)图13:例1查询结果(2)tfdatatools支持数据表跨表查询,示例1显示,其可以较为准确地提取出ROE等财务数据并提取资金流等数据。示例2:查询多只股票的时间序列数据例2:帮我提取中际旭创、寒武纪、天孚通信、东山精密、兆易创新、国机精工的过去一周的收盘价,展示为二维的dataframe。图14:例2查询结果(1)图15:例2查询结果(2)tfdatatools支持提取多只股票的时间序列数据,并进行数据分析。示例3:获取股票的行业分类例3:提取中际旭创、寒武纪、天孚通信、东山精密、兆易创新、国机精工的中信一级行业名称。图16:例3查询结果示例3显示,tfdatatools可以较为准确提取出中信一级行业名称和对应的行业代码。示例4:提取行业股票的经营数据例4:白酒行业中股票2024年年报净利润。图17:例4查询结果示例4显示,tfdatatools可以提取出行业中对应的股票并提取经营数据。示例5:提取股票一致预测数据例5:获取过去一周中际旭创的滚动一致预测净利润FY1数据。图18:例5查询结果示例5显示,tfdatatools可以比较准确地提取出股票的一致预测净利润、一致预测PE等一致预测数据。示例6:获取陆股通股票名单例6:获取最新的陆股通股票名单,并保存至csv文件。图19:例6查询结果示例6fdaalscsv文件。示例7&8:提取基金重仓股数据例7:获取华夏成长基金2025年年报的重仓持股。图20:例7查询结果例8:获取华夏成长基金2026年一季报的重仓持股。图21:例8查询结果示例7和8显示,tfdatatools可以比较准确地提取基金的重仓股数据,并且没有生成数据库未收录的数据,受模型幻觉的影响较小。示例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论