版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1/15金融工程专题报告日期:2025年03月16日DeepSeek在数学推理和代码优化方面优势突出,在Codeforces等标准化测试中超越GPT-4o等模型。本文展示如何借助DeepSeek建立用户自定义的量化选股系统,包含行情更新、指标计算、条件选股的具体实现。oDeepSeek可以理解第三方API文档并生成代码示例我们的测试案例中DeepSeek可以理解并使用akshare、tushare、baostock,以及Wind等金融数据平台的公开文档,并提示用户编程前进行正确安装和注册。在使用过程中,我们难以避免生成式模型提供的代码可能存在的纰漏,对于不能通过测试的代码,可以通过反复提问并细化需求的方式来得到可执行的程序。oDeepSeek可以实现用户自定义的行情更新、因子计算及选股代码行情更新:DeepSeek实现行情数据读取和本地化保存,并给出对应的数据库存储建议,用户可以进一步通过DeepSeek实现本地数据库的维护和定时更新。因子计算:DeepSeek能根据研报及文献等公开资料实现计算指标及因子的代码,也可以根据用户提示实现相应因子计算的代码。将单个标的的单因子计算实现为函数形式,再结合定时任务,在每日行情更新后,进行增量因子的计算,实现本地数据库的因子更新。选股实测:我们以查询上证50指数成分股中上穿10日均线的股票和筛选近期股吧评论热度最高的前10只股票为例,验证了DeepSeek可以实现对标准及另类数据处理并实现条件筛选的代码逻辑,并按指定格式保存结果。o简洁有效的提问可以快速引导DeepSeek给出实用代码样例:(1)良好的提问模板:行动+领域+输出格式;(2)给DeepSeek设定确切的角色3)尽可能将任务细化分解,巧用多回合对话4)提供样例,让DeepSeek按照需要的代码风格进行模仿创新。o风险提示AI模型发生参数微调和数据变动都可能导致性能和结果波动。AI生成的数据可能存在错漏导致结论偏差,不构成投资建议,须谨慎使用。视角》2025.03.11金融工程专题2/15请务必阅读正文之后正文目录 4 42.1利用万得API更新指数收盘行情 4 7 94.1收盘行情筛选均线突破个股 94.2基于社媒报道筛选高热度个股 13 14 143/15请务必阅读正文之后图1:DeepSeek对使用万得API更新沪深300指数收盘行情给出的解决方案 图2:步骤四示例:使用万得pythonAPI获取沪深300指数收盘行情 图3:步骤五示例:对万得pythonAPI返回的数据解析 图4:步骤六示例:设置定时任务每日更新行情数据 图5:DeepSeek对股票非流动性因子提出的解决方案 7图6:DeepSeek对计算上证50成分股非流动性因子的代码示例 图7:DeepSeek计算个股非流动性因子的代码示例 图8:DeepSeek给出上证50指数成分股均线突破股票筛选的解决方案 9图9:DeepSeek筛选上证50指数成分股中突破10日均线的代码示例 9图10:DeepSeek给出多种获取指数成分股的方案 图11:DeepSeek通过baostock获取指数成分股的实例 图12:优化后的上证50指数成分股筛选突破10日均线的股票测试 图13:DeepSeek统计股吧热度最高的10只股票代码示例 表1:主流大模型在代码能力标准化测试任务中的性能对比 4表2:DeepSeek整理股吧讨论热度最高的前10只股票(截止2025.03.15) 金融工程专题4/15请务必阅读正文之后DeepSeek在主流大模型中具有出色的数学和编程能力,能更好地服务金融及经济领域中的数量化研究,尤其是针对需要快速响应的实时应用、对内存和计算资源有限制的环境,以及中文环境下的应用场景。如表1所示,在以Codeforces为代表的算法类标准化测试中,DeepSeek(V3)表现明显超越了其他主流大模型。LiveCodeBench(Pass@1-C本文将展示如何通过DeepSeek搭建用户个性化的本地量化系统,主要由3个关键环节构成:基础数据更新及本地化维护,指定方法的因子计算,以及选股条件的快速验证。我们通过与DeepSeek交互给出每个环节的代码示例及细化方案。提问:如何通过万得api更新沪深300指数每日收盘行情。DeepSeek给出的实现流程如图1所示,将每日行情更新进行任务拆解,账户访问权限、数据请求,及定时任务的设置,基本涵盖了用户实现的各个环节,参考了万得的API文档及python标准库(schedule)文档。DeepSeek节省用户搜索的时间,直接提供了解决方案流程。金融工程专题5/15请务必阅读正文之后针对上述步骤4-6,DeepSeek给出了具体的示例如下:6/15请务必阅读正文之后DeepSeek可以理解万得API文档并正确调用w.wsd函数,对函数的输入参数,其顺序和格式(如标的代码的格式、日期格式)使用完全正确;对函数的返回结果内容也完全掌握,如错误代码(data.ErrorCode)、数据部分(data.Times,data.Data并通过pandas操作保存至数据文件。美中不足的是,DeepSeek对于收盘行情的理解仅包含收盘价格信息,我们可以通过指定数据内容、修改提问的方式实现完整日频行情的数据请求,例如:“请通过python实现,用万得api更新沪深300指数每日收盘行情,包含开盘价、最高价、最低价、收盘价、成交量、成交额数据。”在每日定时任务设置示例中,DeepSeek已经根据实际情况给出了将数据存入数据库的建议,用户可以根据本地数据库的实际情况例如,SQL或MongoDB数据库)通过进一步提问DeepSeek如何实现数据的写入、查重等操作,实现本地数据库的行情数据更新。更进一步,如何通过DeepSeek实现非标数据/另类数据的本地化更新和维护,可以拆解任务为,1)如何获取另类数据,2)根据如何计算标准化的数据特征/指标/因子,3)本地化数据存储及更新维护。7/15请务必阅读正文之后我们将展示借助DeepSeek实现股票因子计算的实例,因子的具体算法可以由用户指定,或者由DeepSeek根据公开资料并给出相应的计算方法。提问1:根据日频行情数据,计算上证50指数成分股的非流动性冲击因子。8/15请务必阅读正文之后由上述结果可知,DeepSeek不仅给出了计算代码,还给出了依据的数学公式,且示例代码和公式一一对应。我们希望系统能够实现多个因子计算且互不影响,并且不受股票列表限制,以便后续因子数据库的维护或因子算法的更新迭代,因此我们希望将每个因子的计算修改为基于一段时间序列的函数,重新提问DeepSeek。提问2:请实现一个python函数,计算单只股票的非流动性冲击因子。得到的示例代码如下(简单对话文字部分省略以此类推,我们可以通过DeepSeek实现众多不同因子的计算,甚至可拓展到借助神经网络或遗传规划批量生成因子,再结合定时任务,在每日行情更新后,进行增量因子的计算,实现本地数据库的因子更新。9/15请务必阅读正文之后提问1:查询上证50指数成分股中上穿10日均线的股票。DeepSeek先将均线突破策略拆解为5个步骤,再给出了代码实现(见图9)。在DeepSeek给出的上述代码样例中,基本的逻辑完整,但所使用的函数并不存在。DeepSeek根据akshare的函数接口“编造“了一个查询上证50指数成分股的函数方法(原代码中ak.stock_sz50_spot()这一行并不能运行。考虑到代码示例整体的可读性较高,逻辑准确,仍有可取之处,我们将追加提问,以获得正确的指数成分股获取方法。10/15补充提问:利用python获取上证50(000016.SH)成分股列表。DeepSeek给出了多种解决方案:根据DeepSeek的建议,我们选择baostock对应的实现方法(无需注册,无需替换api-key的操作)实现上证50指数成分股列表的获取,如图11。将正确的步骤1(获取上证50成分股)和步骤2(按条件筛选股票)合并,可以得到完整的python代码实现上证50指数中收盘价上穿10日均线的股票筛选代码。需要注意的是,由于baostock和akshare返回的变量名称不同,例如“证券代码“在akshare中以”代码“表示,在baostock中以”code“表示,因此需要对变量名进行统一,最终实现可运行的均线突破股票筛选代码如图12所示。经测试计算我们得到,截止2025/3/10收盘,上证50指数成分股中,有2只股票符合收盘价格上穿10日均线的条件,其股票名称依次为:陕西煤业(601225.SH),寒武纪11/15金融工程专题12/15提问1:请根据股吧的发贴、评论,筛选出股民讨论热度最高的10只股票。由DeepSeek整理汇总的结果如下:我们希望将上述股票筛选的过程程序化,再次向DeepSeek提问得到如下代码实例:金融工程专题13/15实际使用过程中,BeautifulSoup的使用受到网络流量和账户的限制,并不适合大批量数据请求,因此对于股吧文本的获取函数还应当继续优化。其他函数,包括文本解析、多只股票文本重复获取、热度统计都符合用户逻辑,可以结合每日定时任务对热度高的个股进行跟踪。通过上述验证,我们总结了以下技巧,如何让DeepSeek准确理解用户需求并给出恰当的解决方案:(1)提问模板:行动+领域+输出格式错误示范:“写个数据分析脚本”——目标数据不明确,处理方法和输出格式不明确,用什么技术栈或框架也没有指明。优化后:“用Python写一个数据分析代码,分析某网站的房屋租赁信息公告,输出为CSV文件,使用statesmodel或scikit-learn建模,代码要有注释”。明确任务、计算方法或模型,以及输出格式,DeepSeek更有可能精准回应。(2)给DeepSeek设定确切的角色提问模板:“请以【经验丰富的xx投资研究员】的身份,以【简洁高效】的风格写一段【xx功能】的代码”。例如:“你是一位使用Python编程的量化研究专家,用简洁高效的代码写一个函数,计算价格时间序列中单日涨幅与单日跌幅分别求和的相对比值,代码要有注释和示例调用”。(3)任务分解,巧用多回合对话错误操作:“写个数据清洗脚本”过于模糊。明确步骤:a).导入pandas库,读取CSV文件。b).处理缺失值,按时间后向填充。c).滚动240天计算每一列z-score,并输出结果。(4)提供范例,让DeepSeek模仿创新高级技巧:“请参考以下代码风格(附带示例写一个函数,计算两个数的defadd(a,b):"""计算两个数的和"""returna+b代码风格包含了函数命名、注释及缩进等细节。金融工程专题14/15本文探索了DeepSeek在量化研究中提供代码解决方案的可行性。我们认为DeepSeek将在数据分析和个性化的量化体系搭建中发挥重要作用。我们对量化研究的3个主要场景进行了测试,包括行情更新、因子计算及个股筛选:(一)行情更新:DeepSeek实现行情数据读取和本地化保存,并给出对应的数据库存储建议,用户可以进一步通过DeepSeek实现本地数据库的维护和定时更新。(二)因子计算:DeepSeek能根据研报及文献等公开资料实现计算指标及因子的代码,也可以根据用户提示实现相应因子计算的代码。将单个标的的单因子计算实现为函数形式,再结合定时任务,在每日行情更新后,进行增量因子的计算,实现本地数据库的因(三)选股实测:我们以查询上证50指数成分股中上穿10日均线的股票和筛选近期股吧评论热度最高的前10只股票为例,验证了DeepSeek可以实现对标准及另类数据处理并实现条件筛选的代码逻辑,并按指定格式保存结果。在使用过程中,DeepSeek可以理解第三方API文档并生成代码示例,并提示用户必要的权限注册。但同时,我们难以避免生成式模型提供的代码可能存在的纰漏,对于不能通过测试的代码,可以通过反复提问并细化需求的方式来解决问题或找到替代方案。简洁有效的提问可以快速引导DeepSeek给出实用代码样例。我们也总结了高效提问的技巧,包括但不限于1)良好的提问模板:行动+领域+输出格式;(2)给DeepSeek设定确切的角色3)尽可能将任务细化分解,巧用多回合对话4)提供样例,让DeepSeek按照需要的代码风格进行模仿创新。AI模型发生参数微调和数据变动都可能导致性能和结果波动。AI生成的数据可能存在错漏导致结论偏差,不构成投资建议,须谨慎使用。15/15股票投资评级说明以报告日后的6个月内,证券相对于沪深300指数的涨跌幅为标准,定义如下:1.买入:相对于沪深300指数表现+20%以上;2.增持:相对于沪深300指数表现+1020%;3.中性:相对于沪深300指数表现-1010%之间波动;4.减持:相对于沪深300指数表现-10%以下。行业的投资评级:以报告日后的6个月内,行业指数相对于沪深300指数的涨跌幅为标准,定义如下:1.看好:行业指数相对于沪深300指数表现+10%以上;2.中性:行业指数相对于沪深300指数表现-10%10%以上;3.看淡:行业指数相对于沪深300指数表现-10%以下。我们在此提醒您,不同证券研究机构采用不同的评级术语及评级标准。我们采用的是相对评级体系,表示投资的相对比建议:投资者买入或者卖出证券的决定取决于个人的实际情况,比如当前的持仓结构以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生护理护理评估课件
- 急诊护理人文关怀
- 提升内科护理质量的体位管理
- 机械安全标准化培训课件
- 机械安全操作培训目的课件
- 陕西省2025八年级物理上册第四章物态变化第三节熔化和凝固第2课时凝固的特点熔化和凝固的应用课件新版苏科版
- 陕西省2025八年级物理上册第一章声现象跨学科实践乐器的调查与制作课件新版苏科版
- 产妇日常护理技巧大全
- 机床工作业安全培训课件
- 《人工智能通识》-项目2-4 AIGC文本生成应用 -任务3 设计智能手表研发项目总结分析
- 小型手持式采茶机
- 太空交通管理规则-洞察及研究
- 化学反应原理大题集训(含解析)-2026届高中化学一轮复习讲义
- 腹腔镜手术应用推广方案与技术指南
- 北京市西城区中学课余训练:现状洞察与发展探究
- 规划展馆改造项目方案(3篇)
- 玉米dh育种技术
- 头孢曲松钠过敏的观察与急救
- 幼儿园后勤人员培训会议记录2025
- 广告材料供货方案(3篇)
- 四上语文《快乐读书吧》作品导读《世界经典神话与传说》
评论
0/150
提交评论