版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录Agent时代的息基础施瓶颈 4数据源选择:从散取到统一接入 5问财SkillHub能力矩阵 5Skill安装和调用 6应用场景与能力边界 7知识库搭建:从信堆到知识复利 8知识库工具选择 8知识库管理架构 9核心工作流程 10录入(Ingest) 10查询(Query) 10体检(Lint) 10信息流通道 12公开信息采集 12私有信息处理 14检索加速与规模化展 15赋能与总结 16风险提示 17图表目录图1: 问财SkillHub中Skill安装方式 6图2: 问财SkillHub中Skill功能测试 6图3: Obsidian知识管理工具 8图4: LLM-Wiki知识库管理式 9图5: ClawWikiAgent工作程示例 11图6: Obsidian知识关系图谱 11图7: 使用OpenCLI采集公信息示例 12图8: 使用ObsidianWebClipper保存网页示例 13图9: 使用MarkItDown进行式转换示例 14表1: 人类友好型数据与Agent友好型数据差异 4表2: 问财SkillHub功能分类 5表3: OpenClawAgent团队据源优化概览 7表4: qmd检索架构 15Agent在《OpenClawAgentClawGuide、ClawScoutClawWatchClawQuantClawResearchOpenClawAgentOpenClawAgent团队Harness型,相同的PromptAgentPPT——对比维度人类友好型数据Agent友好型数据特点方便人类阅读、理解与展示方便机器解析、计算与自动化处理数据形态图表、界面、报告、可视化内容结构化或半结构化数据对比维度人类友好型数据Agent友好型数据特点方便人类阅读、理解与展示方便机器解析、计算与自动化处理数据形态图表、界面、报告、可视化内容结构化或半结构化数据表达方式依赖视觉表达依赖字段结构交互方式UICLIPI可扩展性难以规模化处理易于批量处理和管道化典型工具、同花顺、OfficeP,CPOpenClaw,财通证券研究所Agent在"和"Agent友好型数据之间建立系统化的转换层,数据从哪里来?Agent知识沉淀在哪里?Agent本报告将围绕这两个问题,阐述在Agent数据源选择与知识库建设方面的实践路径,并给出工具选型建议与落地架构。数据源选择:从散乱取数到统一接入SkillHub能力矩阵"Agent用各类数据厂商的API。投研Agent对数据源的选择需满足三个核心标准:API、Skill接口模式可确保Agent高效、稳定地获取目标数据。Agent同花顺问财SkillHubSkillHubAgentSkillAgntSkillSkillHubSkillSkillHubSkillHubSkill25表2:问财SkillHub功能分类类别Skill数量功能描述数据查询6基本资料、行情、财务、公司经营、公司股东股本、行业决策支持13A股、港股、美股、ETF、基金、基金经理、基金公司、可转债、期货期权、板块、基金理财、期货期权数据、指数事件/宏观2事件数据、宏观数据研究评级1机构研究与评级搜索3新闻、研报、公告SHbSkillROESkillSkillHubSkillSkill安装和调用SkillHubSkillSkillHubSkillSkillAgentCLIAgentCLI图1:问财SkillHubSkill安装方式SHbSkillSkillPrompt图2:问财SkillHub中Skill功能测试SHbSkill配置完成后,即可调用其返回的同花顺数据进行分析和决策,相比于普通搜索引擎返回的数据质量得到了很大的提升。应用场景与能力边界在前文中我们已经构建了包括ClawGuideClawScoutClawQuant、ClawResearch等OpenClawAgent在内的智能投研AgentSkillHub后,我们可以对AgentClawScoutClawWatchSkillHubAgent的Skill接口ClawQuantSkillSQLSkillSkillSkillHub并在Agent表3:OpenClawAgent团队数据源优化概览Agent优化程度优化内容ClawGuide不适用不适用ClawScout高全部替换为问财SkillHub来源ClawWatch高全部替换为问财SkillHub来源ClawQuant低SkillClawResearch中以问财SkillHub为优先数据源,无法覆盖字段搜索补充OpenClaw,财通证券研究所SkillHub,让AISkillHubSkillSkillHubSkillHub知识库搭建:从信息堆积到知识复利在投研领域,数据获取仅是基础技能,真正形成差异化优势的,是投研人员在长期研究实践中逐步沉淀的私有化认知体系,包括对行业结构的深度理解、对公司经营逻辑的持续跟踪,以及对历史事件与市场规律的系统化总结。这类知识往往具有高度个性化与经验属性,难以通过公开数据直接获取,因此需要通过系统化的知识库体系进行沉淀、组织与复用,从而形成可持续迭代的研究能力。知识库工具选择Notion在本地知识管理工具中,我们选择Obsidian作为基座,核心考量如下:完全Markdown.mdGit[[笔记名图3:Obsidian知识库管理工具bdima、GoogleNotebookLM知识库管理架构传统知识库的核心矛盾在于:知识录入简单,知识整理困难。当知识库规模扩大后,人工维护成本急剧上升,包括已有知识是否需要更新,哪些知识之间存在矛盾、不同知识模块存在哪些联系等。OpenAI创始人之一AndrejKarpathy提出的“LLM-Wiki”模式为这一难题提供了解决思路:让大模型承担知识整理的工作,人只需要提供资料和提问。bdin是IDLMikibdinMarkdownLLM""角图4:LLM-Wiki知识库管理范式Github,财通证券研究所基于LLM-Wiki范式,我们搭建本地知识库架构,目录结构如图4所示:raw/:存放原始资料,包括论文、研报、网页、纪要等。这些文件只能由用户添加,LLM无权修改。这是知识库的原始根基,保证数据的原始性和可信度。LLMLLMSchema规则文件:告诉LLM知识库的组织约定、录入来源说明、回答问题的流程规范等。对于OpenClaw来说,对应的规则文件是AGENTS.md。indexLLMindexlog核心工作流程LLikiIg(uryLin录入(Ingest)用户向知识库中添加新资料时,LLM的工作流如下:wiki/3.index.mdlog.md10-15wikiLLM查询(Query)用户提出问题,LLM在知识库中搜索并回答:WikiWikiraw/Markdown页面、表格、图表,甚至PPTLLM回答的结果可存回Wiki,形成知识复利。用户多次询问某行业的问题,LLM每次的回答都沉淀到Wiki中,后续遇到相同问题可直接调用,大幅提升效率。体检(Lint)LLMwiki进行LLMWiki知识库,成本极高;而LLMClawWikiAgentAndrejKarpathy技术文档输入至HRAgentClawWikiAgentAgent创建完成后,我们就可以在Obsidian中创建本地知识库仓库,并通过ClawWikiAgent对知识库进行自动化管理,完成新知识导入、知识查询与调用以及知识库健康维护的操作。图5:ClawWikiAgent工作流程示例Github,财通证券研究所LMiki”范式的最终成果将沉淀为结构化的知识笔记,并通过Obsidian的可视化能力进行展示。图6:Obsidian知识库关系图谱Github,财通证券研究所信息流通道投研领域的信息流可分为公开信息流和私有信息流两个部分,公开信息流包括每日从网络获取的宏观数据、公司新闻、第三方观点、行业报告等,私有信息流包括机构内部的路演记录、专家访谈、深度研报等有价值、限制公开的内容。针对两条信息流的特点我们建立两条不同的技术栈,以实现从信息转化为知识,最终嵌入到知识库中的流程。公开信息采集目前,Agent对网站与桌面软件的直接访问能力仍然存在稳定性较差的问题,因此,需要借助额外工具,为大模型提供跨平台的信息获取能力。为此,我们引入了开源工具OpenCLI,以构建“Agent自动采集信息”的基础设施。OpenCLICLIAgent/Agent图7:使用OpenCLI采集公开信息示例Github,财通证券研究所对于需要模拟用户操作的场景,OpenCLI还提供浏览器自动控制能力,可执行点击、输入、页面获取以及截图等操作。LLM-WikiAgentObsidianClipperObsidianObsidianClipperObsidianGoogleChrome、MicrosoftEdgeMarkdown其核心优势包括:自动过滤广告、导航栏及侧边栏等无关内容;完整保留标题结构、列表、代码块等排版信息;自动保存原文链接、来源及剪藏时间等信息;内容直接写入本地知识库仓库,无需二次导入。图8:使用ObsidianWebClipper保存网页示例Gtubbd在实际使用中,我们可以在插件中进行个性化配置自定义剪藏模板,例如自动加入摘要或标签字段,接入大模型API,使系统在剪藏时自动生成文章摘要或要点提炼等。通过上述工具组合,我们构建了一套完整的信息采集闭环机制:OpenCLI负责AgentClipperIngestLint通过这一机制,公开信息的获取、归档、整理与知识化沉淀能够形成自动化、持续运行的知识生产流水线,从而显著提升研究团队的知识积累效率与长期研究能力。私有信息处理除了公开渠道的信息,投研人员还可从专业渠道获取其他较有价值的信息,包括PDF、PPTMarkItDown是PythonCLILLMMarkdown在知识库体系中选择Markdown作为统一格式,主要基于两方面考虑:第一,MarkdownMarkdownMarkdown见的信息载体,包括:文档类文件(DF、od、PT等,网页与结构化文本(HTMLJSON等图9:使用MarkItDown进行格式转换示例Github,财通证券研究所Markdown已能ClawWikiAgentOpenClawPDFOCR检索加速与规模化扩展Wikiqmd(QueryMarkupDocuments)Agent表4:qmd检索架构阶段技术用途关键词检索BM25快速召回包含关键词的文档语义搜索Embedding向量搜索支持同义词与语义匹配结果重排LLMRe-ankng对候选结果进行语义评分排序Github,财通证券研究所qmdBM25Re-rankingqmd2GBembeddinggemma-300MMarkdown知识目前主流的解决方案是RAG(Retrieval-AugmentedGeneration)RAG识库内容进行回答,从而显著提升回答的准确性与可控性。企业通常可基于LangChain或Dify构建完整的RAGRAG架构通常结合向量数据库与语义检索技术,具备以下核心优势:海量数据支持:通过向量数据库实现高效索引,可支持大规模文档的存储与检索;embeddingRAG赋能与总结本报告从AgentAgentOpenClawAgent团队之中,可显著提升AIAgent以ClawResearchAgent例,定为盖司与 综型研手兼具基本面析与技分析能力。引入本所提出的数源架构识库体系,ClawResearch能力系够现统升级主体在个面:AgentSkillHubAgent第三,投研角色能力升级。在专业数据源与私有知识库的双重支撑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届江西省宜春市高三第三次模拟考试历史试卷含解析
- 避寒旅游春节目的地
- 2026年智能语音技术报告
- 2026年3D打印建筑材料报告及未来五年行业创新报告
- 循证康复实践中的康复-创新体系
- 初中英语演讲中皮肤触碰行为对情感传递效果研究课题报告教学研究课题报告
- 初中英语写作中逻辑衔接词的选词精准度实验研究报告教学研究课题报告
- 康复评估的循证康复循证实践路径
- 高端装备制造业创新中心建设可行性研究报告-聚焦智能检测2025
- 初中生物神经科学实验的模拟创新设计课题报告教学研究课题报告
- GB/T 4513.6-2017不定形耐火材料第6部分:物理性能的测定
- GB/T 27614-2011生物防治物和其他有益生物的输入和释放准则
- 古埃及文明教学课件
- 小学语文人教六年级上册菩萨蛮·大柏地课件
- 拆除爆破基础知识课件
- 《C语言程序设计》复习 参考答案
- 钢管桩注浆施工记录表
- 胸腔镜肺段切除术解剖基础
- 高分子材料完整版课件
- gcp证书试题+答案
- 减重手术治疗糖尿病ppt课件
评论
0/150
提交评论