版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录MiroFish是什么? 3MiroFish机制简介 4MiroFish工作流程 7MiroFish能力测评 16基础能力测评 16金融任务测评 16基模型效果测评 173总结 194风险提示 20插图目录 21表格目录 21MiroFish当下随着AIAgent杂系统协作演进,成为推动AI向生产力主体跃迁的关键工程。多Agent协同成AIAgentMiroFish是一个开源AI预测引擎,定位为简洁通用的群体智能引擎。项目发布于2025年12月,于2026年3月登顶GitHub全球趋势榜榜首。与传统基于统计回归的预测工具不同,MiroFish的核心创新在于通过构建高保真平行数字世界来推演未来。系统能够从用户上传的种子材料(如突发新闻、政策草案、金融信号、文学文本或数据分析报告)中提取关键信息,自动生大量具备独立人格、长期记忆与行为逻辑的AI智能体。这些智能体在虚拟环境中自由交互、社会演化,通过群体涌现效应生成预测结果。图1:MiroFishGitHub页面 图2:MiroFish项目获得收藏数(Star) Github,联生券究所 Github,联生券究所MiroFishMiroFish的技术架构深度融合了时序GraphRAG(图检索增强生成)技术、多智能体系统(Multi-AgentSystem,MAS)以及OASIS仿真引擎。系统支持严肃的商业决策预演(如政策评估、金融投资推演、舆情危机模拟)与创意仿真。MiroFish采用数字孪生社会架构,其核心不是单一AI模型,而是一个多智能体并行计算集群:1、由用户输入种子材料和模拟提示词2、由图谱构建引擎生成GraphRAG知识网络3、由智能体工厂生成N个独立人格智能体4、双轨仿真环境推演5、由涌现检测器捕捉群体行为模式6、生成结构化预测报告图3:MiroFish核心架构机制详解 国联民生证券研究所绘制图谱构建过程中,LLM根据输入的种子材料自动分析文档,提取实体类型(EntityTypes)与关系类型(EdgeTypes),并构建对应知识图谱,同时为每个实体节点注入个体记忆(个人经历)与群体记忆(社会背景),形成可演化的数字社会基础架构。其核心依赖的时序知识图谱与长期记忆服务,由ZepCloud提供。ZepCloud是一个为AIAgent设计的长期记忆服务,区别于传统向量数据库,它专门优化了时序关系记忆,使AI能够像人类一样记住谁在什么时间做了什么,并随时间更新关系。图4:ZepCloud功能示意 getzep,国联民生证券研究所环境搭建过程中,MiroFish将知识图谱中的Person节点转化为具备完整人格的Agent,Organization节点转化为大发言人拟人化实体。每个Agent配置包含:年龄、性别、MBTI、职业、国籍、活动频率、情感倾向、立场(支持/反对/中立)、影响力权重,同时包含基于种子材料生成的认知背景。MiroFish还将配置Agent自动生成OASIS仿真规则(互动频率、话题敏感度、平台特性参数)。图5:OASIS功能示意 OASIS,Camel-AI,国联民生证券研究所仿真执行过程中MoFih启动模拟的X与t两个社交平台并行仿真,zep_graph_memory_updater.py,AgentZep(如信任度衰减、立场转变。报告生成过程中,MiroFishReACT(Reasoning&Acting)范式,主动调用工具集而非被动生成文本。工具集构成包括:insight_forge:深度洞察提取;panorama_search:跨平台全景检索interview_agents:智能体访谈(查询决策动机)Twitter+RedditMarkdown含事件脉络、关键时间节点、风险预警、策略建议等模块。MiroFish我们通过模拟黄金2026年走势分析的案例来探索MiroFish的工作流程。MiroFish开启后会要求用户传入现实种子文件和模拟提示词。图6:MiroFish欢迎界面 MiroFish,国联民生证券研究所种子材料作为模拟的设定信息起到条件约束和框架设定的作用。我们通过ClaudeOpus4.6模型生成一个描述黄金市场现状和核心影响因素的种子文件,以及对应的模拟提示词。种子文件包含7209字,涵盖了黄金的八项材料总结,包括黄金的驱动框架、历史表现特点、2026年关键事件、机构观点等因素。模拟提示词则给出需要讨论的议题和需要预测的问题。图7:黄金市场现状和核心影响因素的种子文件提纲 ClaudeCode,国联民生证券研究所图8:黄金2026年走势分析模拟提示词 ClaudeCode,国联民生证券研究所图9:MiroFish生成的实体和其关系MiroFish,国联民生证券研究所然后模型会结合上下文,自动调用工具从知识图谱梳理实体与关系,初始化模拟个体Agent,并基于现实种子赋予他们独特的行为与记忆。案例中模型生成了60个Agent人设,包括其基本信息、人设简介、关联话题、人设背景等,其中基本信息的设置为随机生成与现实和种子文件未必相符。图10:MiroFish生成的Agent与其人设MiroFish,国联民生证券研究所Agent生成好后模型将利用其进行信息广场(X)和话题社区(Reddit)的Agent72/不喜欢某观点,回复观点,关注点赞等。图11:MiroFish模拟的Agent社交媒体互动MiroFish,国联民生证券研究所最终通过工具的调用,模型将生成最终的预测报告。报告的模型输出核心结论:20261979观底色下,黄金已完成从抗通胀工具向主权信用对冲工具的蜕变。其后续走势将以宽幅震荡代替深幅回调,在新的信用定价体系中寻找更高的历史中枢。图12:MiroFish报告生成MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果MiroFishAgentAgentAgent图13:MiroFish与报告Agent对话功能展示 MiroFish,国联民生证券研究所图14:MiroFish与个体Agent对话功能展示 MiroFish,国联民生证券研究所MiroFish的一大约束在于其极度依赖种子文件的信息。如果种子文件有事实错误,其会不断放大错误的影响,同时如果有种子文件缺失的信息,其也无法通过现实搜索进行信息的证实和补充。总体来说模型为封闭环境模拟。比如案例中我们指出事实与其预测的误差,其更倾向于坚持种子文件信息推导出的观点。图15:MiroFish的报告Agent对非种子文件信息的反映MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果但通过在与报告Agent图16:MiroFish的报告Agent对补充事实信息的进一步推断MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果Agent为逻辑链条补充和查漏工具。图17:MiroFish对美联储沃尔克式加息假设的结论一 MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果图18:MiroFish对美联储沃尔克式加息假设的结论二MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果图19:MiroFish对美联储沃尔克式加息假设的结论三MiroFish,国联民生证券研究所,注:AI观点不代表本机构观点,仅为测试结果同样的种子文件和问题我们调用了KimiK2.5进行了回答,并用ChatGPT进行评价与打分。从结果来看MiroFish的报告并未显著优于联网LLM的直接回答。整体来看MiroFish的报告强在叙事性——在历史对比深度、政策分析深度、宏观研究深度上更强,但由于其封闭的演化环境导致其容易放大部分假设,并且更为谨慎给出明确的判断,而联网LLM更愿意直接给出判断。表1:ChatGPT对两份回答的整体评价维度MiroFish回答KimiK2.5回答风格宏大叙事/战略级交易导向/战术级价格预测模糊(强调5000+高位震荡)明确(6000-6300年底)季度拆解偏逻辑演化明确区间+驱动切换情景分析定性为主概率+幅度量化历史对比深度强(信用体系变迁)更结构化(表格+机制)政策分析深(美元信用、财政矛盾)更可交易化可执弱强极端假设很多(战争、5000+一季度)也激进但更渐进ChatGPT,国联民生证券研究所MiroFish回答KimiK2.5回答评分评价评分MiroFish回答KimiK2.5回答评分评价评分评价宏观深度9.5信用定价框架极强8略低但足够逻辑完整性9叙事闭环很好9很清晰数据量化6偏定性9区间+概率可交易性5难落地9.5极强情景分析6缺概率/路径9.5卖方研究水平风险控制6偏单边多头8.5有熊市情景假设稳健性5极端情景较多7仍偏乐观总分6.6/108.6/10ChatGPT,国联民生证券研究所MiroFish我们使用ClaudeCode对MiroFish进行测评实验,在基础能力测评中主要设计了5个实验,其运行结果总结如下:表3:ClaudeCode对MiroFish的测评实验结果 实验名称实验目的实验结果知识图谱构建质量测试评估GraphRAG从不同类型种子材料中提取实体和关系的能力。对结构化和半结构化文本的处理能力较强,能准确提取实体类型和语义关系;社交媒体文本表现更优,提取了更多实体和关系,说明系统对非结构化信息有较好的挖掘能力。Agent画像生成多样性测试评估生成的Agent画像是否具有足够的多样性和合理性。角色多样性(优秀):能够形成完整的利益相关者图谱;人设深度(优秀):每个Agent包含极为详细的背景描述;关系网络(优秀):Agent间的互动关系在persona中已有预设;MBTI多样性(一般):类型较为集中;年龄/性别多样性(不足):缺乏人口统计学差异。预测一致性分析测试多次运行结果的一致性。核心结论和框架保持一致,细节表述存在合理差异输入敏感性测试测试输入变量变化对结果的影响。一致性(良好):3次运行均成功产生报告,前两次高度一致,系统具有较好的可复现性;敏感性(合理):输入微调后,图谱规模变化不大,但Agent行为和报告长度有明显响应,说明系统对输入变化具有适度敏感性。Agent采访与深度对话测试测试模拟结束后与Agent进行深度对话的质量和人设一致性。Agent对话质量出色,人设一致性强,多元视角丰富。ClaudeCode,MiroFish,国联民生证券研究所总体来说MiroFish的知识图谱、Agent设计较为优秀,这部分主要来源于ZepCloud的贡献。除此之外模型整体端到端流程自动化也较好,预测报告信息量丰富,多元视角模拟有效。为了验证MiroFish在投资决策相关场景中的预测价值,我们通过ClaudeCode表4:四项金融任务实验信息 场景耗时Agent行为数报告长度产业政策:AI产业促进条例1,926s(32分钟)927,240字符资产预测:2026Q2大类资产配置1,586s(26分钟)847,315字符地缘推演:美以对伊军事冲突1,825s(30分钟)1248,688字符科技 到具身智能3,245s(54分钟)1647,549字符ClaudeCode,MiroFish,国联民生证券研究所场景1:产业政策—AI产业促进条例知识图谱从种子材料中提取了34个实体节点和29条关系边,生成14个Agent(含政府机构、券商、科技企业、学者、中小企业等角色)。92个交互行为中,Agent围绕政策受益方、落地执行争议、中小企业困境等多维度展开讨论。报告对产业链传导路径和资金流向做出了具体预判。2:资产预测—2026Q2图谱提取48个节点、50实体。84主要风险因子和配置策略方向做出了系统性分析。场景3:地缘推演—美以对伊军事冲突这是所有投资场景中Agent行为最活跃的(124个action,充分体现了地场景4:科技路径—从LLM到具身智能gt(164个了多角度分析。在MiroFish的基模型选择中,我们尝试了Qwen3.5-plus和ClaudeOpus4.6两个模型,对上述4个场景做了相同的测验,并用独立的ClaudeCode评估了模型效果。测试结果如下:4Claude表5:四项金融任务基模型基本指标对比 指标场景Qwen3.5-plusClaudeOpus4.6差异总耗时产业政策1,926s1,103sClaude快资产预测1,586s1,127sClaude快地缘推演1,825s1,302sClaude快科技路径3,245s1,407sClaude快总动作数产业政策9296Claude多资产预测8496Claude多地缘推演124128Claude多科技路径164140Qwen多报告长度产业政策7,240字符6,915字符Qwen长资产预测7,315字符9,530字符Claude长地缘推演8,688字符5,604字符Qwen长科技路径7,549字符5,606字符Qwen长图谱节点产业政策3443Claude多资产预测4845接近地缘推演5849Qwen多科技路径5045Qwen多图谱边数政策2935Claude多资产预测5026Qwen多地缘推演5348Qwen多科技路径4429Qwen多ClaudeCode,MiroFish,国联民生证券研究所从报告质量指标来看:Qwen强在数据密度、投资可操作性、结论具象化,而Claude强在因果推演能力、结构化分析、信息诚实度、语言一致性。表6:四项金融任务基模型报告质量指标对比 评估维度产业政策Q/C资产预测Q/C地缘推演Q/C科技路径Q/C均分Q/C1.推演深度3.5/4.53.5/4.54.5/4.04.0/4.53.88/4.382.逻辑合理性3.5/4.53.5/4.54.0/4.03.5/4.53.63/4.383.逻辑完整性3.0/4.53.5/4.53.5/4.53.5/4.53.38/4.504.逻辑细节度4.5/4.04.5/4.04.5/4.04.5/4.04.50/4.005.结4.5/3.54.5/4.04.5/3.53.5/4.54.25/3.886.观3.5/4.04.0/4.54.0/4.54.0/4.03.88/4.257.创新性/独特洞察3.5/4.54.0/4.54.0/4.03.5/4.53.75/4.388.可操作性4.5/3.54.5/3.54.5/3.53.5/3.54.25/3.509.证据引用质量3.0/4.53.5/4.53.5/4.52.5/4.53.13/4.5010.风险分析深度3.5/4.53.5/4.53.5/4.53.5/4.53.50/4.5011.语言表达质量3.5/4.53.5/4.53.5/4.52.5/4.53.25/4.5012.信息边界意识2.5/4.52.5/4.52.5/4.52.5/4.52.50/4.50ClaudeCode,MiroFish,国联民生证券研究所,注:Q代表Qwen,C代表Claude总结MiroFish作为群体智能引擎已经实现了AI群体交互涌现的基本架构。其生成的智能体层次丰富多元,架构清晰合理,但交互次数和深度由于token成本约束较难做到大规模模拟下的效果,且Agent细节现阶段无法达到数字孪生水平的精细度,整体适用于对精确度要求并不那么高的模拟预测。从生成报告的质量来说,MiroFish并未显著好于联网LLM,但叙事性更强。MiroFish的封闭模拟环境使得其对种子文件中的偏误信息容易持续放大影响,对种子文件准确性和完整性有着较高要求,但MiroFish通过大规模Agent模拟可以达到较强的叙事性,逻辑闭环更强,比较适合对于分析逻辑的启发、查漏、推演。在金融任务中,我们认为MiroFish依然有其自身的优势。MiroFish较强的叙事性和逻辑闭环较为适用于宏观研究中的政策影响分析、资产驱动分析等需要反复推敲的研究,也适用于产业趋势研究中对于技术路线、价值链中各种可能性的详细排查,其内置的报告与Agent对话机制可支持多情景推演,为用户在不同假设条件下开展沙盒测试提供了灵活的工具支持。风险提示模型存在信息封闭性与推演偏差风险。MiroFish采用封闭环境模拟,无法自主检索外部信息验证种子文件准确性,若输入材料存在事实错误或信息缺口,Agent交互可能持续放大偏差形成逻辑自洽但事实错误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盐城工学院《传播学教程》2025-2026学年期末试卷
- 长春电子科技学院《监察法》2025-2026学年期末试卷
- 长白山职业技术学院《疾病学基础》2025-2026学年期末试卷
- 2024年贵州省黔南州高考语文二模试卷
- 2024年民间借款合同详细版
- 2024年施工企业资金管理制度
- 2023年初中物理知识点总结
- 宾馆楼层拆除施工方案(3篇)
- 年会创意营销方案(3篇)
- 微分专题综合结业测试卷
- 建筑行业异地缴增值税
- 2026年中国铁道科学研究院集团有限公司校园招聘笔试参考试题及答案解析
- 2026年山东省征信有限公司社会招聘考试备考试题及答案解析
- 医疗废物管理规范课件
- 柴油加氢改质装置操作规程
- 山东黄金集团校招试题及答案
- 2026年中国高强螺栓检测仪行业市场规模及投资前景预测分析报告
- 关节置换术中的三维假体适配设计
- 火锅店人员绩效考核制度
- 医疗器械风险管理控制程序文件
- 初中音乐八年级上册:《费加罗的婚礼》序曲赏析与创意表现
评论
0/150
提交评论