版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
报告题目:AI大模型技术在电力系统中的应用及发展趋势单位:香港中文大学(深圳)时间:2025年6月10日01大语言模型与智能体技术简介2人工智能AI近代史:从早期的逻辑程序到神经网络的兴起决策式AI生成式AI决策+认知+感知+学习+执行+社会协作小规模专家知识浅层机器学习算法深度机器学习算法大规模预训练模型1956年1986年2011年“来源:艾瑞2023年AIGC场景应用展望研究报告2017年历史上第一次人工智能研讨会召开,标志着人工智能的诞生GeoffreyHinton等人提出了一种名为Backpropagation的神经网络训练算法,被认为是神经网络技术的一次重大突破IBM的Watson计算机在美国电视节目Jeopardy中战胜了两位前冠军Transformer架构提出,为大模型发展打下基础2013年2018年DeepMind提出基于深度学习的强化学习模型1965年1997年GPT与BERT模型推出,开启“大模型时代”2014年2022年GAN可生成图像但分辨率有限ChatGPT推出HerbertSimon和Allen
Newell开发了一个名为LogicTheorist的程序,它可以用逻辑推理的方式解决数学证明问题,这被认为是人工智能领域的一次重大突破国际象棋世界冠军Kasparov在与IBM开发的DeepBlue计算机的比赛中失利,标志着人工智能开始在一些传统的思维活动上超越人类2015年2024年2006年Sora推出深度学习技术发明,带来了革命性突破Google的AlphaGo程序在围棋比赛中战胜了世界冠军,标志着人工智能开始在更复杂的思维活动上超越人类早期萌芽阶段技术积淀阶段快速发展阶段爆发阶段(1950s~1980s)(1980s~2010年)(2011年~2016年)(2017年~)什么是语言模型你好。一个前缀输入你也好。你好。V我50。……人类真实分布你好。你也好。建模V我50。…语言模型预测分布给定相同前缀,语言模型是输出能近似人类语言分布的模型。LLM架构与训练:预训练阶段UntrainedBaseInstruction-tunedPreference-tunedLLMLLMLLMLanguage
modelingFine-tuning1(Supervised)Fine-tuning2(Preference)Figure12-3.Thethreestepsofcreatingahigh-qualityLLM.学习文字接龙(prefixLM),无需标注,自监督(self-supervised)“你好美丽。”书籍GPT论文一个不完整的句子接一个可能的字新闻网络爬虫你好美私有知识库你好美丽开源数据集(数学、推理)你好美丽LLM架构与训练:预训练阶段预训练模型三要素以及更多钱·大数据:知识的来源,包含各种语言现象及语义知识,直接决定了模型的学习范围·大模型:容纳大数据的载体,通常由深度神经网络构成,学习大数据中的统计信息与抽象知识·大算力:处理大数据和大模型的并行计算集群,通常包含GPU、TPU等高性能运算设备如何训练自己的LLM?微调训练直接全量参数微调问题:LLM参数量巨大,7b=70亿参数耗费GPU资源多,通常需要A100*8以上(百万RMB)训练时间长,需要数解决方案:LoRA(Low-RankAdaptationofLargeLanguageModels)核心优势:训练参数量少,70亿参数使用LoRA只需要训练百万级别参数微调效果好,LoRA效果不差于全参数微调,优于其他微调方式GPU要求低,3090*4即可微调7b模型Model&MethodModel&Method#Trainable
ParametersGPT-2M(FT)°GPT-2M(Adapter¹)*GPT-2M(Adapter)*GPT-2M(Adapter¹)GPT-2M(FTTOOT)*GPT-2M(Prelayer)*GPT-2M(LoRA)GPT-2M(FT)°GPT-2M(Adapter¹)*GPT-2M(Adapter)*GPT-2M(Adapter¹)GPT-2M(FTTOOT)*GPT-2M(Prelayer)*GPT-2M(LoRA)354.92M
0.37M
11.09M
11.09M
25.19M
0.35M
0.35MGPT-2L(FT)*GPT-2L(Adapter¹²)GPT-2L(Adapter²)GPT-2L(PreLayer)"GPT-2L(LoRA)GPT-2L(FT)*GPT-2L(Adapter¹²)GPT-2L(Adapter²)GPT-2L(PreLayer)"GPT-2L(LoRA)774.03M
0.88M
23.00M
0.77M
0.77MTable3:GPT-2medium(M)andlarge(L)withdifferentadaptationmethodsontheE2ENLG
Challenge.Forallmetrics,higherisbetter.LoRAoutperformsseveralbaselineswithparable
orfewertrainableparameters.Confidenceintervalsareshownforexperimentsweran.*indicates
numberspublishedinpriorworks.从人类反馈中学习-强化学习(RLHF)语言模型的社会化加入代码数据,重新训练。量化人类喜好,训练打分模型基于强化学习,迭代最终模型在web-scale的数据上,训练大语言模型加入指令数据,调优。选择问题世界最高的山峰是?重新选择问题总结下面文章PPO重复生成PPO模型几个答案A:珠峰B:喜山生成回答文章的大意是。。。C:我也不知道D:你打我呀生成分数打分模型人工排序A>B>C>DGPT3GPT3.5排序结果训练奖励打分模型(Reward
Model)模型Reward自监督学习监督学习强化学习LLM架构与训练:各个训练阶段综合来看..UnsuperviseòLearningSupervised
Fine-tohing预训练有监督微调强化学习原始数据标注用户指令用户指令数千亿单词:图书、百科、网页等数万用户指令和对应的答案十万量级用户指令语言模型训练语言模型训练强化学习方法RLHF
()基础模型SFT模型RL模型1000+GPU1-100GPU1-100GPU月级别训练时间天级别训练时间天级别训练时间带着笑脸的修格斯。(由twitter/anthrupad提供)Agent(自主智能体)考古学:通用定义自主智能体典型实例能够自动感知环境能够在环境中自主行动能够通过环境反馈自主学习Maes(1995)WIKIPEDIATheFreeEncyclopediaDeepMindLab,2016ObservationsActionsjumprotate
up/downRewardrotate
left/right(PixelsAgentforward/backstrafeleft/rightcrouch新智元EmbodiedQA,FAIR,2018Q:Whatcoloristhecar?A:Orange!LLMAgent:关键能力—使用工具TellTwitterTrending常用工具:ToolAPIInstruction
AnswerCallAPI搜索引擎Foundation
Model爬虫Human代码Result绘图TwitterTrendingis1.HotWeather1.HotWeather
2.NBAPLAYOFFS
3……2.NBAPLAYOFFS3…LLMAgent:关键能力—任务分解与试错TrialandErrorDescribe,Explain,PlanandSelect:InteractivePlanningwithLargeLanguageModels
EnablesOpen-WorldMulti-TaskAgents
LLMAgent:关键能力—Long-termMemoryTHETRAGEDYOFATHREESECONDMEMORYLong-termMemory与RAG区别:可读写性与HumanBrainMapping:TypebycontentTypebycontentDefinitionEpisodicmemoryEpisodicmemoryStoresexperienceSemanticmemorySemanticmemoryStoresknowledgeProceduralmemoryProceduralmemoryStoresskillsLLMAgent:关键能力—自主学习Fine-tuningmodelweights(themostobvious)-FireActOptimizingpromptsacrosstasks–LLMareHuman-levelPromptengineersImprovetheagent'sowncodebase-SWE-agentWritedownexamples/eventstoretrievelater-GenerativeAgentAppendself-reflectiontoprompttotryagain-ReflextionbinemultipleapproachesQ.Whatareyoulookingforwardto
themostrightnow?MemoryStreamEnvironmentActionLLMQuery芝lenovo(a,o,a,o,a₂o₂……a,o。)Yw↵签发机关性别releasonse…=62…RELMONHeuristic(h)性别121287062871Reflexion,2023120045271842Fine-TuningandPromptOptimization:TwoGreatStepsthatWorkBetterTogetherI'mlookingforwardtothe
Valentine'sLaypartythat
I'mplanningatBobbsCate!DilaraSoyluChristopherPottsOmarKhattabStanfordUniversityGenerativeagents,2023Multi-taskMulti-methed(a)Fine-tuningQuestionsPromptsToolsCorrecttrainctoriesHocpotQACoTCoTtrajsReAct-formatReActtragtrajectoriesStrategyQAxReActLMReflexiontraisTime-18MMMLUReflexion(ea,GPT-4)lenovo(e.g.Llama2)(finstanedLM)(b)InferenceTestQuestionnuCof
Question:3+4+5=?24490ReActThought3-4-5-7+5=12.Answeris12givengeAction:Finish|12|ReflevionObservationereward=1ToolsimpliclemethodselectionCoTinReActformatforsimplequestions.FireAct,20231811201————……………2……②……一=一---………—………—————二⇒LargeLanguageModelsAreHuman-LevelPromptEngineers,2023SWE-agentAgentputerInterfaceputerLM-friendlymandsTerminalNigaterepoSearchfilesCViewfilesEditlinesFilesystemLMAgentsklearn/examples/LM-friendly
environmentfeedbackREADME.rstSWE-agent,2024LLMAgent:新的模型能力获取范式参数学习输出数据集模型输入模型参数能力机器学习时代参数学习模型提示工程将文本分类为中性、负面或正面。文本:输出我觉得食物还可以。情感:中立提示词能力大模型时代参数学习模型提示工程智能体相关的提示词输出机制工程试错众智能力机制智能体时代智能体时代模型能力获取的新范式02LLMAgents在电力系统研究中的应用思考16大模型的核心能力LLMAgent在新型电力系统中的应用思考LLMAgent的潜在应用领域:·机器代人(机巡、客服、公文写作等)·工作流重构(调度运行规划)·信息-物理-社会系统(CPSSE)仿真·多模态数据融合(数字化服务)·电力系统机理研究(AI4S)●在调度运行等核心领域,大模型的推理可靠性与“幻觉”问题,决定了大模型尚不能完全替代人工。●已经应用良好的各种基于因果模型的工具无需替代。●可以考虑采取因果模型+大模型+符号串模型(SPT)+小模型融合的技术路线。,新型能源体系(CPSS-EEE)的多目标协调规划,,文福拴,黄建伟,等.基于大语言模型的电力系统通用人工智能展望:理论与应用[J].电力系统自动化,2024,48(6):13-28.在Agent的框架下实现多类模型的融合多模态融合·适用于误决策代价比较小的简单机器代人场景;适用于需要引入文本、视频等多种模态数据,且误决策代价较小的场景;·不适用于需要对电力系统精确量化的场景;在Agent的框架下实现多类模型的融合文本数据业务数据微调训练大语言模型PINN深度融合/联合推理·实现推理与计算的统一;·较好的模拟因果模型背后的物理机理;·神经网络架构尚有待探索;·可解释性不足;在Agent的框架下实现多类模型的融合推理大模型反馈/自学习问题规划/任务分解/高层次推理文本数据业务数据符号数据微调/RL训练训练大语言模型PINN因果模型符号模型(SPT)知识表示快速数值因果分析/可靠数值计算符号推理计算知识融合/决策推理大模型作为“大脑”,主要负责问题的规划、任务的分解与高层次推理;PINN可在尽量保留因果模型准确性的前提下,大幅提高计算速度;因果模型可在部分必要场景下,保证决策结果的可靠性;符号模型可以在推理中提取形式化知识,保证智能体整体框架的可解释性;在Agent的框架下实现多类模型的融合推理大模型反馈/自学习问题规划/任务分解/高层次推理人机协同文本数据业务数据符号数据微调/RL训练训练大语言模型PINN因果模型符号模型(SPT)知识表示快速数值因果分析/符号推理计算可靠数值计算知识融合/决策·必要的场景中,可以将人引入多智能体框架中;·人可以向智能体提供反馈,并作为最终决策者判定决策质量;·决定人什么时候介入是一个待解决的课题;YCao,HZhao,YCheng,TShu,YChen,GLiu,GLiang,JZhao,JYan,Surveyonlargelanguagemodel-enhancedreinforcementlearning:Concept,taxonomy.andmethods,IEEETransactionsonNeuralNetworksandLearningSystems,2024.信息物理社会系统仿真·大模型的“智能涌现”现象,再次表明复杂系统的研究问题无法完全在还原论的框架下解决。·受院士的整体还原论(WRT)方法论的启发,我们在思考如何将大模型应用于解决复杂的信息物理社会系统(CPSSE)的仿真问题。·WRT以CPSSE框架刻画复杂系统,以混合动态仿真来提取对象系统的高维仿真轨迹,基于轨迹动力学的时空保熵映射,将复杂系统的研究从线性的“局部还原”提升为非线性的“整体保熵还原”。·大语言模型可以基于仿真或实测轨迹数据,基于其内化的理论常识,以一定概率在局部自主进行逻辑推理,实现对复杂系统局部的可解释性。·基于大模型内化的理论常识,大模型也可以用作严格因果模型与近似模型的选择器。·在CPSSE中,社会行为的建模是研究难点。·我们的初步研究表明,大语言模型已具有模仿人进行系统性逻辑思维的能力。因此,可以在CPSSE仿真中,结合真人、因果模型和大语言模型,实现更精确的人机混合仿真。·大模型的推理可靠性与“幻觉”问题,目前尚无法完全解决。现阶段,“人机混合智能”可能是最符合电力系统实际的解决方案。·CPSSE仿真问题解决后,通过CPSSE对实际系统进行反馈,构建大模型驱动的数字孪生,是研究的终极目标。香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen03LLMAgents的应用初探24基于大语言模型实现高适应性负荷预测(多模态数据融合)传统方法局限:1.难以应对特殊事件发生时,短期电力负荷的快速变化或极端波动;2.不能适应超出历史数据涵盖范围的新场景;3.无法基于文本数据(新闻事件)进行预测推理。提出IntelligentText-AnalyticLoadForecasting(ITA-LF):LLM能够基于语言有效处理、整合非结构化及海量多源数据,通过Agent筛选实时相关新闻并理解文本逻辑,显著提升预测的适应性和精确度。LLMsAgentReasoningNewsCategories:I.BreakingNewsPromptProcedure新闻十地理SupplyApplyII.Political&CrimeLLMs擅长解析和理解非结构化数据III.Real-time
NewsDatabaseLLMs
AgentInitialReasoningCourts&IV.LifestyleTechnologyRankingV.FinanceSelectSelection+VI.WeatherReflectionFlexibilityVII.PublicHealthIssueMostRelevantNewsInputSTLFwithLLMsITA-LFInputValidationTime
SeriesDataInput:predictthedailyloadconsumptioninthenextday.Historical
loaddatais:{historicaltimeseries}.Prediction
ResultsValidation
Set历史负荷十气象数据+典型天HistoricalDatacovers{Iday}andthedatafrequencyis{30minutes}perpoint.prehen
sivenessIntelligenceInputGeographic
LocationTheregionis{NSW/QLD/SA/TSA/VIC};Thedateofpredictionis{date}thatis{weekday/weekend},andit
is{holidayname/notaholiday};Finetune预训练模型能够整合广泛的社会、经济和技术知识LLMAgent智能优化用于负荷预测相关新闻的选择InputLarge
Language
Model
(LLM)Typical
DayTheweatherofpredictiondate:(minimumtemperature,maximum
temperature,humidity,windpower,andpressure};TestPredictInputNewsbeforetheprediction:{Newstitle},{briefsummary},{publicationtime},{category},{fullarticle}}.TestWeatherOutput:{Timeseriesofactualloadinthepredictiondate}.Predicted
LoadSetITA-LF框架图基于大语言模型实现高适应性负荷预测新闻事件相关的文本数据的引入,有效提升在特定事件发生时负荷预测精确度。Agent对新闻事件的筛选,在提升大模型输入token效率的同时增强预测精确度:基于新闻和负荷数据的ITA-LF预测效果普遍优于现有方法:TABLEIPERFORMANCEMETRICSOFDIFFERENTMODELSModelModelMSEMSERMSERMSELSTMaLSTMa481006.30481006.30693.55693.55SARIMASARIMA475200.06475200.06689.35689.35ReFormerReFormer169355.11169355.11411.53411.53InformerInformer216422.27216422.27465.21465.21AutoFormerAutoFormer224497.31224497.31473.81473.81ITA-LF(Case1)ITA-LF(Case1)154388.74154388.74392.92392.92ITA-LF(Case3)ITA-LF(Case3)107780.74107780.74328.30328.30ITA-LF(Case2)ITA-LF(Case2)89334.6789334.67298.89298.89ITA-LF(Case4)ITA-LF(Case4)66818.9466818.94258.49258.49基于大语言模型实现高适应性负荷预测预测效果普遍优于现有方法,在不同时间和地理维度的适应性强,显著提升预测的适应性和精确度:基于LLM的负荷预测显著提升准确性和可靠性,优化对突发变化的应对,突出了语言处理在整合非结构化信息中的作用,标志负荷预测及时序决策研究范式的转变。XWang,MFeng,JQiu,JGu,JZhao,FromnewstoforecastIntegratingeventanalysisinIIm-basedtimeseriesforecastingwithreflection.TheThirty-EighthAnnualConferenceonNeuralInformationProcessingSystems(NeurIPS)2024.调度大模型研究背景基于前期研究,我们发现可以将某省市场行为以大语言模型的形式建模(语言模型化),解决传统调度支撑体系中调度行为没有有效建模工具的问题。我们希望实现调度行为数据(包含语音、拓扑结构、文本等多模态数据)、调度规程及系统工况等数据的统一表示,基于大语言模型多智能体实现调度行为的理解、推理、操作序列生成、智能博弈策略某省市场波动响应及决策优化等目标,提高调度安全性与效率。φ69更适应复杂开放场景更安全生成操作序列更可靠在线决策开人类调度与市场行为建模LLM自动学习和处理复杂调控任务调度操作序列生成系统实现某省市场决策推理与智能生成能力事故处置辅助决策工具调用优化质量编号005%吨课信系统调度员系统台账目标课度电话故障信息电话信息此时信息调度多模态数据(日志、语音)电力某省市场行为大语言模型事故处置辅助线路跳闸AI决策大模型决策辅助新闻控制建议课堂仪1.系统信息钢复基解决4.给出4.20回申核结果故障情况的断决策意见母线失压决策辅助事故处置辅助关键投资临停决策太模型各学进决策辅助目标业务成效建立基于大模型智能体的调性能提升支撑复杂开放场景下的调某省市场行为缺少有效建模工具度行为语言模型化与调度决度决策推理与智能生成策智能生成的技术框架调度大模型数据处理Papers,Textbooks,RegulationsDispatchProgramL{"instruction":"Describethemainreasonforwindingfailureinelectricaltransformers.","input":"<noinput>","output":"Insulationdeterioration,oftencausedbymoisture,overheating,vibration,voltagesurges,andmechanicalstressduringtransformerthroughfaults,isthemajorreasonforwindingfailure."}"instruction":"Explainthepotentialcausesoftapchangerfailuresintransformers.","input":"<noinput>","output":"rapchangerfallurescanbecausedbyamalfunctionofthemechanicalswitchingmechanism,highresistanceloadcontacts,insulationtracking,overheating,orcontaminationoftheinsulatingoil."}'"instruction":"whatarethepossiblereasonsfortransformerbushingfailures?","input":"<noinput>","output":"Possiblereasonsfortransformerbushingfailuresincludegeneralaging,contamination,cracking,internationalmoisture,lossofoil,vandalism,andexternalflashovercausedbyanimals."1"instruction":"Prideanexampleofastatisticrelatedtotransformerfaults.","input":"<noinput>","output":"statisticsshowthatwindingfailuresmostfrequentlycausetransformerfaults."},{"instruction":"Suggestsomeneasurestopreventtransformerwindingfailures.","input":"oinput>","output":"Topreventtransformerwindingfailures,measuressuchasensuringproperinsulation,controlling
noisturelevels,oidingoverheating,minimizingvibration,protectingagainstvoltagesunges,andreducingmechanical
stressduringfaultscanbeimplemented.”},调度大模型交互页面DispatchLLM-70bEa2-703-cheoquationstodeterminetheoptimalgenerationschedulesandbusvoltagemagnitudesthat
minimizethetotalcostofgenerationwhilesatisfyingoperationalconstaints.givemeanoutlinetostudyitSure,here'sanoutlinetostudyOPF:1.IntroductiontoOPFanditsimportanceinpower
systems.2.FormulationofCPFproblemanditsmathematicalrepresentation.3.Solution
methodsforOPF,includinglinearandnonlinearprogrammingtechniques.4.Censtraintsin
OPF,suchasthermallimits,voltagelimits,andtransmissionlineconstraints.5.Economic
dispatchanditsrelationshiptoOPF.6.CasestudiesandpracticalapplicationsofOPFin
powersystems.nput清除历史对话业务场景支持:经济调度操作监护调度大模型评价指标用词表达测试集评测体系:多样性准确性错误信息数学运算创造性幻觉性别表达性评测围绕调度大模型在事实性、逻辑性、稳定性、公平性、安全性、表达能力六大类二十四个子维度展开评估。电力大模型共训测试集题型设定:以书济评测体系蝶煦咪囡划假州客观题:判断题、选择题、问答题新疆主观题:问答题稳定性评测方法:扩充表达精简表达稳定性稳定性客观题:GPT-4+评测脚本文法数据单词稳定性稳定性稳定性主观题:GPT-4+人工评测XZhou,HZhao,YCheng,JZhao,etc.ElecBench;aPowerGridDisatchEvaluationBenchmarkforLargeLanguageModels,IEEEPowerandEnergySociety(PES)GeneralMeeting,2024(BestPaperSession).传统经济学仿真面临的困难传统方法大多依赖于数学模型。当仿真涉及多个参与者和复杂策略时,传统方法往往难以应用,因为计算和分析的复杂度极高。动态博弈求解难度大:在动态和不完全信息的博弈情境中,传统方法很难求得收敛解。泛化性较差:对于那些需要快速适应新信息和变化的实际应用场景,传统的数学方法缺乏灵活性。大模型经济学仿真的潜力推理能力:LLMs拥有处理复杂问题和理解复杂语境的能力,这使它们能够理解和分析复杂的博弈策略。泛化能力:得益于LLM出色的zero-shot能力,快某省市场的动态变化。结合大量历史案例,提高仿真的准确性和效率。代理模拟:将ILLM与多代理仿真结合,通某省市场中player行为或策略,为市场仿真提供了一种新的思路。研究进展背景回顾基于大语言某省市场仿真一般性结构框图市场仿真基础某省市场某省市场环境和某省市场外部性。某省市场中,分别对应:“网源荷储”主体和监管主体、电力某省市场规则、系统和市场外部扰动。大模型技术应用:直接交某省市场规则辅助建模、外部扰动参数生成。33研究进展背景回顾提示词工程和检索增强生成技术提示词工程(PromptEngineering):模拟电力交作环境,给出机组工况、断面阻塞、燃料成本、碳成本、系统运行情况等模式化提示语,引导LLM思考方向做更深度逐步推理;检索增强生成(Retrieval-Augmented
Generation,RAG)可适配、理解现货和备用市场相关论文、政策文件、某省市场研报、仿真模型某省市场运行数据、系统工况数据等多场景多模态数据,LLM无需增量训练即可初步理解应用领域知识。提取分割文本嵌入标准Prompt思维链(CoT)思维树(ToT)PDFPPT表示模型InputInputInput各类型文档文本文本块提示词工程记忆向量存储提交问题知识问答链结果用户OutputOutputOutputStandardPromptingChainofThoughtsTreeofThoughts大语言模型提示词工程框架对比检索增强生成技术框架34基于大语言模某省市场均衡分析香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen均衡的重要性企业:确定供需平衡点,帮助企业制定合理的碳排放策略政策制定者某省市场效率,优化政策设计,促进碳排放权的有效配置现有研究局限性依赖数学模型:传统方法大多依赖数学模型,计算和分析复杂度高复杂环境求解困难:在动态和不完全信息的情境中,传统方法难以构建数值解泛化性较差:传统方法在应对新信息和变化时缺乏灵活性难以捕某省市场动态:随着数据和复杂性增加,传统方法难以全面、精确地某省市场动态大语言模型优势精确理解某省市场动态:大语言模型在处理复杂某省市场动态方面表现出色,能够深某省市场机制,提供精确分析。强大的推理与适应能力:大语言模型具备卓越的推理能力和泛化能力,能够迅某省市场的动态变化,提供高精度的预测结果。多主体策略模拟与优化:将大语言模型与代理模型结合,能有效模拟多主体行为和策略,显著提升数值解的求解效率和准确性。基于大语言模某省市场均衡分析香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen求解框架核心技术指令工程指令工程定义:设计和优化提示词,定义:设计和优化提示词,引导大语言模型生成所需输出引导大语言模型生成所需输出应用:构建求解策略和判断应用:构建求解策略和判断>>策略提示词策略提示词优势:提高模型响应的准确优势:提高模型响应的准确性和效率性和效率基于大语言模某省市场均衡分析香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen碳市场模型构建控排企业企业行为:可自行选择买入或卖出碳配额(决策变量)企业属性:初始富余碳配额量,企业价格弹性系数企业目标:在满足履约的同时,最大化交与机会收益之和碳市场价格决定机制:供需平衡机会收益:最后一期碳价格*(1+预期上涨率)*(1-配额折算率)*剩余的碳配额量数据来源与处理▲ABCD1234季度季度净交净交2021Q12021Q12021Q22021Q22021Q32021Q32021Q42021Q42022Q12022Q12022Q22022Q22022Q32022Q32022Q42022Q42023Q12023Q15678910基于大语言模某省市场均衡分析香港中文大學(深圳)TheChineseUniversityofHongKong,Shenzhen结果示例:指令工程综上,某省市场的设定,写一下四个玩家的KKT方程并求解。为了求解四个玩某省市场中的KKT方程并找到最优的b₁和b₁,4的表达式,我们需要联立方程并求解。让我们详细推导并实现代码。KKT条件我们需要满足以下KKT条件:1.Stationarity:拉格朗日函数对的偏导数应为零。2.PrimalFeasibility:约束条件.应满足。3.DualFeasibility:拉格朗日乘子.4.plementarySlackness:定义变量和参数我们假设每个公司的碳配额需求函数为:价格为:拉格朗日函数拉格朗日函数可以写为:Si)其中结果示例:工具调用好的,我们将这些具体的值代入方程,并使用SymPy来求解。以下是完整的代码实现:pythonCopycodeimportsympyassp#定义变量b11,b12,b13,b14=sp.symbols('b11b12b13b14')b21,b22,b23,b24=sp.symbols('b21b22b23b24')b31,b32,b33,b34=sp.symbols('b31b32b33b34')b41,b42,b43,b44=sp.symbols('b41b42b43b44')lambdal,Lambda2,lambda3,lambda4=sp.symbols('Lanhda1lan#具体数值a1val,a2val,a3val,a4val=7379,3813,839,708A1val,A2val,A3val,A4val=339800,184200,22080,-461r1val,r2val=0.1.0#对每个bi1求导数并联立方程求解equations=[]foriinrange(4):forjinrange(4):ifj==3:#处理最后一期eq=sp.Eq(sp.diff(Lagrangians[i],b[i][j]),c)equations.append{eq)elifj<3:#处理前三期eq=sp.Eq(sp.diff(Lagrangians[i],b[i][j]),e)equations.append(eq)#添加约束条件的方程foriinrange(4):eq=sp.Eq(constraints[i],θ]equations.append(eq)代码示例:多代理模型评估模型回应生成质量evaluationprompt=evaluationpromptgen(strategy,finalresponse)evaluationoutput,evaluationcost=chatgptagent(evaluationprompt)scorematch=re.search(r"'score':'([θ-9]+)'",evaluationoutput)ifscorematch:score=score+float(scorematch.group(1))print(score)else:#如果没有找到匹配的score,则打印错误信息score=θprint("Novalidscorefoundinthe
response.")评估模型生成解是否为均衡解defequilibriumjudge(gamesetting,srresponse):prompt=equilibriumprompt(gamesetting,srresponse)equilibriumresponse=chatgptagent(prompt)cleanedpythoncode=cleanmarkdowncode(equilibriumresponse)returnexecutepythoncode(cleanedpythoncode)注:真实实验中大语言模型均通过调用API实现,为展示清晰用网页端的效果代替。基于大语言模某省市场均衡分析香港中文大學(深圳)TheChinese
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年药品安全突发事件应急预案
- 2026年导师制(师徒制)在新员工培养中的实践总结
- 2026年纹绣工作室创业与运营指南
- 国际贸易跨境电商国际营销合同协议
- 2026年发电机故障应急处理流程
- 直播带货直播间运营管理协议
- 国际采购2026年关税筹划合同
- 线上数据标注劳动法规执行的兼职合同范本
- 蒙特卡洛模拟软件升级服务协议
- 新能源储能设备销售协议2026
- 2025四川成都经济技术开发区(龙泉驿区)“蓉漂人才荟”考核招聘事业单位人员(第二批)10人考试笔试备考题库及答案解析
- ESC心肌炎和心包炎管理指南(2025版)课件
- 雨课堂在线学堂《生活中的生物学》单元考核测试答案
- 海关供应链安全培训课件
- 2025年新能源汽车充电网络互联互通政策研究报告
- 2024神木市国企招聘考试真题及答案
- DB34∕T 4230.1-2022 重点行业挥发性有机物治理环境管理技术规范 第1部分:通则
- 2025年湖北省初中毕业生学业考试语文试题卷附答案解析
- DB42∕T 640-2023 雷电防护装置检测原始记录表填写及报告书编制规范
- 2024年企业所得税年度纳税申报表(A类2017 年版2025年01月修订)-(2025 0323)
- 设备合伙购买合同协议
评论
0/150
提交评论