训练用于数据处理的大语言模型_第1页
训练用于数据处理的大语言模型_第2页
训练用于数据处理的大语言模型_第3页
训练用于数据处理的大语言模型_第4页
训练用于数据处理的大语言模型_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

训练用于数据处理的大语言模型

曹顺教授

美国马里兰大学提示工程:(学生不参加模拟考试,而是为新考试做笔记)——参数无变化(硬)提示词调优:人工设计的自然语言,人类可理解的提示词;对提示词的选择敏感(软)提示词调优LM-BFF:提示词调优+演示+模板生成P调优:微调输入(提示词)嵌入通过软提示词提高性能模型微调(学生参加多次模拟考试,变得更加熟练,并且参加新考试)——参数变化前缀调优:仅优化前缀嵌入缩短训练时间,提高空间效率,适用于所有模型,但需要大量训练样本微调整体模型——成本高昂,但能产生最佳效果。指令调优:人工引导的强化学习如何训练大语言模型(软)提示词调优

前缀调优思路:仅优化前缀嵌入性能和实施成本之间的权衡4参数高效微调LoRA为有限数量的参数微调LLaMA

https:///unslothai/unsloth/tree/main#installation-instructions(参见大语言模型识别气候初创公司:“生物多样性创业”)GPT3.5微调API(黑匣子,不知道权重)微调整体模型重新执行整个训练过程,以便调整大部分参数除非你拥有与GPT相当的大量训练样本,否则想都别想。输入:

(a)公司电话会议记录

(b)问题输出:带注释的答案要做到这一点,你需要数百万个带注释的答案来监督参数的变化。这可能意味着高昂的计算成本。调整开源大语言模型的参数提示工程:(学生不参加模拟考试,而是为新考试做笔记)——参数无变化需要高智能大语言模型才能有效发挥作用;否则,将无法有效运作——学生知识渊博,因此笔记可以提供帮助简单,对编码专业知识的要求最低。参数微调:部分vs.全部微调(学生参加多次模拟考试,变得更加熟练,并且参加新考试)——参数变化需要大量带注释的样本需要大量计算能力隐私问题:在处理医疗记录等敏感数据时,使用GPT等非开源大语言模型并非选项。相反,你必须调整自己的LLaMA模型,以便保持控制和隐私。对于非开源大语言模型,无法访问其参数,因此你无法自行构建大语言模型。应该选择哪一个:提示工程还是参数微调如何训练思维链(CoT)提示工程制作提示词,指导语言模型通过一步一步的推理过程得出答案。对于答案取决于中间步骤或推理的复杂问题十分有用。创建思维链对领域知识要求较高目标:从“Item1.Business”部分提取产品相关信息,并将其转换为结构化数据集输入:2024年度10-K档案的3个文本文件:微软、Alphabet、Meta输出:包含这三家公司的产品描述和产品数量的Excel文件。任务1:从10-K中提取产品描述第1步:提取产品描述现在试试上传文件:

2024年度10-K档案的3个文本文件:微软、Alphabet、Meta第1步:提取产品描述上传文件:2024年度10-K档案的3个文本文件:微软、Alphabet、Meta使用ChatGPT-4o时:每家公司仅输出4-5个产品第1步:提取产品描述上传文件:2024年度10-K档案的3个文本文件:微软、Alphabet、Meta使用ChatGPT-4.1迷你版时:每家公司输出8-11个产品第1步:提取产品描述问题:为什么ChatGPT-4o只为每家公司识别出4-5个产品,而ChatGPT-4.1迷你版(更低级别的模型)却可以为每家公司识别出8-11个产品?第1步:提取产品描述第1步:提取产品描述问题:

解决方案是什么?第1步:提取产品描述所以我们调整了提示词:在识别过程中遵循以下规则:将每个命名的产品或服务视为一个单独条目,即使其隶属于某个更大的套件。避免重复:如果一个产品被多次提及,将其合并成一个描述最完整的条目。包括面向消费者和企业的产品/服务,如实物商品、数字平台、移动应用程序、云服务、设备和品牌技术。如果该项目是一个命名的业务线或垂直产品,并且相应描述,则将其视为一个产品。除非给出产品名称,否则排除“我们的平台”或“我们的服务”等模糊短语。如果多个命名产品一起列出(例如在逗号分隔的列表中),即使没有提供单独描述,也要将每个产品视为单独的产品条目。如果可能,根据一般公共知识和语境提供简短的推断描述。第1步:提取产品描述使用新提示词再次运行:现在试试上传文件:2024年度10-K档案的3个文本文件:微软、Alphabet、Meta第1步:输出……使用ChatGPT-4o,为每家公司输出10-17个产品第2步:计算每家公司的产品数量现在试试上传文件:Task1_Step1.3.xlsx上传文件:Task1_Step1.3.xlsx第2步:输出目标:使用大语言模型匹配关键词,识别哪些产品与人工智能相关输入:1)Task1_Step1.3(来自任务1)——产品信息2)ai_keywords.xlsx(包含人工智能相关单词列表)输出:

显示每家公司人工智能相关产品数量和百分比的Excel文件。任务2:使用大语言模型识别人工智能相关产品第1步:生成关键词列表现在试试第1步:生成关键词列表首轮输出:次轮输出:1.为什么两轮之间生成的关键词不一致?2.如何解决这个问题?第1步:生成关键词列表第1步:生成关键词列表使用新提示词再次运行:现在试试第1步:输出使用新提示词再次运行:首轮输出:次轮输出:使用新提示词,两次单独运行产生了相同的人工智能关键词列表。词法化将单词转换为基本/词根形式,以便统一变体。例如:“produces”→“produce”

“went”→“go”词频计数例如:ThecompanydevelopedanewAIsystemandisnowdevelopingadditionalfeaturestofurtherdevelopitscapabilities.Frequencyof“develop”:3Python工具:NLTK提供结构化工具,对文本中的关键词进行标记、词法化和计算。功能:标记化、词法化、频率分布、……传统关键词搜索:Python第1次第2次第3次第2步:使用大语言模型进行关键词匹配现在试试上传文件:Task1_Step1.3.xlsxTask2_Step1.xlsx第2步:输出上传文件:Task1_Step1.3.xlsxTask2_Step1.xlsx第3步:人工智能产品统计现在试试上传文件:Task2_Step2.xlsx

第3步:输出上传文件:Task2_Step2.xlsx

第4步:使用大语言模型进行人工智能产品分类(无需关键词)现在试试上传文件:

Task1_Step1.3.xlsx

第4步:输出上传文件:

Task1_Step1.3.xlsx

大量误判第4步:使用大语言模型进行人工智能产品分类(无需关键词)问题:为什么当GPT试图决定一个产品是否与人工智能相关时,会出现如此多的误判?问题:

解决方案是什么?第4步:使用大语言模型进行人工智能产品分类(无需关键词)第4步:使用大语言模型进行人工智能产品分类(无需关键词)解决方案请使用定制版本的GPT(或清除之前的内存)。添加提示词指令,以便稳定GPT的输出。请确保选中这个选项,否则GPT将无法分析该文件。第4步:使用大语言模型进行人工智能产品分类(无需关键词)现在试试上传文件:

Task1_Step1.3.xlsx

请在定制GPT中重试第4步:输出上传文件:

Task1_Step1.3.xlsx

更加准确稳定的判断……第5步:输出结果对比现在试试上传文件:

Task2_Step2.xlsx

Task2_Step4.2.xlsx

第5步:输出上传文件:

Task2_Step2.xlsx

Task2_Step4.2.xlsx

目标:将简历转换为岗位级别的数据,并将岗位分类为与人工智能相关或无关。示例:输入:

包含个人级别领英简历的Excel文件输出:公司-年度级别的Excel摘要,显示每年每家公司的岗位总数、人工智能岗位数以及人工智能人才的百分比。任务3:从领英简历中识别人工智能人才第1步:将个人级别的简历转换为岗位级别的观测值现在试试上传文件:

LinkedIn_CV.xlsx第1步:输出上传文件:

LinkedIn_CV.xlsx第2步:将每个岗位分类为人工智能相关或无关现在试试上传文件:

Task3_Step1.xlsx第2步:输出上传文件:

Task3_Step1.xlsx……第3步:汇总至公司-年度级别现在试试上传文件:

Task3_Step2.xlsx第3步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论