已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大綱 代理人和環境理性PEAS Performancemeasure Environment Acturators Sensors 環境類別代理人類別 代理人 定義 任何的東西 可以經由感應器感受到環境 經由行動器來對環境做出反應 人類代理人 眼睛 耳朵 其他的器官 可以來作為感應的 手 腳 其他的器官 可以來作為行動器官的 機器代理人 攝影機 溫度計 可以來作為感應的 機器手臂 輪子 可以來作為行動器官的 理性代理人 代理人的架構 代理人的功能和程式 代理人是以代理人功能 agentfunction 為其特徵的 此function將感知轉換為行動一個代理人的功能是理性的 rational 目標 找出一個方法來將理性代理人的功能正確的實作出來 代理人和環境 代理人函數將感知到的歷史對應到行動 F P A代理人程式執行在實際的設備中以產生F帶 查表代理人 缺點 巨大的表格建表所要花的時間需要很大沒有自動化甚至若是需要學習 也要花很多時間來看表格 智慧代理人的結構 代理人 硬體結構 程式代理人程式 將函數 感知 行動實做出來 硬體結構 一個設備能夠執行代理人程式的 代理人型態 基本的型態 簡單反射的代理人模型基礎的反射代理人目標基礎的代理人效能基礎的代理人學習代理人 反射代理人 反射代理人 沒有記憶動作 根據目前的狀態來決定要採取的行動 反射代理人 反射代理人 反射代理人 例如 吸塵器自動駕駛計程車問題 人類的所作的動作是基於學習後的反應或是自然的反射動作 反射代理人 反射代理人的動作雖然很簡單 但是彼此間的互相的反應會造成複雜的模型 好處 快速 健全挑戰 夠複雜 智慧 反射代理人 問題 將自動吸塵器的位置感應器移除後 會發生什麼 在不同的環境中 模型基礎的反射代理人 紀錄一些內部狀態 已過已經發生的 或之前所採取的行動 需要紀錄兩種的知識在代理人的實作方法 在這世界中發生的事 和代理人是有間接相關的代理人所採取的行動會對世界造成怎樣的影響 模型基礎的反射代理人 模型基礎的反射代理人 目標基礎的代理人 代理人需要有一些目標排序的資訊 例如 自動駕駛計程車 如何使得長期目標能達到 小目標的做法的選擇 目標基礎的代理人 目標基礎的代理人 挑戰 是否夠好了 效能基礎代理人 目標基礎代理人不夠好 因為其無法產生出高品質的行為 例如 自動駕駛計程車 除了要達到目的地外 還要考慮什麼因素 目標基礎代理人使用了2分法來作判斷 效能基礎代理人 效能基礎代理人將一個狀態對應到真實的數字 來代表該目標能被滿足的程度 效能基礎代理人 學習代理人 四種組成元素 評論者學習元素表現元素問題產生器 學習代理人 行動代理人 行動代理人是一種程式 能從一個機器上移植到另一個機器上 可以在跨平台的環境上執行 例如 JAVA需要有代理人能夠執行的環境 行動代理人 好處 減少溝通的花費非同步的計算 行動代理人 兩種類型 單點行動代理人 從一地移植到另一地 多點行動代理人 在網路上的漫遊 行動代理人 應用 分散式資料擷取Voip 行動代理人 PEAS PEAS Performancemeasure 表現評量 Environment 環境 Actuators 行動器 Sensors 接收器 例如 考慮taxidriver PerformancemeasureEnvironmentActuatorsSensors PEAS Consider e g thetaskofdesigninganautomatedtaxidriver Performancemeasure Safe fast legal comfortabletrip maximizeprofitsEnvironment Roads othertraffic pedestrians customersActuators Steeringwheel accelerator brake signal hornSensors Cameras sonar speedometer GPS odometer enginesensors keyboard PEAS Agent MedicaldiagnosissystemPerformancemeasure Healthypatient minimizecosts lawsuitsEnvironment Patient hospital staffActuators Screendisplay questions tests diagnoses treatments referrals Sensors Keyboard entryofsymptoms findings patient sanswers PEAS Agent Part pickingrobotPerformancemeasure PercentageofpartsincorrectbinsEnvironment Conveyorbeltwithparts binsActuators JointedarmandhandSensors Camera jointanglesensors PEAS Agent InteractiveEnglishtutorPerformancemeasure Maximizestudent sscoreontestEnvironment SetofstudentsActuators Screendisplay exercises suggestions corrections Sensors Keyboard Environmenttypes 全域觀察 Fullyobservable vs partiallyobservable 一個agent的接收器是否可以一次就可以看完所有的環境狀態 可決定的 Deterministic vs stochastic 環境的下一個狀態完全是根據於目前的狀態以及目前所採取的行動 不會受到其他agent的影響 片段的 Episodic vs sequential 一個agent的經驗可以被分成多個片段 而agent要做決定時 只需要根據根據這個片裡的感知來做就好了 Environmenttypes 靜態的 Static vs dynamic 當一個agent在思考說下一步要如何做的時候 環境在此時是不會改變的 離散的 Discrete vs continuous 有限數目的不同 清楚的感知和行動 單一代理人 Singleagent vs multiagent Environmenttypes ChesswithChesswithoutTaxidrivingaclockaclockFullyobservableYesYesNoDeterministicStrategicStrategicNoEpisodicNoNoNoStaticSemiYesNoDiscreteYesYesNoSingleagent
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家庭医生签约服务与分级诊疗融合探索
- 客服主管管理能力与沟通技巧培训手册
- (完整版)苏教六年级下册期末数学模拟测试试题
- (完整版)苏教六年级下册期末数学试题(比较难)及解析
- 密码安全专员安全基线配置指南
- 安康企业面试常见问题深度剖析与应对策略
- 2025年证券中心面试题及答案
- 成都货运面试必-备知识岗位选择与面试技巧解析
- 2025铁路上海12306旅客服务中心客户服务实习生招聘笔试历年参考题库附带答案详解
- 2025贵州仟山农林开发(集团)有限公司招聘工作人员笔试考试笔试历年参考题库附带答案详解
- 胃肠镜临床小讲课
- 市场调研委托书模板及实例
- 2022豪沃尔消防HDM3200消防电话使用说明书
- 高铁施工管理方案
- 环网柜培训课件
- 国开电大《建筑制图基础》形考任务1-4
- 统编版六年级语文上册《成语辨析与应用》专项测试卷(附带答案)
- 公共危机管理理论与实务
- 高三英语一轮复习语法填空课件
- 正品承诺保证书范本
- 医院劳务外包服务方案(技术方案)
评论
0/150
提交评论