




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大綱 代理人和環境理性PEAS Performancemeasure Environment Acturators Sensors 環境類別代理人類別 代理人 定義 任何的東西 可以經由感應器感受到環境 經由行動器來對環境做出反應 人類代理人 眼睛 耳朵 其他的器官 可以來作為感應的 手 腳 其他的器官 可以來作為行動器官的 機器代理人 攝影機 溫度計 可以來作為感應的 機器手臂 輪子 可以來作為行動器官的 理性代理人 代理人的架構 代理人的功能和程式 代理人是以代理人功能 agentfunction 為其特徵的 此function將感知轉換為行動一個代理人的功能是理性的 rational 目標 找出一個方法來將理性代理人的功能正確的實作出來 代理人和環境 代理人函數將感知到的歷史對應到行動 F P A代理人程式執行在實際的設備中以產生F帶 查表代理人 缺點 巨大的表格建表所要花的時間需要很大沒有自動化甚至若是需要學習 也要花很多時間來看表格 智慧代理人的結構 代理人 硬體結構 程式代理人程式 將函數 感知 行動實做出來 硬體結構 一個設備能夠執行代理人程式的 代理人型態 基本的型態 簡單反射的代理人模型基礎的反射代理人目標基礎的代理人效能基礎的代理人學習代理人 反射代理人 反射代理人 沒有記憶動作 根據目前的狀態來決定要採取的行動 反射代理人 反射代理人 反射代理人 例如 吸塵器自動駕駛計程車問題 人類的所作的動作是基於學習後的反應或是自然的反射動作 反射代理人 反射代理人的動作雖然很簡單 但是彼此間的互相的反應會造成複雜的模型 好處 快速 健全挑戰 夠複雜 智慧 反射代理人 問題 將自動吸塵器的位置感應器移除後 會發生什麼 在不同的環境中 模型基礎的反射代理人 紀錄一些內部狀態 已過已經發生的 或之前所採取的行動 需要紀錄兩種的知識在代理人的實作方法 在這世界中發生的事 和代理人是有間接相關的代理人所採取的行動會對世界造成怎樣的影響 模型基礎的反射代理人 模型基礎的反射代理人 目標基礎的代理人 代理人需要有一些目標排序的資訊 例如 自動駕駛計程車 如何使得長期目標能達到 小目標的做法的選擇 目標基礎的代理人 目標基礎的代理人 挑戰 是否夠好了 效能基礎代理人 目標基礎代理人不夠好 因為其無法產生出高品質的行為 例如 自動駕駛計程車 除了要達到目的地外 還要考慮什麼因素 目標基礎代理人使用了2分法來作判斷 效能基礎代理人 效能基礎代理人將一個狀態對應到真實的數字 來代表該目標能被滿足的程度 效能基礎代理人 學習代理人 四種組成元素 評論者學習元素表現元素問題產生器 學習代理人 行動代理人 行動代理人是一種程式 能從一個機器上移植到另一個機器上 可以在跨平台的環境上執行 例如 JAVA需要有代理人能夠執行的環境 行動代理人 好處 減少溝通的花費非同步的計算 行動代理人 兩種類型 單點行動代理人 從一地移植到另一地 多點行動代理人 在網路上的漫遊 行動代理人 應用 分散式資料擷取Voip 行動代理人 PEAS PEAS Performancemeasure 表現評量 Environment 環境 Actuators 行動器 Sensors 接收器 例如 考慮taxidriver PerformancemeasureEnvironmentActuatorsSensors PEAS Consider e g thetaskofdesigninganautomatedtaxidriver Performancemeasure Safe fast legal comfortabletrip maximizeprofitsEnvironment Roads othertraffic pedestrians customersActuators Steeringwheel accelerator brake signal hornSensors Cameras sonar speedometer GPS odometer enginesensors keyboard PEAS Agent MedicaldiagnosissystemPerformancemeasure Healthypatient minimizecosts lawsuitsEnvironment Patient hospital staffActuators Screendisplay questions tests diagnoses treatments referrals Sensors Keyboard entryofsymptoms findings patient sanswers PEAS Agent Part pickingrobotPerformancemeasure PercentageofpartsincorrectbinsEnvironment Conveyorbeltwithparts binsActuators JointedarmandhandSensors Camera jointanglesensors PEAS Agent InteractiveEnglishtutorPerformancemeasure Maximizestudent sscoreontestEnvironment SetofstudentsActuators Screendisplay exercises suggestions corrections Sensors Keyboard Environmenttypes 全域觀察 Fullyobservable vs partiallyobservable 一個agent的接收器是否可以一次就可以看完所有的環境狀態 可決定的 Deterministic vs stochastic 環境的下一個狀態完全是根據於目前的狀態以及目前所採取的行動 不會受到其他agent的影響 片段的 Episodic vs sequential 一個agent的經驗可以被分成多個片段 而agent要做決定時 只需要根據根據這個片裡的感知來做就好了 Environmenttypes 靜態的 Static vs dynamic 當一個agent在思考說下一步要如何做的時候 環境在此時是不會改變的 離散的 Discrete vs continuous 有限數目的不同 清楚的感知和行動 單一代理人 Singleagent vs multiagent Environmenttypes ChesswithChesswithoutTaxidrivingaclockaclockFullyobservableYesYesNoDeterministicStrategicStrategicNoEpisodicNoNoNoStaticSemiYesNoDiscreteYesYesNoSingleagent
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 室内设计量房标准流程
- 医护联动:沟通与协作
- Acid-PEG4-NHS-ester-生命科学试剂-MCE
- 2025年人工智能法律政策图景研究报告
- 新能源汽车充电设施布局优化与2025年运营效率提升风险控制策略
- 智能家居系统互联互通标准下的智能家居行业市场细分及竞争格局报告
- 2025年医药行业CRO模式下的临床试验数据监查员培训与认证报告
- 纺织服装制造业智能化生产智能化生产设备技术升级项目报告
- 教育游戏化在虚拟现实教育中的应用与教学创新报告
- 2025年土壤污染修复技术产业现状与发展趋势研究报告
- GB∕T 31062-2014 聚合物多元醇
- 氧、氩、二氧化碳气体充装企业风险点分级管控资料
- 公路水运工程施工安全标准化指南(42页)
- 人教版 2021-2022学年 五年级下册数学期末测试试卷(一)含答案
- 锡槽缺陷手册(上
- 西门子SAMA图DEH逻辑讲解
- 管道支架重量计算表常用图文精
- 国家开放大学《土木工程力学(本)》形考作业1-5参考答案
- 公司尽职调查提纲
- 运梁车(炮车)安全操作规程.doc
- API-685-中文_
评论
0/150
提交评论