Home - skiping1982/AI GitHub Wiki

Welcome to the AI wiki!


[Turning Test]

  • 自然语言处理
  • 知识表示
  • 自动推理
  • 机器学习
  • 计算机视觉
  • 机器人技术

[相关学科]

  • 认知科学: 一种精确而且可以检验的人类思维工作方式理论
  • 逻辑学: 正确地思考
  • 数学: 不确定分析,概率论
  • 经济学:最大收益,决策,宏观,微观(博弈),运筹学(马尔可夫决策过程)
  • 神经科学: 处理信息,摩尔定律,爆发年份,技术支持
  • 心理学
  • 计算机工程学(摩尔定律,分子工程)
  • 控制论
  • 语言学

先验知识 vs 预测

PEAS(Performance, Environment, Actuators, Sensor) Environment

  • 可观察性
  • 确定性与随机性
  • 片段式与延续式
  • 静态与动态环境
  • 离散时间段和连续时间段换件
  • 单智能体和多智能体互动

Agent:

  • 简单发射型智能体
  • 基于模型的反射型智能体
  • 基于目标的智能体(planning agent)
  • 基于效用的智能体

NP 完全性

基于目标的智能体

  • Goal Formulation
  1. Agent的初始状态
  2. Agent的可能行动
  3. 每个行动的可能描述(转移模型,后继状态)、

初始状态,行动和转移模型定义了问题的状态空间(有向网络或者图)

  1. 目标测试: 确定给定的状态是不是目标状态
  2. 路径消耗(加权)用于基于目标的Agent进行性能度量

抽象:在解决问题的过程中去除细节(不影响结果)

  • 性能考量
  • 搜索(查找行动序列)

开环系统(控制论)执行中无反馈 增量形式化 VS 完整状态形式化: 转化问题思路来降低预估复杂度 性能评价指标:b,分支因子(任何节点的最多后继数)d,目标节点所在的最浅的深度(根节点到目标状态的步数) m,状态空间中任何路径的最大长度

无信息搜索 VS 有信息搜索(启发式搜索)

无信息搜索

  • 宽度优先搜索

一致性搜索(最小代价)

  • 深度优先搜索 (空间复杂度优于时间复杂度表现)

回溯搜索(每次只产生一个后继同时扩展节点记住下一个待生成节点) 深度受限搜索(超过深度为L的节点当做没有后继对待)

有信息搜索

  • 贪婪最佳搜索(greedy best-first search)
  • A* 搜索

f(n)=g(n)+h(n) where g(n) cost of being here, h(n) cost from here to target 启发函数:评估行动结果与目标状态的距离

对抗搜索(博弈)

约束条件搜索

  • 约束满足条件的状态是变量/值对的集合。(CSP)
  • 回溯搜索

基于知识的Agent