Home - skiping1982/AI GitHub Wiki
Welcome to the AI wiki!
[Turning Test]
- 自然语言处理
- 知识表示
- 自动推理
- 机器学习
- 计算机视觉
- 机器人技术
[相关学科]
- 认知科学: 一种精确而且可以检验的人类思维工作方式理论
- 逻辑学: 正确地思考
- 数学: 不确定分析,概率论
- 经济学:最大收益,决策,宏观,微观(博弈),运筹学(马尔可夫决策过程)
- 神经科学: 处理信息,摩尔定律,爆发年份,技术支持
- 心理学
- 计算机工程学(摩尔定律,分子工程)
- 控制论
- 语言学
先验知识 vs 预测
PEAS(Performance, Environment, Actuators, Sensor) Environment
- 可观察性
- 确定性与随机性
- 片段式与延续式
- 静态与动态环境
- 离散时间段和连续时间段换件
- 单智能体和多智能体互动
Agent:
- 简单发射型智能体
- 基于模型的反射型智能体
- 基于目标的智能体(planning agent)
- 基于效用的智能体
NP 完全性
基于目标的智能体
- Goal Formulation
- Agent的初始状态
- Agent的可能行动
- 每个行动的可能描述(转移模型,后继状态)、
初始状态,行动和转移模型定义了问题的状态空间(有向网络或者图)
- 目标测试: 确定给定的状态是不是目标状态
- 路径消耗(加权)用于基于目标的Agent进行性能度量
抽象:在解决问题的过程中去除细节(不影响结果)
- 性能考量
- 搜索(查找行动序列)
开环系统(控制论)执行中无反馈 增量形式化 VS 完整状态形式化: 转化问题思路来降低预估复杂度 性能评价指标:b,分支因子(任何节点的最多后继数)d,目标节点所在的最浅的深度(根节点到目标状态的步数) m,状态空间中任何路径的最大长度
无信息搜索 VS 有信息搜索(启发式搜索)
无信息搜索
- 宽度优先搜索
一致性搜索(最小代价)
- 深度优先搜索 (空间复杂度优于时间复杂度表现)
回溯搜索(每次只产生一个后继同时扩展节点记住下一个待生成节点) 深度受限搜索(超过深度为L的节点当做没有后继对待)
有信息搜索
- 贪婪最佳搜索(greedy best-first search)
- A* 搜索
f(n)=g(n)+h(n) where g(n) cost of being here, h(n) cost from here to target 启发函数:评估行动结果与目标状态的距离
对抗搜索(博弈)
约束条件搜索
- 约束满足条件的状态是变量/值对的集合。(CSP)
- 回溯搜索