构建领域知识图谱知识要点 - bettermorn/KGCourse GitHub Wiki

1 知识图谱概述

  • •知识图谱的本质是什么?其解决了什么问题?
  • •知识图谱为什么要分为模式层和数据层?
  • •构建知识图谱的过程中,你认为哪一部分最有挑战?
  • •构建知识图谱需要哪些技术?你认为哪个最难?
  • •目前我们接触过哪些基于知识图谱的应用呢?
  • •OpenKG的知识图谱对你有什么启发?
  • •知识图谱2019白皮书对你有什么启发?
  • •如果想做你所在行业的知识图谱,你认为最大的难点在哪里?

2 知识表示与知识建模

  • •知识为什么包括了事实、规则和概念?
  • •基于知识的分类,你认为哪些类别的知识易于做出知识图谱?
  • •在你的工作领域里,是否有程序型知识、因果型知识、条件型知识、关系型知识、实务型知识,是否有做成知识图谱的必要?
  • •在选择知识表示时,哪个因素对你来说最重要?
  • •如何理解基于离散符号的知识表示?
  • •如何理解基于连续向量的知识表示?
  • •框架不能表示哪些知识?
  • •一阶谓词逻辑可以用来表示哪些知识?
  • •理解知识建模方法学有哪些难点?
  • •理解本体论遇到哪些难题?
  • •理解知识建模方法学有哪些难点?
  • •理解本体论遇到哪些难题?
  • •理解斯坦福大学的7步骨架法有什么问题?
  • •RDF、RDFS如何支持推理的?存在的问题是?
  • •OWL2 QL EL词汇有哪些?
  • •如何用SPARQL语言、JSON-LD、RDFa、 HTML5 Microdata ?
  • •当做知识表示时,如何建立自己的模式层和数据层?
  • •词向量可以用来解决什么问题?
  • •知识图谱嵌入模型TransE是如何的?
  • •知识图谱嵌入可以解决哪些问题?

3 知识存储

  • •回忆图论的一些概念,节点、边、RDF图和属性图
  • •RDF图的缺点是?
  • •回顾属性图的一个例子,工作中如何应用?
  • •使用SPARQL语言
  • •Neo4J的Cypher语言,有哪些优点和缺点?
  • •TinkerPop的Gremlin语言,优点和缺点是怎样的?
  • •有哪些存储方法?
  • •如何应用基于关系数据库的存储方法?
  • •如何使用面向RDF的三元组数据库?
  • •何时使用原生图数据库?
  • •比较图数据库,如何根据自己需要选择图数据库?
  • •回忆图数据库的关键技术:无索引链接Index Free Adjacency
  • •哪些数据库应用了属性数据索引?
  • •图结构索引方法是怎样的?
  • •Jena数据库的优点和缺点是什么?使用中有什么问题?

4 知识抽取与知识挖掘

  • •抽取怎样的知识?
  • •知识抽取的5大基本任务
  • •知识抽取的方法
  • •结构化数据的知识抽取方法:直接映射、R2RML
  • •半结构化数据的知识抽取方法:手工、包装器和自动抽取
  • •非结构化数据的知识抽取方法:
  • •实体抽取:规则和统计、深度学习;
  • •关系抽取:模板、监督、弱监督;
  • •事件抽取:流水线、联合抽取
  • •内容挖掘:实体链接
  • •结构挖掘:规则挖掘
  • •表示学习:TransE、PRA

5 知识融合

  • •知识融合面临哪些问题?本体异构、共指问题是什么?
  • •在你想做的行业领域知识中,产生知识异构的原因主要是?
  • •语言层不匹配:你需要面对哪些问题?
  • •模型层不匹配:你需要解决哪些问题?
  • •知识融合的流程里,哪些方法更有意义
  • •本体概念层有哪些融合方法?概念映射和关系映射分别适合哪些概念和关系?
  • •实例匹配一般有哪些方法?哪些方法适合在你的领域知识里使用?
  • •LIMES框架的核心是怎样的?
  • •使用LIMES的过程中有哪些问题?

6 知识推理

  • •逻辑推理有哪些类别?在你工作的领域里,哪种方法运用得较多?
  • •知识图谱的推理包括哪些任务?
  • •实体对齐
  • •关系对齐或者属性对齐
  • •基于演绎的方法有哪些?
  • •产生式规则系统和基于规则的学习有哪些区别?
  • •基于逻辑编程的推理方法有哪些?
  • •产生式系统应用于哪些领域?
  • •产生式系统执行的流程是怎样的?
  • •产生式系统:Drools和Jena的使用中有哪些问题?
  • •基于归纳的推理有哪些方法?如何评估方法的有效性?路径排序设计、关联规则挖掘
  • •知识推理有哪些新技术?时序预测、基于强化学习、元学习、图神经网络(链接预测实体分类)
  • •基于分布式表示的推理有哪些类型和方法?

7 语义搜索

  • •语义搜索是指什么?数学、含义、关联、清晰的理解方式
  • •语义搜索存在哪些难点?
  • •语义搜索的过程和语义搜索系统的框架是怎样的?
  • •语义搜索系统的查询语言有哪些?
  • •语义搜索有哪些关键技术?
  • •语义搜索的搜索方式有哪些?
  • •基于表示学习的搜索方法有哪些?存在哪些挑战?
  • •案例中利用了哪些搜索方法?(关键词搜索)

8 知识问答

  • •知识问答有哪些作用?
  • •知识问答的基本要素是什么?
  • •知识问答的发展过程是怎样的?
  • •知识问答系统的流程是怎样的?
  • •知识问答系统有哪些分类?(分布式表示问答)
  • •知识问答系统的功能指标有哪些?
  • •知识问答系统的性能指标有哪些?
  • •IRQA的架构是?
  • •KBQA的步骤是?
  • •KBQA面临哪些调整?
  • •KBQA的基本方法有哪些?模板、语义解析、深度学习、表示学习

9 构建领域知识图谱

  • •构建领域知识图谱的流程是怎样的?
  • •领域知识图谱有哪些应用?
  • •如何综合应用先进的人工智能技术?
  • •存在哪些难点?
  • •如何解决挑战性问题?