构建领域知识图谱知识要点 - bettermorn/KGCourse GitHub Wiki
1 知识图谱概述
- •知识图谱的本质是什么?其解决了什么问题?
- •知识图谱为什么要分为模式层和数据层?
- •构建知识图谱的过程中,你认为哪一部分最有挑战?
- •构建知识图谱需要哪些技术?你认为哪个最难?
- •目前我们接触过哪些基于知识图谱的应用呢?
- •OpenKG的知识图谱对你有什么启发?
- •知识图谱2019白皮书对你有什么启发?
- •如果想做你所在行业的知识图谱,你认为最大的难点在哪里?
2 知识表示与知识建模
- •知识为什么包括了事实、规则和概念?
- •基于知识的分类,你认为哪些类别的知识易于做出知识图谱?
- •在你的工作领域里,是否有程序型知识、因果型知识、条件型知识、关系型知识、实务型知识,是否有做成知识图谱的必要?
- •在选择知识表示时,哪个因素对你来说最重要?
- •如何理解基于离散符号的知识表示?
- •如何理解基于连续向量的知识表示?
- •框架不能表示哪些知识?
- •一阶谓词逻辑可以用来表示哪些知识?
- •理解知识建模方法学有哪些难点?
- •理解本体论遇到哪些难题?
- •理解知识建模方法学有哪些难点?
- •理解本体论遇到哪些难题?
- •理解斯坦福大学的7步骨架法有什么问题?
- •RDF、RDFS如何支持推理的?存在的问题是?
- •OWL2 QL EL词汇有哪些?
- •如何用SPARQL语言、JSON-LD、RDFa、 HTML5 Microdata ?
- •当做知识表示时,如何建立自己的模式层和数据层?
- •词向量可以用来解决什么问题?
- •知识图谱嵌入模型TransE是如何的?
- •知识图谱嵌入可以解决哪些问题?
3 知识存储
- •回忆图论的一些概念,节点、边、RDF图和属性图
- •RDF图的缺点是?
- •回顾属性图的一个例子,工作中如何应用?
- •使用SPARQL语言
- •Neo4J的Cypher语言,有哪些优点和缺点?
- •TinkerPop的Gremlin语言,优点和缺点是怎样的?
- •有哪些存储方法?
- •如何应用基于关系数据库的存储方法?
- •如何使用面向RDF的三元组数据库?
- •何时使用原生图数据库?
- •比较图数据库,如何根据自己需要选择图数据库?
- •回忆图数据库的关键技术:无索引链接Index Free Adjacency
- •哪些数据库应用了属性数据索引?
- •图结构索引方法是怎样的?
- •Jena数据库的优点和缺点是什么?使用中有什么问题?
4 知识抽取与知识挖掘
- •抽取怎样的知识?
- •知识抽取的5大基本任务
- •知识抽取的方法
- •结构化数据的知识抽取方法:直接映射、R2RML
- •半结构化数据的知识抽取方法:手工、包装器和自动抽取
- •非结构化数据的知识抽取方法:
- •实体抽取:规则和统计、深度学习;
- •关系抽取:模板、监督、弱监督;
- •事件抽取:流水线、联合抽取
- •内容挖掘:实体链接
- •结构挖掘:规则挖掘
- •表示学习:TransE、PRA
5 知识融合
- •知识融合面临哪些问题?本体异构、共指问题是什么?
- •在你想做的行业领域知识中,产生知识异构的原因主要是?
- •语言层不匹配:你需要面对哪些问题?
- •模型层不匹配:你需要解决哪些问题?
- •知识融合的流程里,哪些方法更有意义
- •本体概念层有哪些融合方法?概念映射和关系映射分别适合哪些概念和关系?
- •实例匹配一般有哪些方法?哪些方法适合在你的领域知识里使用?
- •LIMES框架的核心是怎样的?
- •使用LIMES的过程中有哪些问题?
6 知识推理
- •逻辑推理有哪些类别?在你工作的领域里,哪种方法运用得较多?
- •知识图谱的推理包括哪些任务?
- •实体对齐
- •关系对齐或者属性对齐
- •基于演绎的方法有哪些?
- •产生式规则系统和基于规则的学习有哪些区别?
- •基于逻辑编程的推理方法有哪些?
- •产生式系统应用于哪些领域?
- •产生式系统执行的流程是怎样的?
- •产生式系统:Drools和Jena的使用中有哪些问题?
- •基于归纳的推理有哪些方法?如何评估方法的有效性?路径排序设计、关联规则挖掘
- •知识推理有哪些新技术?时序预测、基于强化学习、元学习、图神经网络(链接预测实体分类)
- •基于分布式表示的推理有哪些类型和方法?
7 语义搜索
- •语义搜索是指什么?数学、含义、关联、清晰的理解方式
- •语义搜索存在哪些难点?
- •语义搜索的过程和语义搜索系统的框架是怎样的?
- •语义搜索系统的查询语言有哪些?
- •语义搜索有哪些关键技术?
- •语义搜索的搜索方式有哪些?
- •基于表示学习的搜索方法有哪些?存在哪些挑战?
- •案例中利用了哪些搜索方法?(关键词搜索)
8 知识问答
- •知识问答有哪些作用?
- •知识问答的基本要素是什么?
- •知识问答的发展过程是怎样的?
- •知识问答系统的流程是怎样的?
- •知识问答系统有哪些分类?(分布式表示问答)
- •知识问答系统的功能指标有哪些?
- •知识问答系统的性能指标有哪些?
- •IRQA的架构是?
- •KBQA的步骤是?
- •KBQA面临哪些调整?
- •KBQA的基本方法有哪些?模板、语义解析、深度学习、表示学习
9 构建领域知识图谱
- •构建领域知识图谱的流程是怎样的?
- •领域知识图谱有哪些应用?
- •如何综合应用先进的人工智能技术?
- •存在哪些难点?
- •如何解决挑战性问题?