早期知识表示简介:
知识是智能的基础,提供推理能力。
相对正确性、不确定性、可表示性、可利用性。
常识性知识、领域性知识;
事实性知识、过程性知识、控制知识;
确定性知识、不确定性知识。
早期知识表示方法:
1、First-Order Logic
Horn逻辑:
原子:has_child(Helen,Jack)
Rules:has_child(X,Y):-has_son(X,Y)
Tbox:内涵知识、Abox:断言
2、Production Rule:
IF...THEN...
CF为知识的强度
3、Framework:
<框架名>
槽名:侧面名 值1,值2,...,值p1
........................
约束:约束条件1
.........
约束条件n
4、Semantic Network:
节点-弧-节点
用谓词逻辑表示
基于语义网Semantic Web得知识表示框架:
W3C推荐的语义网标准栈:
表示-查询-推理-置信
最主要的方面A web of link data:SPARQL、RDF
use RDF as data format
use URLs as names for things
use HTTP URLs so that people can look up those names
RDF:资源描述框架
Resource:页面、图片、视频等任何具有URL标识符
Description:属性、特征和资源之间的关系
Framework:模型、语言和这些描述的语法
在RDF中知识总是以三元组triple形式出现
(subject、predicate、object)
RDF本身也是一个图模型(vertex,edge,vertex)
in RDF resources and properties are identified by URLs
通过namespace减少前缀冗余进行URLs的缩写
in RDF values of properties can also be literals i.e. strings of characters:(CCF ADL,theme,"KG"),此时"KG"称之为字面值literal,其他为resource
in RDF literals values of properties can also be typed with XML datatypes
字符串+类型约束
在CCF ADL上演讲了三小时:
ex:ccf_adl——ex-schema:nbHours——"3"^^xsd:interger
RDF空白节点blank nodes:
匿名的资源,作为链接某一个非匿名的资源的桥梁
A是某一次知识图谱讲座的讲者:
ex:A——ex-schema:speaker——_:x——ex-schema:theme——ex:KG
二跳,可以表示更复杂的多元关系
RDF是数据模型,不是序列化格式。
可以用XML、Turtle、N-Triples等方式表示。
开放世界假设:没有定义的内容只代表不知道,而不是不存在。
分布式定义的知识可以自动合并。
带标注的RDF(变种)annotated RDF:
(s,p,o):标志
(特朗普,就职,总统):2017年1月
RDFS(schema):
在RDF的基础上提供了一个术语、概念等的定义方式,以及哪些属性可以应用到哪些对象上。
规范了概念层schema的内容。
为RDF定义了如下词汇:
class,subclassof,type,property,subpropertyof,domain,range
OWL和OWL2
Web Ontology Language
三个子语言:lite/DL/Full
exp是命名空间http://www.example.org的别称。
等价性声明:
exp:运动员 owl:equivalentCalss exp:体育选手
传递关系:
exp:ancestor rdf:type owl:TransitiveProperty
互反关系:
exp:ancestor owl:inverseOf exp:descendant
函数性属性(唯一性):
exp:hasMother rdf:type owl:FunctionalProperty
OWL2:OWL的新版本
SPARQL:
RDF的查询语言:基于RDF数据模型。
PREFIX: #声明
FROM #dataset(graph)
SELECT
WHERE{ ...... }
ORDER BY
RDF中的资源以?或者$表示变量
查询所有选秀CS328的学生:
PREFIX exp:http://www.example.org/
SELECT ?student
WHERE{
?student exp:studies exp:CS328.
}
查询所有的收购关系:
SELECT ?P ?X
WHERE{
?P finance:control ?c.
?c finance:acquire ?X.
}
ontology可以填充知识与查询之间的语义间隙。
把member和relative的语义间隙给填充了。
SELECT * WHERE{
?x member ?y.
?z founder ?y.
?z relative ?x.
}
写成规则的形式:
hold_share(X,Y):-control(X,Y)
conn_trans(Y,Z):-hold_share(X,Y),hold_share(X,Z)
JSON-LD:
JavaScript Object Notation for Linked Data
基于JSON表示和传输互联数据Linked Data的方法。
JSON-LD通过引入规范的术语表示,使得数据交换和机器理解成为基础
JSON中的:
{
"name":"tai_park"
}
变成JSON-LD中的:
{
"http://schema.org/name":"tai_park"
}
围绕某类知识提供共享的术语。
RDFa:
网页标记语言,扩展了XHTML的几个属性。
Wikinomics
HTML5 Microdata:
Andy
RDF+SPARQL 对比 ER+SQL:
RDF:关系显示定义(语义存在于数据中)——数据变更较为方便(图增加边更为方便)
ER:关系隐式声明(语义存在于人脑中)
ER+SQL:Dumb Data->Smart Application Code
RDF+SPARQL:Smart Data->Uniform Inference Engine
典型知识库项目的知识表示:
DBpedia:
dbo:有约束的定义
dbr:资源
dbp:没有约束而仅有数据层的定义
TAGO2:
上层->维基百科内容->lable用以实体消歧
Freebase:
data/schema/Queries
复合值类型CVT:处理多元关系。一个CVT就是一个有唯一MID的Object,也可以有多个Types。
Wikidata:
有顶层的对象:Entity
时空约束:qualifiers/reference
NELL:
文本抽取并用图整合
基于Protege本体工具的知识建模实践:
模式层/实例层