本文复杂引见运用 Freebas需求了解的根本术语和概念。留意,Freebas曾经被废弃的相关的知识库,但是现在的科研任务大部分基于此知识库。
Freebas数据被存储在一个叫做图的数据构造中。一个图由边连接的结点组成。Freebas中,结点使用 /type/object界说,边使用 /type/link界说。经过以图的方式存储数据,Freebas也可以疾速遍历主题(topic之间的恣意衔接,并简单轻松可以添加新的形式(schema而无需改动数据的构造。
Freebas有超过 3900万个有关真实的天下的实体,比如人、所在和事物。因为 Freebas数据由图表示,这些主题对应图中的结点。但是,不是每一结点都是主题。CVT就是这样的一个例子,不是主题但是结点。
有关 Freebas主题不同类型的例子:
- 物理实体,比如 BobDylan,theLouvrMuseum,theSaturnplanet
- 艺术/媒体产物,比如 TheDarkKnightfilm,HotelCaliforniasong
- 分类,比如 noblgas,Chordate
- 笼统观点,比如 love
- 头脑门户或艺术运动,比如 Impressionism
有些主题之所以明显,由于它包括了许多数据(如,沃尔玛)有些主题之所以明显,由于它与很多其他主题有联系,能够是差别范畴的相关信息。比如,恋爱、贫困、侠义等笼统话题并也没太多属性小说题材与之相关,但它常常作为图书题材、诗歌题材、影戏题材等出现,使得它更值得注意。
任何一个主题都也可以从很多不同的角度来看待,比如:
- 鲍勃·迪伦是一个作家、歌手、扮演者、的书作者和电影演员。
- 达芬奇是画家、雕塑家、剖解学家、修建师、工程师。
- 恋爱是的书题材、影戏题材、游戏题材、诗歌题材。
- 任何一个城市都是一个地点,有可能是一个旅游胜地,也是公事员的雇员。
为了掌握很多主题的这样的多面性,Freebas中引入了不同类型的观点。Freebas主题也可以平均分配有任意数量的不同类型,比如,鲍勃·迪伦被平均分配为歌曲作者不同类型、音乐作曲家不同类型、音乐艺术家不同类型、的书作者不同类型。每品种型都带有一组与该类型相关的差别属性,比如:
- 音乐艺术家不同类型包括一个属性,列出了鲍勃-迪伦制作的一切专辑,和他所掌握的一切乐器。
- 的书作者不同类型包括一个属性,列出鲍勃-迪伦编写过的一切的书,和他写作门户的头脑或运动。
- 公司不同类型包括很多属性,用于列出公司的开创人、董事会成员、母公司、职能部门、员工、产物、每一年的支出和利润收入记载等。
因而,一个不同类型也可以被认为是一个概念性的容器,包括了描绘某方面相关信息时最常用的属性。也可以把一个不同类型看作相似于一个关系表,每一 “不同类型”表都有一个外键进入一个 “身份”表,该表独一地定义了每一主题。
就像属性被归为类型一样,不同类型自身也被归为域。把域想象成你最喜欢的报纸上的栏目。以及商业,生涯形式,艺术和娱乐,政治,经济等。每一个域都有一个 ID标识符)比如:
- /busi以及商业范畴的ID
- /mus音乐范畴
- /film影戏范畴
- /medicin医药范畴
域的标识符好像文件途径,或 Web餐厅地址的途径。
每一不同类型也被平均分配一个标识符,该标识符基于它所属的域。比如,
- /business/companiCompani不同类型属于 Busi域。
- /music/album
- /film/actor
- /medicine/disease
正如一个类型从它域继承它ID扫尾一样,一个属性也从它所属的不同类型承继它ID扫尾。比如,公司不同类型的行业属性(用于指定公司所在行业)被赋予了ID/business/company/industri上面是其他一些例子:
- /automotive/engine/horsepower
- /astronomy/star/planet_s
- /language/human_language/writing_system
因而,即便不同类型在Freebas中也没被布置成层次结构;域、不视频题材同类型和属性在观点上被赋予 ID以相似文件目录内容的条理构造来安排。
复合值类型是Freebas中的一种类型,用于表现每一词条由多个字段组成的数据。
思索这样的一个例子,一个城市的生齿会随之工夫转变,即每次查询 Freebas中的生齿数据时,隐含地是讯问某个日期的生齿。这涉及到两个 valu一个是生齿数目,一个是日期。这样的状况下,CVT就非常有效。假如也没 CVT对生齿数据停止建模,需求可以添加一个主题,将其为命名为类似于“1997年的温哥华生齿”称号,接着在此提交数据。
CVT也可以被认为是一个不需求展现称号的主题,和通俗主题一样有一个 GUID也可以被独立引用。但是,Freebas客户会端对 CVT处置形式与主题有很大不同。少数状况下,CVT每一属性都是非歧义属性。
固然一个主题能够或能够不会用命名空间/密钥 ID来识别,但它总是也可以用 MID即机械标识符来识别,由 /m和一个基数为 32独一标识符组成。MID创立时被平均分配给主题,并在主题的整体生命,生命周期中被管理。
当主题被兼并或拆分时,MID也可以发扬要害起到,不允许内部使用跟踪逻辑主题,即便物理的Freebas标识(主题的GUID能够改动。
机械天四季题材生的MID与其他人类可读的FreebasID差别之处在于,
- 确保是存在
- 由机器产生
- 旨在需要支持离线比较
- 不是为了向人类转达寄义部分设计的
- 长度较短,能够是牢固长度
- 内部零碎和组件之间疾速交流密钥的实现理想可以选择
- MID被引荐用于处置 Freebas主题的标识符
文件目录内容式的域、不同类型和属性 ID条理构造,一个更通用概念的使用:为命名空间和键。
为命名空间好像文件目录内容,键好像文件名。
就像一个特定文件目录内容中的一切文件名必须是独一的一个特定为命名空间中的一切键也必须是独一的
除了与域和类型对应的为命名空间除了,另有其他几种命名空间,最常见的/en为命名空间。该空间里,少数著名的主题都被赋予唯一的键,构成人类可读的英文 ID比如 /en/bob_dylan该 ID不允许在Web客户会端中使用简单的URL来访问它瀑布题材主题。
这个根本观点触及 Freebas属性与其在之间的关系型数据库手艺中的类比的一个主要区别,即关系表列。
之间的关系型数据库中,每一表列只能包容一个值。比如 book表中的每一行,author列只能持有一个作者的外键。假如一本书恰恰有几个作者,这样的复杂的之间的关系形式部分设计就不能用了必需运用一个新的表来模仿作者之间的关系,即书和作者之间的多对多短片题材关系。
Freebas以为多值属性对理想生涯中的数据停止建模非常理想,创立 /book/written_work/author属性时,就假设每本书不允许有多个作者。多值属性和单值属性也可以经过完完全全相反的形式查询系统,不需求思索运用第三张表连接,来模仿多对多关系。
- 不同类型一个概念性的容器,包括了描绘一个主题的某个方面一般需求的有关属性。
- 一个主题也可以被平均分配一个或多个类型(默许不同类型是/common/top
- 正如属性被归为类型,不同类型被归为域
- 域、不同类型和属性在为命名空间/键的条理构造中被赋予 ID
- 罕见的着名主题在/en为命名空间中被赋予 ID这些 ID人类可读的英文字符串。
- 主题在Freebas中通过 GUID独一标识。
- 属性默许是多值的多值属性和单值属性也可以用同样的形式查询系统。
原文链接:https://blog.csdn.net/a493823882/article/details/120025836?ops_request_misc=%257B%2522request%255Fid%2522%253作文题材A %2522166856496116800180623878%2522%252C%2522scm%2522%253A %252220140713.130102334.pc%255Fblog.%2522%257D&request_id=166856496116800180623878&学生题材amp;biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-27-120025836-null-null.nonecase&utm_term=%E9%A 2%98%E6%9D%90
未经允许不得转载:题材网 » 相关的知识图谱 Freebas根本观点