知识图谱是谷歌的语义数据库。这是实体相互关联放置、属性根据主题或本体分配并放置在上下文中的地方。
但什么是实体为了找到这些问题的答案,让我们看看谷歌的语义和机器学习。
基本语义结构以及实体和本体的最重要元素。在语义中,实体由标识符尤其是特征(属性或属性)明确地描述。标识符 通常由一串数字组成,机器使用标识符 (URI) 来识别实体,而人类则通过实体的特征来识别实体。
实体始终是本体的一部分。本体描述了实体存在的环境。这可以通过以下实体的示例来证明:阿道夫·达斯勒 (Adolf Dassler)、阿迪达斯 (Adidas)、锐步 (Reebok) 和 Foot Locker。阿道夫·达斯勒是一位商人和发明家,也是体育公司阿迪达斯的创始人:
锐步是阿迪达斯的子公司。运动服装零售商 Foot Locker 是阿迪达斯和锐步的客户,销售阿迪达斯 Superstar 或锐步 Freestyle 等产品:
为了表示语义结构
使用图论很有用该理论是谷歌知识图谱和 Facebook 图搜索的基础。
该图由节点和边组成。从语义上看,节点表示 澳大利亚号码数据 实体,边表示实体之间的关系。这些关系也可以被赋值,例如其他人的关系上下文。在上面的例子中,阿道夫·达斯勒和阿迪达斯之间的关系脉络就是成功的创始人。
图表包含所有相关实体,无论其本体论如何。除了表达实体之间关系的存在之外,边还可以用于指示这些关系的值,例如通过它们的长度和厚度。
特别粗的连接边可以代表两个实体之间的牢固关系。关系距离,以边的长度表示,也可以用来表示两个实体的相关程度。还可以创建到向量空间(包括欧几里得距离)的链接。这意味着可以通过向量空间分析等统计方法生成图结构。
Google 将什么视为实体?
型 可以让我们全面了解可以作为实体进行评估的所有内容。评估谷歌实际上将哪些内容分类为实体以及哪些内容不分类并不完全简单。在谷歌在其自己的一项专利中引用的专利描述中,我们找到了以下定义:
命名实体是一组一个或多个单词(文本元素),通过 名称标识实体。例如,命名实体可以包括人(例如人的姓名或角色)、组织(例如公司、组织、协会、政府西 CH 线索 或或组织私人的名称)、位置(例如国家、州、城镇) 、地理区域、命名建筑物等)、工件(例如消费产品的名称,例如汽车)、时间表达,例如日期、特定事件(可以是过去、现在或未来的事件,例如世界)第二次世界大战;2012 年奥运会),以及货币公式的表达。谷歌似乎将在搜索结果右侧的知识图块中显示相关实体。