欢迎来到网站建设|网站设计|网站制作公司_做网站_天津诺亚恒业!

免费咨询热线:
4001-543-345
联系我们
服务热线
4001-543-345
QQ:2742678954
邮箱:postmaster@noajt.com
地址:天津市河西区凯德天津湾写字楼A座811室
天津网络营销公司:知识图谱
浏览: 发布日期:2017-09-07
 
    中文目前可用的大规模开放知识图谱有 Zhishi.me、Zhishi.schema与XLore。其中Zhishi.me 是份构建中文链接数据的工作,与 DBpedia 类似,拥有约 1000 万个实体与一亿两千万个 RDF 三元组。Zhishi.schema 是一个大规模的中文模式(Schema)知识库,其本质是一个语义网络,其中包含三种概念间的关系,即equal、related与subClassOf关系。Zhishi.schema抽取自社交站点的分类目录(Category Taxonomy)及标签云(Tag Cloud),目前拥有约40万的中文概念与150万RDF三元组,正确率约为84%,并支持数据集的完全下载。
 
    知识获取:在处理非结构化数据方面,首先要对用户的非结构化数据提取正文。目前的天津网络营销公司互联网数据存在着大量的广告,正文提取技术希望有效的过滤广告而只保留用户关注的文本内容。当得到正文文本后,需要通过自然语言技术识别文章中的实体,实体识别通常有两种方法,一种是用户本身有一个知识库则可以使用实体链接将文章中可能的候选实体链接到用户的知识库上。另一种是当用户没有知识库则需要使用命名实体识别技术识别文章中的实体。
 
天津网络营销公司
 
    知识融合(knowledge fusion)指的是将多个数据源抽取的知识进行融合。
 
    知识计算主要是根据图谱提供的信息得到更多隐含的知识,如通过本体或者规则推理技术可以获取数据中存在的隐含知识;而链接预测则可预测实体间隐含的关系;同时使用社会计算的不同算法在知识网络上计算获取知识图谱上存在的社区,提供知识间关联的路径;通过不一致检测技术发现数据中的噪声和缺陷。通过知识计算知识图谱可以产生大量的智能应用如可以提供的用户画像为精准营销系统提供潜在的客户;提供领域知识给专家系统提供决策数据,给律师、医生、公司 CEO 等提供辅助决策的意见;提供更智能的检索方式,使用户可以通过自然语言进行搜索;当然知识图谱也是问答必不可少的重要组建。
 
    知识验证和处理:为了检验显示知识和隐式知识的完备性、相关性和一致性,我们需要对知识进行校验,这成为知识验证过程。主要是专家或特定的知识计算方法检查冗余的、冲突的、矛盾的或不完整的知识。
 
    知识存储:经过验证的海量知识,在OpenKN里存储在一个基于图的数据库(Graph DataBase, GDB)及关系数据库中。其中GDB中存储的是显示知识,关系数据库中存储的是隐式知识。与传统的数据库模型Titan相比,GDB通过定义点和边的图数据模型来存储知识,这里的点和边都有各自的ID并且支持一系列的多值属性。GDB描述了一个与现有的图模型不同的异构网络,成为可演化知识网络。(转载)


上一篇:天津营销型网站如何做好站内优化

下一篇: 天津营销型网站建设中的seo运用

  • 网络整合营销
  • 网站建设客服
  • 品牌营销客服
  • 网站推广客服
  • 网站优化客服
  • 关键词优化客服