关切微信  |  微博  |  腾讯微博  |  RSS订阅
读者QQ群③:168129342,金宝博首选金杯娱乐城请发金宝博首选金杯娱乐城
我要金宝博首选金杯娱乐城

bet36备用网址报道大图数据科学: 图数据中的推理_bet36备用网址官网资讯

bet36备用网址

我们正淹没在bet36备用网址的河流里,数据之间的相互联系蕴含着丰盛的信息,但也往往被我们疏忽。本文中,加州大学圣克鲁兹分校计算机科学系教授、美国人工智能学会(AAAI)院士Lise Getoor讲述了图识别是如何依靠数据做出推理的,并给出了自己对于概率软性逻辑PSL优越性和可能应用的看法。Lise Getoor表示我们还需要对图进行bet365娱乐城送体验金的机器学习,考虑各种关联结点之间的复杂联系。

bet36备用网址

南加州大学圣克鲁兹分校计算机科学系教授Lise Getoor

(以下为Lise Getoor教授分享的精简版文字整理)

我们正淹没在bet36备用网址的河流里,bet36备用网址并非是平的,而是多模态、多联系、兼具时空、多博坊娱乐 官方网站的。当前的AI技术,特别是机器学习,它将丰盛复杂数据平放到矩阵的形式当中。我们当下所做的一些工作很可能忽视了数据当中的很多丰盛信息,其中很重要的一点就是失误假设了数据之间的相互联系。作为研究者和开拓者,我们需要考虑到这些图的结构和相关的环境因素。

我想首先和大家说说三种常见的图数据推理模式,最简单的一种叫做协同分类。如果一个图的部分结点已经有标签,我们就能够推理出其结点的标签。社交网络就是很典范的例子,其中包含着非常丰盛的信息和联系,通过信息和数据去做推理能够得出某位朋友的饮食习惯或其余偏好。基于数据在已有的信息,设置不同的权重,我们能够做一些简单的推理,充分使用本地信息和标签,再去推理出一些之前没有加入的标签信息。

bet36备用网址

bet36备用网址

bet36备用网址

bet36备用网址

第二种叫做链接预测,我们不仅仅能够预测某一个结点的标签,还能够推断结点之间的链接。比如说有一个通讯网络,我们能够通过通讯信息推理出网络中一切人的层级,并通过不同种类的信息推断不同人之间的联系。

bet36备用网址

bet36备用网址

bet36备用网址

bet36备用网址

第三种是实体解析,任务是确定哪些结点指向同样的实体,我们就能从中获得一些信息。

对我个人而言,我最喜欢的图推理问题是图识别(发现可观察图结构所潜含的真实图结构),它能够把上面提到的的三个小模型结合到一起。还是以邮件通讯网络为例,通过对邮件信息进行推理就能够发现这几个人之间的联系及角色。我们需要对每一个信息进行研究,研究他们的实体状况和邮件状况。具体做法是首先对这些人进行分组,对之间的联系进行预测,并对实体身份做出推断。这其中也存在非常大的挑战,如何打造一个非常鲁棒的算法来理清其中的人物联系非常重要。

bet36备用网址

bet36备用网址

bet36备用网址

bet36备用网址

当前,统计学研究也在开拓相应的算法,例如概率性推理和联系推理。有一个工具叫概率软性逻辑PSL,它是一种概率编程语言,即用描述性的语言对图上的问题进行描述。这个基础是,我们有属性、联系的逻辑表示,还有规则和约束来捕捉他们的依赖联系。PSL是一个这样的存在,它依据模板和数据来定义他们之间的概率分布用于推断。

PSL比较有意义的一点是,它通过将逻辑规则映射为凸函数,实现了大规模推断的可扩展性。更有意义的是,这个映射的合理性是用已有的理论计算机科学的结论证明的,用MAX SAT的近似随机算法结合统计学、机器学习、图模型方面的理论。之后我们就能够将从理论计算机科学当中的一些东西转化到实际的图识别应用当中去,最后将这种软性的逻辑和AI进行结合,在不同的情景下,很多时刻你们会得到同样的优化结果。在我看来,我觉得我们现在能看到的这些东西仅仅是冰山一角,我们称之为叫Hinge-loss马尔科夫随机域。在这里有包含着很多具体微小的细节,每一个逻辑规则实际上都和某一个函数是相关的,相关的函数实际上都会造成肯定的依赖损失。

bet36备用网址

在图识别领域,PSL在推理速度和精确度上的体现和离散的马尔科夫规则相比都要更好,且从数据当中学习权重和变量的效果也更加出色。由此PSL能够衍生出很多具体的应用,首先是分类问题。以在线讨论为例,PSL通过观察大家讨论的文字内容和行为数据,就能够很好地来预测用户的观点。再比如bet36备用网址和AI领域往往需要聚合信息做推举、预测甚至打分,我们有来自社交互动、图像方面的各种信息,其实这些信息中存在肯定的相似性。PSL的优势就在于它具有非常好的扩展性,特别是逻辑相似性较高的情况下扩展也会更加容易。

另外一个领域可能和安全相关,通过研究社交博坊娱乐 官方网站当中的渣滓邮件能够进行协同推断,哪些可能是渣滓邮件。还有一个问题是如何把视觉的、文本的、联系的数据全部融合起来,去推测使用用户的个性。我们把一切的信息结合起来就能够预测一些人口学特征,比如性别、年龄,同时还能够预测人们在社交博坊娱乐 官方网站当中的相信。

最后我想和大家分享有关知识图的建构,如何猎取足够多的数据来实现知识的主动架构是一项长期以来的挑战。我们能够结合统计学的数据信息以及一些相对简单的语义信息,把它们和我开头提出的图识别问题结合起来,并在做图识别时找到它的结点、标签以及结点之间的联系,在此之上能够再融入一些本体的限制,同时还能够融入一些梦之城国际注册信息和其余来源的数据。把它们相结合能够发生比较好的效果,而且速度能够得到显著提升。

我们需要对图进行bet365娱乐城送体验金的机器学习,考虑各种关联结点之间的复杂联系。另外,当我们在做数据驱动技术时需要思索究竟什么才是负责任的数据科学,如何检讨数据并通过算法做出决策。我个人对PSL感到兴奋的原因就在于它的逻辑规则确实比一大批权重或是参数的算法更加容易解释。这个领域会有一些隐私和安全性的问题,这值得我们进一步研究;相伴而生的还有很多机遇,有bet365娱乐城送体验金金宝博首选金杯娱乐城、商业、科学、安全以及其余方面的应用能够去发现、去探究。

End.

转载请注明来自36bet36备用网址(36dsj.com):36bet36备用网址 » 大图数据科学: 图数据中的推理

36bet36备用网址   除非特别注明,本站一切文章均不代替本站观点。报道中出现的商标属于其合法持有人。请遵守理性,宽容,换位思索的原则。

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
条评论
Sitemap