大图数据科学:图形数据推理

< > >
我们正沉浸在海量数据的河流中。数据之间的关系是丰富的信息,但它往往被忽视。在这篇文章中,加州大学圣克鲁兹分校教授,美国人工智能协会计算机科学系(AAAI),Lise Getoor告诉图识别是如何依靠数据进行推理,并给出了它们的优势,软逻辑PSL和意见的概率可以用。Lise Getoor表示,我们还需要更多的机器学习的图,考虑到复杂的各种关联节点之间的关系。
< > >
< > >
< > >
< > >
第二种称为链路预测。我们不仅可以预测一个节点的标签,而且可以推断节点之间的联系。例如,有一个通信网络,我们可以通过通信信息推断网络中所有层次的人,并通过不同的信息来判断不同的人的关系。
< > >
< > >
< > >
< > >
第三是实体解析,任务是确定哪些节点指向同一个实体,我们可以从中获得一些信息。
对于我个人来说,我最喜欢的图形推理问题是图识别(找到隐藏在可观察的图结构中的真实的图结构),它可以结合上面提到的三个小模型。在邮件通信网络中,通过邮件信息的推理可以发现这些人之间的关系和角色。我们需要研究每一个信息,研究他们的身体状况和邮件状态。具体做法是先对这些人进行分组,预测他们之间的关系,并对实体的身份作出判断。在这方面也有很大的挑战,建立一个非常强大的算法来澄清它们之间的关系是非常重要的。





目前,统计研究也在发展相应的算法,如概率推理和关系推理。一种工具是概率软逻辑PSL,它是一种概率编程语言,用描述性语言描述图表上的问题。其基础是我们有属性和关系的逻辑表示,以及规则和约束来捕获它们的依赖关系。PSL是一种根据模板和数据定义它们之间的概率分布进行推理的存在形式。
PSL的一个有趣之处在于它通过将逻辑规则映射到凸函数来实现大规模推理的可扩展性。更有趣的是,在现有理论计算机科学的基础上,证明了映射的合理性,并将极大似然近似算法理论与统计学、机器学习和图论模型相结合。之后,我们可以把一些从理论计算机科学变为图形识别的实际应用,最后把软逻辑与人工智能结合起来。在不同的场景中,您将获得相同的优化结果。在我看来,我认为我们现在看到的只是冰山一角,我们称之为铰链损失马尔可夫随机场。这里有许多具体的细节。每一个逻辑规则都与一个函数有关。事实上,所有相关函数都会造成某种依赖性的损失。


在图形识别领域,PSL比离散马尔可夫规则在推理速度和精度上更好,数据的学习权重和变量更有效。所以PSL可以衍生出很多具体的应用,首先是分类问题。作为在线讨论的一个例子,PSL可以通过观察文本内容和讨论的行为数据来很好地预测用户的观点。例如,大数据和人工智能领域往往需要汇总信息,做推荐、预测甚至评分。我们从社会交往和形象中得到各种信息。事实上,这些信息有一些相似之处。优势

资料全部来自网络,如果有问题可以发邮件到站长邮箱