Graph and Machine Learning(图和机器学习)

it2023-08-18  65

文章目录

图的知识什么是图?图能用来干什么?预备知识Multi-relational GraphHeterogeneous Graph(异构图)Multipartite(多部图)Multiplex(多重图) Graph or Network? 图上的一些学习任务无监督学习和监督学习半监督学习

图的知识

什么是图?

G=(V,E),图是由节点和边组成,节点可以代表人,产品,论文等等,边可以表示朋友关系,购买关系等等。

图能用来干什么?

图能用来表示社交网络,购买记录关系,族谱,句子之间单词的关系等等。 图既是一种数学形式,又是一种数据结构(如邻接矩阵),他还是数据自身。我们要从图这种数据中挖掘出价值。

预备知识

如上图,图可以分为有向图和无向图。 如上图,可分为有权图和无权图。 如上图,可分为单一关系和多关系的图。单关系中,有n个节点,那么自然有nxn的邻接矩阵;多关系里面除了nxn,还要乘一个┏,因为每个边的类型不一样。

如上图,Node ID是指第几个节点,而Node Feature是将节点搞成特征向量了,这时节点集合变成了一个nxk的矩阵。

Multi-relational Graph

Heterogeneous Graph(异构图)

看看上面那张图,异构图的节点子集合的并集是总的节点集合,节点子集合与节点子集合间无交集。在第一张图中,有三个节点的集合,他们无交集,然后(u,v,┏)可以唯一确定一条边属于边集合E中,当我知道这条边后,我就能确定这条边的两个顶点以及定点所在的集合。

Multipartite(多部图)

继续看上面那张图,在异构图基础上加了一个条件,就是同一子集合内没有边相连。

Multiplex(多重图)

如上图所示,多重图的各个顶点子集的并集是总的顶点集合,但是,每个子集可能有很多个,就像上面的图一样,假设有三个一样的顶点子集。然后他们边集的集合是总的边集,那个E0表示每一层的图的对应的节点间的边。也就是说当(u,v,┏)属于E0时,那么这两个顶点u和v一定是相对应的。

Graph or Network?

网络是真实世界的,比如社交网络之类的;而图是数学世界的,是将真实的社交网络用数学的形式表示出来。

图上的一些学习任务

先看看图上的信息,对于节点来说,将节点打上标签,然后目标值就为y(vi)。对于边来说,1或0表示有无该边。然后就是将节点与边构成的各个子图组合成完整的图。然后给完整的图打上标签,目标值为y(G)。

无监督学习和监督学习

这个不用多说,看看机器学习入门知识就能理解。

半监督学习

半监督学习综合了无监督和有监督。数据集X里的数据一部分有标签,一部分无标签。所要完成的任务是将无标签的数据打上标签,并且完成映射。 我们将半监督学习看成监督学习用了分布中的额外的一些信息(就是没打标记的数据),或者看成无监督学习做了一些约束,比如对有标记数据的误差的最小化以及平滑程度。

最新回复(0)