云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

金山云_域名解析命令_企业级

小七 141 0

是什么让一双时髦的鞋子和一件泳装在准备周末去海滩的手提箱里不可错过?为什么不在刚买的登山靴内一键预订去白云石野营,因为你喜欢冒险?发明这些建议的系统可能利用了网络的力量,即我们集体生活的隐喻,物联网技术及应用,以及它的复杂性和纠缠的依赖性。特别是两种类型的网络,数据网络和人工神经元网络结合在一起,为各种有趣的应用开辟了道路。数据网络的典型例子包括社会网络和知识图,而另一方面,基于神经网络的新的机器学习任务家族在过去的几年中得到了发展。这种深度学习技术是在图神经网络(GNN)的保护下发展起来的,建站服务,它们可以揭示隐藏在图数据中的信息,用于分类、推荐、问答和预测实体之间的新关系。你想了解更多吗?

当我们谈到机器学习任务时,我们指的是一组在输入和输出之间找到相关性的算法。输入基本上是一个数字列表,也称为向量化特征:

知识图中节点的向量表示应最大限度地保留单个节点在低维空间中压缩的自身属性中携带的信息。换句话说,嵌入(矢量化表示的名称)应该用向量来标识相关符号,并且这样的向量应该尽可能小。本文的目的是寻找一种从知识图中生成良好嵌入的方法。

为了在后续机器学习任务中有用,嵌入不仅要识别相关的符号,而且要具有重要的性质。根据最受欢迎的距离函数,对于我们为"相似性"定义的任何标准来说,彼此相似的符号都应该与同样相似的嵌入相关联。在上面的例子中,远足嵌入与山的关系比与海边的关系更密切。嵌入对于那些在自然语言处理中实践的人来说是非常熟悉的,它们基于"一个词的特征是它所保持的公司(R.Firth)",并且使用skip-gram技术来预测由一组给定的前辈和后辈包围的最有可能的词。对于一个庞大的语料库,经过训练的skip-gram(或其互补的cbow)网络将包含满足相似性的嵌入,而文本中的单词是严格按顺序排列的(有一个前置词和一个后继词),在一个图中,一个节点可能有许多关系,似乎这还不够,这些关系可能彼此不同。

使用神经网络生成嵌入的技术

下面,我将介绍两种生成图中嵌入的技术。为了便于统计,我在Scala中使用ND4J作为矩阵实现了Deepwalk和图卷积网络(GCN),Deeplearning4J作为神经网络框架。

Deepwalk算法

Deepwalk(及其后续节点2VEC)是一种无监督算法,在图的表示学习领域是第一个,它是简单的设计,因为它是有效的捕捉拓扑和内容信息。原则上,它相当于前面提到的skip gram,但是图形结构如何匹配文本中的单词流序列呢?该算法从选择的任意节点开始,以受控的随机方式访问其邻居和整个网络。随机游走在两种不同的方法中得到平衡,一种方法强调密切相关节点的差异,另一种方法强调远处簇的差异。第一种方法是广度优先搜索(BFS),它从当前节点的兄弟节点中选择下一个要访问的节点。第二种方法是深度优先搜索(DFS),它从与当前节点相连的节点中选择新节点。第一种方法适用于当前节点的所有邻居,而第二种方法则倾向于深入研究网络。

空手道数据集上的聚类与Deepwalk

什么是图卷积网络?

顾名思义,图形卷积网络与卷积神经网络算法有一些共同点,卷积神经网络算法引领了视觉识别的巨大飞跃。如果一个带有节点和边的图被变换成一个二维的邻接矩阵,没有什么能阻止我们运行一个滑动窗口函数来压缩一个像素网格并像CNNs那样提取特征。与CNN的密切关系到此为止,因为当我们详细描述图像时,我们更感兴趣的是复杂的视觉特征,而不是单个像素。另一方面,租用服务器,在知识图中,我们希望在单个节点上卷积其邻居,并递归地卷积整个网络的信息。

魏斯菲勒-雷曼测试

GCNs的基本原理奠定了几十年前魏斯菲勒-雷曼测试中描述的方法的基础。该测试将确定两个任意图是否同构,即它们具有完全相同的结构。根据该算法,所有节点都用相同的值初始化,让我们将数字1表示所有节点。然后,将该值加上其邻居的值分配给该节点,并迭代该步骤。如您所想,在第一轮中,节点已经包含了一级邻居的信息,但是在第二次迭代中,节点将获得第二行节点的抽象概念,以此类推。该测试将确认在经过任意次数的迭代之后,节点按其当前值的划分是否不变。尽管同构问题尚未解决,测试是一种启发式尝试,但该方法带来了在节点之间迭代卷积信息的方法。

光谱传播规则