zoukankan      html  css  js  c++  java
  • HEER-Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks

    来源:KDD 2018
    原文:HEER
    注: 若有错误,欢迎指正
     
    这篇KDD’18的文章,没有按照常规的方法将所有的node嵌入到同一的空间,因为文章提出 node 因为连接的 edge 类型(type)不同,存在不兼容(incompatibility)的特性,所以最好能够根据不同的edge type来定义不同度量空间(metric space),保持同一个度量空间下,node的兼容性。
     

    1. Abstract

    在本文中,作者认为异构信息网络(HIN)中隐含着丰富信息的同时也引入了潜在的不兼容性,为了保留HIN中丰富但可能不兼容的信息,提出对HIN的综合转录问题。还需要提供一种易于使用的方法来有效利用 HIN 中的信息。本文提出HEER方法: 通过对 HIN 的边缘表示,与正确学习的异构度量相结合。

    2. Introduction

    网络嵌入学习节点的低维表示可以在原始网络中编码其语义信息,且容易和机器学习等方法相结合,可用于分类、链路预测。近来,研究人员证明了HIN 嵌入在作者识别等方面的有效性。
    图 1 Network Embedding
     
    HIN 异构性不仅包含丰富的信息,还有潜在的不兼容的语义。传统的同构网络嵌入不论其类型,均等的处理所有节点和边,不会捕捉 HIN 的异质性。
    如图1,stan,musical,Ang Lee是不同类型的节点,因为musical和Ang Lee的embedding距离很远,会导致stan无法同时和两个embedding同时很近,因此需要学习两个不同的度量空间,从而stan分别在两个度量空间中与对应的node距离很近。
     
    图 2 异质网络嵌入学习中的不兼容现象
     
    为解决该问题,本文在计算相似度 s 时提出度量向量 μ
    该度量向量μ是对不同类型的关系来进行embedding,g_{uv}是表示u,v之间的边的embedding。通过定义该相似度函数,能够获得基于不同边类型r的相似度
     

    3. 嵌入 HINs 的边缘表示(HEER)

    3.1. 方法思想

    通过边缘表示和耦合度量的可用性,得到反应边的存在和类型的损失函数,通过最小化损失,同时更新节点嵌入、边缘嵌入和异构度量,保持输入HIN中的异质性。对不同的不兼容程度建模,其中两个边缘类型越相似,对应的指标越相似。
    • 综合转录 HIN 中的嵌入信息
    • 解决 HINs 中的语义不兼容
    • 利用边缘表示和异质矩阵
    • 使用神经网络学习节点和边的嵌入表示

    3.2. 框架结构

    图 3 HEER模型框架结构
     

    HIN Embedding 定义

    • 输入一个异质网络
               
    • 通过F网络学习出node embedding
               
    • 之后通过g函数来学习出边的embedding
      • 一对节点间可能有多种类型的边,g(u,v) 包含此类关系
                
    • 通过type之间的相似度,也就是定义的相似度函数和原始连接关系共同作为ground truth
    • 最后训练出网络参数,从而能够学到网络的嵌入模型

    类型接近度

    对于每对节点(u,v)的边缘嵌入 guv
    μr 为特定类型嵌入表示,兼容的边类型共享相似的 μ

     

    目标函数

    ( KL 测量元权重和从嵌入表示得到的相似度间的差异)
    将(1)代入(2)考虑所有的边类型,得到
     

    4. Experiment

     
     
     
    (边缘剔除率为0.4时)

    5. 总结

    • HEER模型,能够建立异构网络中不同type之间的不兼容性,这是一种新的尝试,将不兼容的性质提出并通过不同度量空间来表示。
    • HEER模型能够同时学习网络中节点的node embedding和边的edge embedding。
    局限性
    • 没有考虑更复杂的网络结构信息,而是仅仅通过相邻节点的关系来确定embedding,更复杂的关系可以通过meta-path来找到,这也可能成为该论文未来的研究方向。

    参考:

    KDD'18|异质信息网络嵌入学习

  • 相关阅读:
    WPF 关于拖拽打开文件的注意事项
    asp.net core 3.1中对Mongodb BsonDocument的序列化和反序列化支持
    用百度webuploader分片上传大文件
    多线程学习笔记
    web.config数据库连接字符串加密
    Visual Studio 2010 常用快捷方式
    Team Foundation Server 2013 日常使用使用手册(四)分支与合并
    Team Foundation Server 2013 日常使用使用手册(三)上传新工程、创建任务、创建bug、设置预警
    Team Foundation Server 2013 日常使用使用手册(二)修改、签入、撤销、回滚、对比代码变更
    Team Foundation Server 2013 日常使用使用手册(一)-本地连接TFS、查看任务
  • 原文地址:https://www.cnblogs.com/chaoran/p/10156564.html
Copyright © 2011-2022 走看看