User Identity Link Prediction - lkb1324/Bot-Adversarial-Attack-and-Detection GitHub Wiki
[KDD'20] Multi-level graph convolutional networks for cross-platform anchor link prediction.
以跨社交平台的用户链接预测为研究背景,具体的研究问题是:为了解决用户统计数据的缺失性,引入社交网络图结构在用户账号链接预测的解决方案中。但是引入图结构也存在两个问题:无法解决较小图和冷启动场景下的信息缺失。
由此提出基于简单图和超图的网络节点嵌入,在对两个社交平台分别嵌入后,对齐嵌入空间,最后成对预测节点的链接概率,通过最大化正边缘的对数似然和最小化负边缘的对数似然来学习网络嵌入。
处理大规模社交网络:为了适应大规模社交网络,提出了一个两阶段的空间对齐机制,以在基于网络分区的并行训练和跨不同社交网络的账户匹配中对齐嵌入空间。
实验验证:在两个大规模真实社交网络上进行了广泛的实验,结果表明所提出的方法在预测锚点链接方面优于现有最先进模型。
[CIKM'16] ASNets : A Benchmark Dataset of Aligned Social Networks for Cross-Platform User Modeling.
文章强调了跨社交网络用户对齐的重要性。构建Twitter-Facebook,Weibo-Douban两个对齐数据集,进行用户信息匿名化处理,并且只保留社交关系信息,以消除统计信息在链接预测的dominance.
文章分析了不同网络间的一致性,包括用户名、社交联系和UGCs的一致性。通过编辑距离、Jaccard相似性系数和主题模型等方法来衡量这些一致性。
网络对齐评估:使用ASNets数据集评估了几种最先进的社交网络对齐方法,包括MNA、MAH、MOBIUS和直接基于用户名对齐的方法。
未来研究方向:文章提出了几个可以利用ASNets数据集的潜在研究方向,包括跨平台用户建模、保护用户匿名性的策略和多网络分析。
[CIKM'13] Inferring Anchor Links across Multiple Heterogeneous Social Networks.
用社交结构、空间分布相似性、时序相似性、文本内容相似性 作为异构的社交网络平台上的跨站用户账号匹配测度
其中,对社交结构相似性的计算定义了三个跨站的指标:扩展的共同邻居用户、扩展的Jaccard’s coefficient、扩展的adamic测度,全部是基于已经锚定的少量用户来计算。
对空间分布相似性、时序相似性和文本内容相似性均考虑的是数值上的余弦相似度或者距离和。
在匹配方法上,考虑了传统的二分类模型处理一对一限制匹配的不足之处,收到“稳定婚姻问题”的启发,设计了Mna匹配方法:
1、一一对应约束:在推断锚链接时,模型假设每个用户在两个网络中的账户之间存在一一对应的关系,即一个用户在源网络中的账户仅与目标网络中的一个账户相对应,反之亦然。这种约束条件排除了一对多或多对多的匹配情况。
2、稳定匹配问题:模型将锚链接推断问题转化为一个稳定匹配问题,借鉴了经济学中的稳定婚姻问题(Gale-Shapley算法)。在这个问题中,每个用户根据自己的偏好(基于特征提取和分类器评分)选择匹配账户,同时确保最终的匹配结果没有“阻碍对”(即不存在两个用户互相更喜欢对方而不是他们当前的匹配)。
3、偏好列表:在匹配过程中,每个用户根据自己的评分对所有可能的匹配用户进行排序,形成一个偏好列表。这个列表指导了匹配过程,使得每个用户都尽可能与自己偏好最高的用户匹配。
4、迭代匹配过程:Mna算法通过迭代过程来确定最终的匹配结果。在每次迭代中,一个网络中的用户尝试与另一个网络中的用户建立匹配关系。如果匹配成功且没有形成阻碍对,则更新匹配状态;如果不成功,则继续尝试下一个偏好的用户。
5、全局一致性:通过考虑所有用户账户的匹配关系,算法确保了全局一致性,即所有匹配的用户对都满足一一对应的约束,并且没有用户对彼此的偏好高于他们当前的匹配。
据此满足跨平台一对一匹配的问题定义。
实验数据集:Twitter和Foursquare,API收集了用户的社交关系、发布的内容(如推文和签到)、位置信息以及时间戳等数据。同时利用用户在两个平台上的公共信息来识别和标注已知的锚链接。
[ICJAI'16] Predict Anchor Links across Social Networks via an Embedding Approach.
利用网络拓扑结构嵌入进行anchor link预测。可取之处是设计了子网划分的采样策略,保证子网中边的稀疏性和两个子网的重叠率。
[KDD'13] Predict Anchor Links across Social Networks via an Embedding Approach.
设计了MOBIUS,用于在社交媒体网站上寻找个人身份之间的映射,依靠识别用户独特行为模式作为预测信息
[WWW'19] Cross-Network Embedding for Multi-Network Alignment
提出了跨网络嵌入方法CrossMNA,仅通过研究结构信息来解决多网络对准问题
CrossMNA考虑了多网络场景,提炼两种类型的节点嵌入向量:inter-vector用于网络对齐,intra-vector用于其他下游网络分析任务的
数据集:来自arxiv、twitter等网络平台
[CIKM'16] ASNets:A Benchmark Dataset of Aligned Social Networks for Cross-Platform User Modeling
Weibo-Douban Twitter-Facebook数据集
[AAAI'14] Mapping Users across Networks by Manifold Alignment on Hypergraph
利用超图模型来捕捉用户间的高阶关系,如多个用户加入同一兴趣小组或参与同一活动,基于此提出了一个新的半监督嵌入框架MAH,将用户嵌入到一个共同的低维空间中,通过比较嵌入空间中用户之间的距离来推断对应关系。
[WWW'14] Zhong, C., Salehi, M., Shah, S., Cobzarenco, M., Sastry, N., & Cha, M. Social Bootstrapping: Developing Social Communities by Borrowing from Established Social Networks.
社交引导:从已有社交平台复制用户关系,建立新的在线社区。保证社交关系还原度
关注了三个衡量社交结构保持程度的指标对复制好友连接关系的反应。首先确定的结论是复制用户链接(社交引导)到新的在线社区上是能够帮助提升用户粘性,增强新的在线社区服务质量的。同时比较了用户新创建的本地链接和复制链接对在线社区的作用,发现用户在新的在线社区主动创建的本地连接是更有助于保留用户粘性与活性的,复制链接的收益存在边际递减。
随机bootstrapping:已一定的概率采样节点和采样边,并且两个采样概率独立分布
[WWW'14] P. Wang, W. He, and J. Zhao. A Tale of Three Social Networks: User Activity Comparisons across Facebook, Twitter, and Foursquare. IEEE Internet Computing, 18(2):10–15, 2014.
用作data simulation的reference:用户在Foursquare上的朋友有67%的可能性也是Facebook上的朋友,而在Foursquare上的朋友有43%的可能性在Twitter上互相关注,如果用户在Facebook和Foursquare上都是朋友,那么他们在Twitter上互相关注的可能性为59%