OSN Data Analysis - yizhihenpidehou/yzhpdh-s-bookcase GitHub Wiki
Data Analysis
Account Reciprocity是一个频繁出现的标题(本质是社会关系)
-
Chen, Y., Hu, J., Xiao, Y., Li, X., & Hui, P. (2020). Understanding the user behavior of foursquare: A data-driven study on a global scale. IEEE Transactions on Computational Social Systems, 7(4), 1019-1032. 【foursquare爬虫;探讨了基于地理位置的社交网络,通过对Foursquare中6000多万用户进行行为研究,他们发现Foursquare网络中用户的双向关系呈现适中的水平,不仅如此通过对该网络结构的最大强连通分量与最大弱连通分量的研究,他们发现Foursquare上的大多数用户与其他用户是弱连接的.不仅如此,他们利用Foursquare中用户的tip信息进一步从时空维度揭示用户的行为模式,从发布内容维度分析用户行为中潜藏的情感倾向】
-
Lima, A., Rossi, L., & Musolesi, M. (2014, May). Coding together at scale: GitHub as a collaborative social network. In Proceedings of the international AAAI conference on web and social media (Vol. 8, No. 1, pp. 295-304). 【gharchive + 分析角度(社交互惠、用户活跃度与欢迎程度的关系、活动和合作的地理特征);探讨了GitHub作为社交网络和开源社区的双重性质,发现GitHub中的社交属性大多呈现幂律分布[]的规律.而与传统的在线社交网络不同之处在于GitHub上的社交关系90.4%是单向的,而Flicker中只有32%是单向的,由此说明了用户在GitHub中建立双向的社交联系的意识不是非常强烈,这可能是因为GitHub作为一个代码协作平台,其中的用户更注重与代码仓库的交互】
-
Claes, M., Mäntylä, M. V., Kuutila, M., & Adams, B. (2018, May). Do programmers work at night or during the weekend?. In Proceedings of the 40th International Conference on Software Engineering (pp. 705-715). 【编写了自定义脚本,从所有代码存储库中提取提交(代码更改)、相关的时间戳和作者的列表;86个大型开源软件项目和1个工业项目的提交活动的时间戳进行分析,发现软件工程师的工作时间并不规律,且与工作性质和项目需求有关.他们首先利用从相关企业获得的开发数据分析软件开发者在一周中的不同天数和一周中的不同小时数中,提交次数的分布情况,总结他们的开发模式.在此基础上,他们探索例如项目类型、时间推移等因素对开发模式影响,发现虽然90%的项目有类似的工作时间,但从较大的工作日内完成的提交量的偏差可以总结出项目之间的工作模式差异仍然相当大.】
-
Gilani, Z., Farahbakhsh, R., Tyson, G., & Crowcroft, J. (2019). A large-scale behavioural analysis of bots and humans on twitter. ACM Transactions on the Web (TWEB), 13(1), 1-23. 【构建、预处理数据集twitter bot数据集; 提供了对OSN中机器人的分析,并通过手工标注的方式提供了一个Twitter平台上的人类/机器人标签数据集.随后他们分别从机器人生成的内容和机器人诱发的网络流量类型两个角度出发识别机器人的活动模式以及与人类用户相比的异常之处.他们分别对比了100K与10M大小的Twitter转发引用图在保留机器人连接与移除机器人连接这两种情况下的差距,最后分析得出虽然人类用户对社交网络的内容产生更加重要,但是机器人用户对于信息的传播有着难以替代的地位. 】
-
Gao, Y., Sang, J., Fu, C., Wang, Z., Ren, T., & Xu, C. (2020). Metadata connector: Exploiting hashtag and tag for cross-OSN event search. IEEE Transactions on Multimedia, 23, 510-523. 【 提出跨OSN多模态信息整合。他们的基本做法是绘制每个平台下话题标签,他们发现这些OSN平台将话题标签作为OSN索引内容的常用工具,同时不同OSN平台下的话题标签之间既有重复性又有多样性,因此这些发现启发他们利用不同OSN平台下话题标签之间内部语义结构抽象出相应的底层主题,为他们后续进行跨平台信息整合提供了重要的线索.】