
图源百度
摘要:在线社交网络中的影响力用户是指在信息传递和观点互动中有影响力、活动力,并对某一话题下舆情走向有重大影响的群体。合理、有效地识别该类用户及其影响力有助于管控信息传播与网络治理。为了探讨如何在社交网络中识别用户影响力,并分析影响力在用户群体的异质性,本文提出了一个基于用户异质性感知驱动的协变量调整和重加权网络(HRNet),考虑了用户属性和用户行为间的因果关系。在用户在线讨论行为的因果推断模型假设下,HRNet通过识别用户属性变量对行为变量的影响,对协变量的联合潜在表征进行修正,进而获取更精确的样本重加权,实现因果效应的准确估计。在案例分析中,分别从回复和发帖两个视角,对比了不同参与活跃度与内容响应度的因果效应函数。利用个体因果效应,估计出不同用户在回复和发帖两种行为下的影响力,进而辨别出高影响力用户,并分析了活跃度在不同群体中的异质性表现,从而筛选出特定的用户群体。
关键词:因果推断;在线社交网络;用户影响力;异质性
一、研究背景与意义
如今在线社交网络作为信息交流和意见形成的重要平台,对公众舆论和社会动态有着重要的影响。在这一背景下,对在线社交网络中有显著影响力用户的识别与评估,成为了社会学、传播学等多个学科的研究热点。在特定主题的议论下,高影响力的用户,或称为意见领袖,通过发帖或回复与其他用户互动,其观点常在网络中引发共鸣,引导舆论方向,影响社会事件发展。但在一些重要社会事件,如新冠疫情、总统选举等,某些高影响力用户借机传播虚假或偏激信息,制造舆论压力并引发社会风险。因此,精准识别在线社交网络中用户行为(如回复、发帖等)的影响力,进而检测出高影响力用户并解析其影响力的成因及机制,对理解社交网络中信息传播的规律、制定公共安全政策以及实施舆情监控有着重要意义和应用价值.
二、主要内容
为有效识别出在线社交网络中用户影响力,并分析其异质性,本文研究主要基于以下三点思考:如何更准确地识别用户在社交网络中的影响力?如何解决影响力估计中数据分布不均的情况?如何针对在线社交网络的情况更合适地建模?对此,本文建立了解释在线讨论网络中用户相关变量关系的因果推断模型,并基于因果效应有效地识别出社交网络中用户的影响力.提出了用户异质性感知驱动的协变量调整和重加权网络,通过识别用户属性变量对用户行为变量的影响以修正协变量潜在表征并获得更准确的样本重加权,来实现因果效应的估计。对真实数据集进行了案例分析,比较不同活跃度对用户影响力的平均因果效应,根据个体因果效应识别出用户影响力,辨别出高影响力用户和低影响力用户,并从活跃度在不同群体中的异质性挖掘出特定的用户群体。
三、主要结论及政策建议
基于本文所构建的模型,分别以回复者与发帖者网络为例,证实了所提模型能够有效识别个体用户的影响力。实证结果表明,用户的影响力与活跃度是正相关的,即积极地参与话题讨论有助于逐步提升用户的影响力。然而,不同异质性群体中活跃度所带来的因果效应差异显著。在论坛中具有较高认可度(如高粉丝数、高点赞数)的用户,其回复或发帖质量通常较高,其影响力也更高。相比之下,普通用户虽然积极参与回复或发帖,但由于内容质量和认可度较低,其活跃度所带来的影响力较为有限。通过分析个体的条件平均因果效应,可识别出相同活跃度下不同用户所产生的影响,从而划分出高影响力用户群体(意见领袖群体)、积极用户群体、普通用户群体和边缘用户群体。在高影响力用户群体中,相同的活跃度所带来的影响力要远大于普通群体和边缘群体;而在边缘群体中,由于用户认可度和内容质量较低,活跃度提升对其影响力的作用极为有限。
本文研究结论为社交媒体平台中用户影响力识别和高影响力用户检测提供了一个可行的方法与思路,从管理学和系统工程的视角上提出了一种有效的用户群体管理策略和用户行为分析框架。通过管控高影响力用户,可以在应对特定社会事件期间有效控制网络舆情动态的趋势,增强支持者的动员和参与,降低社会风险,同时为制定更有效的信息传播监管政策提供了科学依据。在公共危机事件(如疫情)期间,高影响力用户可帮助迅速传播重要的信息和防护措施,有效预防和减缓可能引发的负面影响,从而维护了网络空间的健康生态.
四、边际贡献与未来拓展
本文以在线社交网络中的回音室结构为例,分析回音室结构与非回音室结构下用户立场分布的特点及其邻居状态所带来的影响。本文主要的贡献如下:
(1)本文建立了解释在线讨论网络中用户相关变量关系的因果推断模型,并基于因果效应有效地识别出社交网络中用户的影响力.该方法可有效用于在线社交媒体平台中的影响力用户识别。
(2)本文对真实数据集的案例分析中发现,用户的影响力存在明显的异质性,可借此识别出特定类型的用户群体.该结果可为在线平台中的用户群体管理策略提供参考。
在本文工作的基础上,未来可进一步考虑实际在线社交网络中存在复杂的关注和互动关系,在复杂网络背景下进行进行更深层次地因果推断。此外,虽然本文实证结果中显示该方法存在一定识别AI网络机器人的能力,但随着 AIGC 在内容生成与互动方面的快速发展,研究真实用户与 AI 机器人在内容生成和行为互动模式上的差异及其在社交网络的影响也是重要的后续研究方向。
五、写作、投稿过程的心得体会
高影响力用户在社交网络中对信息传播、舆论形成以及个体行为决策具有重要作用,他们通常能够快速扩散信息、引导话题讨论方向,快速、有效识别他们不仅对于理解信息的扩散路径至关重要,还对实施有效的舆情管控、及时应对社会热点事件、维护社会稳定以及构建健康的网络环境具有重要意义。本文完稿后参加了中国系统工程学会第二十三届学术年会的现场学术交流,经参会专家深入讨论和认真评估后,荣幸地被评为高质量论文,并推荐投稿至《系统工程理论与实践》期刊。在本文的投稿和修稿过程中,审稿专家和编辑部老师认真负责,提出了诸多宝贵的建议,包括文献综述、实证分析、文章叙述等相关细节问题,使得本文在修改后文章质量得到显著提升。我们在此对审稿专家和《系统工程理论与实践》编辑部老师表示衷心的感谢和诚挚的敬意!
本文摘编自《系统工程理论与实践》2025年,第45卷,第12期论文《基于因果推断的在线社交网络用户影响力识别及异质性分析》(点击题目链接全文);
作者:黄晓辉1,2,3, 博士, 研究方向: 舆情分析, 复杂网络, 因果推断;闫志华4, 讲师, 研究方向: 大数据预测与决策, 机器学习; 唐锡晋1,2,*(通信作者) , 博士生导师, 研究方向: 综合集成, 决策支持系统, 知识科学
1. 中国科学院 数学与系统科学研究院, 北京 100190
2. 中国科学院大学 经济与管理学院, 北京 100490
3. 南方科技大学 统计与数据科学系, 深圳 518055
4. 山西财经大学 管理科学与工程学院, 太原 030006