原创 Sean J. Taylor等 集智俱乐部
导语
人们的各种活动在网络上留下大量身份线索(Identity cues),这些身份线索有可能进一步用来识别真实身份。这提出了一些重要的问题:人们的网络观点和在线行为多大程度上受到用户身份的影响?近日发表于 Nature Human Behaviour 期刊的最新研究,使用大规模实地实验,评估了社交媒体上的身份线索如何塑造内容消费和反馈机制。该研究对互联网平台治理、监管、实名制和算法设计具有启发意义。
关键词:网络观点动力学,网络实名,马太效应,互联网平台管理,排序算法
Sean J. Taylor, Lev Muchnik, Madhav Kumar, Sinan Aral | 作者
刘培源、刘志航 | 译者
邓一雪 | 编辑
论文题目:
Identity effects in social media
论文链接:
https://www.nature.com/articles/s41562-022-01459-8
目录
1. 概述
2. 结果
3. 平台启示
4. 讨论
摘要
如今,身份线索(Identity cues)与社交媒体中的内容一起无处不在。一些人还建议用真实姓名和其他身份线索进行统一识别,作为对网上有害行为的有效威慑。不幸的是,我们对身份线索如何影响网络观点和在线行为知之甚少。在这里,我们使用了一个大规模的纵向实地实验来评估身份线索在多大程度上影响人们对在线内容的看法以及与在线内容的互动。我们将社交新闻聚合网站上生成的内容随机分配到“已识别”和“匿名”条件下,以评估身份线索对观众如何投票和回复内容的因果影响。身份线索的影响是显著的和且具有异质的,解释了与评论者的生产、声誉和互惠相关的投票中28%至61%的变化。我们的结果还表明,身份线索会促使人们更快地对内容进行投票(与启发式处理一致),并根据内容制作者的声誉、制作历史和内容观众的相互投票进行投票。这些结果提供了证据表明,富者愈富的动力学和社会内容评估中的不平等是由身份线索介导的。他们还提供了在线社区状态演变的见解。从实践的角度来看,我们通过模拟表明,社交平台可以通过将匿名内容的投票作为排名信号来提高内容质量。本文对于互联网平台治理、监管、实名制和算法设计具有启发意义。
1. 概述
在几乎所有的社交媒体上,内容都被明确地归属于制作或分享它的用户。Facebook、Instagram、Reddit 和 Twitter将内容制作者的头像和用户名称,显示在其发布的每一条内容旁边。同时,普遍的身份标识最近也被认为是对网上有害内容的一种可能的威慑[1]。身份线索(Identity cues)在社交媒体中几乎无处不在,而且有可能进一步转向真实身份识别。这就提出了一个重要的问题:观点和内容互动(例如,点赞、投票和回复)在多大程度上受到与内容相关的用户身份的影响,而非内容本身?
如果身份线索影响了用户观点,它们就可以改变反馈机制,进而影响人们的印象、内容排名及搜索算法。如果身份效应足够大,其反馈机制可以通过系统传播,进而扭曲我们所消费的内容[2,3,4]。在平台依赖社会线索获取信息的情况下,我们必须衡量身份线索如何塑造内容消费和反馈机制。
近几十年来,心理学和传播学研究人员一直在研究源头效应(source effects)在说服和态度改变中的作用[5,6,7]。对虚拟工作背景下以计算机为媒介的交流的研究表明,通过交换个人身份信息,团队整体成果会得到提升[8,9]。在这些背景下,身份信息为人际信任[10,11]和公共知识的发展(它们共同促进了协调与合作)提供了基础。同行反馈系统也有助于提高知识交流的质量和持续时间[12],并通过加强在线环境中参与者之间的社会联系来鼓励知识贡献[13]。关于说服的文献表明,身份信息可能在许多方面与观点形成和表达有关。
首先,社会影响接受者的行为目标被归类为以下几个相关方面:(1)确保一致性和有利的自我评价,(2)建立和维持与他人的关系,以及(3)准确评估外部现实[14,15,16]。身份线索在其中至少两个目标中发挥了关键作用,它为建立和维持关系以及判断他人所提供信息的可靠性和有效性提供了基础。身份信息使人们能够将行为分配给特定的关系,从而跟随互惠和利他行为,并根据提供信息的人来校准他们对信息的信心。其次,公共场合和私人场合的说服是不同的。具体而言,在诸如在线论坛之类的公共环境中,态度的改变可能来自于社会动机,例如希望接纳他人[17,18]——这一过程是通过识别人们可能想接纳的人来实现的。其三,说服的双过程模型表明,当人们没有特别对某一问题所激励或分心时;态度判断更多的是基于容易获得的属性,如说服者的身份,并通过有效的处理策略或启发式方法进行评估[16,19]。正如后文将看到的,我们的实验能够直接检验这种说服假设。最后,社会认同理论[20,21]表明,来自与我们相似的其他人的认同会增强主观确定性,因为共同的态度被认为是反映了外部现实和客观真理。身份线索通过使群体参与者能够对相似的人进行分类和识别来支持这一过程。由于上述这些原因,我们预计身份线索与在线社区的观点形成和相关行为有关。
遗憾的是,虽然同化性、相似性和排斥性的社会影响理论模型比比皆是,但关于社会线索效应,特别是身份线索效应这一狭小子集的经验证据却很少[22]。最近,在线实地实验(Online field experiments)被用来确定社会线索和特征对病毒式信息的影响,以及对评级系统的群体作用[4,23,24]。此外,社会内容的发送者和接受者之间的关系特征往往会缓和同侪效应(peer effect)[25,26]。社会信息已经被证明在诸如慈善捐赠[27]、信息共享[28]和优质服务采用[29]等情况下,可以提高点击率和转换率。最近的工作发现,通过社交媒体推广学术论文往往会增加一年后的引用率[30]。
虽然这些不断增长的文献更广泛地考察了社会线索效应,但相对而言,很少有针对在线身份的实证研究(例如引文[31,32]),而且这些文献还没有解决限制我们对身份效应理解的两个关键挑战。首先,用观察数据来确定身份线索对观点的影响几乎是不可能的,因为内容创造和观点形成之间的关系是高度内生的[33,34,35]。平台通过选择更有可能参与该内容的用户,向同行(或有相同爱好者)展示社交内容。内容生产者的潜在特征也可以同时影响身份和内容效应的强度和方向。这使得我们很难确定是声誉驱动着观点,还是观点驱动着声誉,或者是内容质量决定两者。其次,身份线索可能会根据消费者和生产者之间关系的性质而产生高度异质性的影响。目前尚不清楚,在我们预期个人效应差异很大的情况下,平均效应是否相关,这促使我们目前关注身份效应的异质性。以前的实验估计了改变求职者[36]或 Airbnb 客人[37]的种族身份所产生的歧视性影响,证明了身份的这一特定方面的突出性。但是,没有一个研究者考虑过大规模的匿名性(或身份存在)的实验影响,而这是对线上社交媒体至关重要的话题。
为了解决这两个难题,并估计身份线索对观点和参与的异质性影响,我们在一个社会新闻聚合网站上进行了一个大规模、纵向的实地实验,观察了1200万个随机的内容曝光。在我们的设计中,对于每个观众来说,每篇内容都被随机分配到5%的“匿名”条件下,即观众无法看到评论者的用户名,或者95%的“身份”条件下(即网站的现状),即观众可以看到并点击评论者在评论上方的用户名。这种设计通过同时收集暴露于内容作者身份元数据的用户和不受其影响的用户的反应,控制了内容生产和评价的内生变化。
在两年的时间里,我们记录了6,415名观众对3,725名评论者所产生的346,559条评论的回应。我们观察到在身份可识别条件下有1190万条评论曝光,在匿名条件下有632,000条评论曝光。平均而言,每条评论收到了36次观众曝光、1.54次赞成投票和0.40次反对投票。此外,大约30%的评论至少收到一个回复,这表明了高水平的互动性。赞成票是反对票的四倍,这种模式在此前研究中很常见[4,38]。因为数据依赖于需要聚类标准误差的数据,并且为了实现我们解释效应的异质性而非简单估计其本身的平均效应的目标,大样本量是必要的。这个样本量大致允许我们检测到结果率相对变化约1%的互动效应。
我们的实验揭示了身份线索对赞成投票和回复评论有着正面的平均影响。但是,最有意义的变化是在评论者之间和评论者内部影响的异质性。此前的工作表明了探索这种异质性的重要性,因为不同人或群体之间不同方向的噪音会被抵消,在某些情况下导致平均效果接近零[39]。在我们的案例中,对于一些评论者来说,显示他们的身份会使观众给其内容点赞和回复的可能性大大增加。而对其他人来说,身份线索则有明显的负面作用,减少了赞成投票,增加了反对投票,并降低了回复率。当我们探索这种异质性时,我们发现身份线索帮助用户储存了内容生产者产生的几种类型的“(社会)资本”的信息。
通过频繁和(主题)一致的内容生产所建立起来的文化资本(cultural capital),对身份线索对赞成投票和回复率的影响起到了积极的调节作用。“文化资本”已经被概念化了,布迪厄(Pierre Bourdieu)认为文化资本代表一种在社会地位文化中的能力,它的状态是客体化的,如“图片、书籍、字典、工具、机器”等文化产品,或是具身化的,如学历(类似经济学文献常见的“人力资本“)”。更具体地说,我们的结果表明了无形文化资本的重要性,Throsby将其描述为“一套思想、实践、信仰、传统和价值观,它们有助于识别并将特定人群与该群体的思想和传统及其相关文化结合在一起”(见[41]第7页)。在我们的语境下,这种文化资本体现为通过帖子和评论在网络社区表达内容、想法和对话中。因此,频繁和一致的内容生产者,通过他们的帖子和评论为社区贡献了更多的无形文化资本,他们从身份暴露中获益,而不频繁和不一致的生产者则受到身份识别暴露的伤害。
社会资本(social capital),是通过积累“与拥有或多或少的相互认识和认可的制度化关系的持久网络有关的资源”(见[40]第249页)而被建立和被衡量的,并积极地调节了身份线索对赞成投票和回复率的影响。在我们的语境下,社会资本是通过投票和回复行为的互惠性来衡量的,其中互惠性是对制度化关系的体现和承认。
由于社会资本有助于群体的协调和合作[42],并为个人提供了在智力、社会或经济市场上积累回报的手段[43],因此身份也可以通过个体借助其组织协调合作,用于为智力、社会或经济资源的交换分配信用。因此,提供身份线索应该能够实现互惠,而且在我们的实验中,身份曝光确实更多地增加了互惠关系的赞成投票和回复率。
最后,正如越来越多的关于“富者愈富”动力学的研究所预测的那样[44,45],特别是那些在具有社会影响力的网络社区[46]中展开的研究,声誉获得了积累。声誉方便地储存了一个社区过去对社区成员内容生产质量的判断信息。然后,身份认同将这些声誉与特定的人联系起来。随着社区通过分数和评级积累在线数字声誉摘要,用户可以依靠启发式处理来基于内容制作者先前声誉来评估内容。在我们的实验中,那些内容被更经常点赞的用户,其身份线索对后续赞成投票和回复有积极影响。正如我们将讨论的那样,这表明有可能出现富者愈富的动力学,因为正反馈会增强声誉,而声誉会增强正反馈。但是,我们相对局部的处理只能说明在某些假设下的长期声誉积累,我们将在下面澄清这些假设。
我们的方法是将大规模的实验与实验后的建模相结合,即展示身份效应如何随个人和群体的特征而变化,这使我们能够在群体的基础上估计身份的因果效应——了解哪类用户的身份线索最有影响力,对哪些观众最有影响力。我们的结果有助于为理论提供信息,说明身份效应如何以及在多大程度上随着理论动机的维度而变化。例如,我们用用户在投票或回复前所花的时间作为启发式和系统性处理的代理,表明缺乏身份线索会迫使观众进入系统性处理而不是启发式处理,从而增加投票和回复行为的思考时间。
总之,我们的结果强调了身份线索的作用,它是观众用来帮助评估他们将如何投票和参与评论的启发式方法。随着质量期望和地位与身份紧密地交织在一起,身份线索会基于谁在制作或分享内容来推动对在线内容的启发式评估。身份效应的大小很重要,占与评论者的产量、声誉和互惠投票相关的投票变化的28%到61%。如果身份线索能够为复杂的在线状态区分提供脚手架,那么平台设计者和广告商就可以对其进行分析,以掌握观点聚合过程如何反映内容质量与用户之间的关系。
2. 结果
作为一个活跃网站的实地实验,我们的研究具有复杂的依赖结构和潜在的可能产生偏差估计的溢出效应。我们的观察单位是对一条评论的曝光,浏览者可以选择赞成投票、反对投票或回复评论。对于接下来的所有估计,我们使用对浏览者和评论者(或互惠结果的浏览者-评论者对)具有固定效应的线性模型,在方法的“基线模型规范”(baseline model specification)中描述,所有标准误差都集中在浏览者和评论者层面。在几乎所有的情况下,我们都讨论了一个被称之为“身份效应”(identity effect)的反事实变量,它反映了当身份线索出现在一次曝光中时,与没有出现时相比,人们所期望发生的差异。更强的效应意味着身份线索对观众决策的影响更强。
我们以每次曝光的百分比(pp)为单位展示所有的效果,这可以解释为我们期望在评论的100次曝光中互动(投票、回复)的变化。平均而言,评论收到36次曝光,1.54次赞成投票,平均0.4次反对投票,0.34次回复。为了提供一种尺度缩放的视野,假设0.500 pp的效应在36次曝光中是统一的,这将导致评论的0.18个额外的预期互动,这意味着赞成票数增加12%,反对票数增加45%或回复增加53%。这些效应在曝光中的相加放大在我们的实验设计中无法检测的,因为我们没有持续地将相同的评论分配给相同的条件。然而,以前的工作已经证明,评论中出现的赞成投票会导致未来赞成投票的可能性增加[4]。
平均身份效应
我们用一个带有对浏览者和评论者有固定效应的线性概率模型来估计身份的平均效应。平均而言,身份的存在大大增加了赞成投票(P=0.196 pp,95%置信区间(CI)=(0.018,0.374), P=0.031)和对评论的回复(P=0.066 pp, 95% CI=(0.041,0.091), P<0.001)。这些影响表明,与匿名条件下的曝光相比,已识别的曝光的每一次赞成投票和回复分别增加了约5%和7%。对反对票的影响是正面的,但没有统计学意义(P=0.054 pp, 95% CI=(-0.013, 0.121), P=0.112)。
身份效应的异质性
我们利用实验的纵向性质来研究评论者内部的异质性及其对调节身份效应的影响。我们为每个浏览-评论样本对,都创建了三种异质性的衡量标准,反映了上述说服的相关理论以及社会资本和文化资本的形式——
(1) 生产量Production:评论者在观众接触到某评论之前的L天内所写的评论数量。对于L=3即前三天中,评论生产量通常在0到100之间变化,评论者生产量的分布也有一个可达200以上的长尾。
(2) 声誉量Reputation:在观众接触到某评论之前的L天内,评论者在其评论上得到的平均分数(赞成投票减去反对投票)。这个衡量标准倾向于介于一个小的负值(对于写过反对票的评论者)和一个小于10的中等的正值之间。
(3) 互惠性Reciprocity:评论者在浏览者接触到某评论之前的L天内,对浏览者的评论所给予的平均分数(赞成投票减去反对投票)。这个指标在[-1, 1]范围内,反映了最极端的配对投票行为。
表1:各个结果的固定效应线性回归模型结果
在表1中,我们报告了线性模型的估计值,这些模型正式测试了身份的存在和尺度调节器变量之间是否存在显著的相互作用。为了补充模型的估计值,在图1中,我们通过将观察结果分组并计算组内效应估计值,以图形方式描述了调节器和身份效应之间的关联。这是对可由我们的措施解释的身份效应的异质性的一种可视化。下面两个小节描述了这些发现。
图1:调节协变量的值与身份对交互的影响之间的关联。
每个 y 刻度都有不同的范围。每个点都是协变量的分箱值(binned value),y 轴表示该分箱内的处理效果。分箱之间的样本大小差异很大。最佳拟合线由对每个分箱有贡献的观测值的数量加权,大致与表 1 中显示的斜率相同(但不完全是因为忽略了固定效应)。N =12,583,408 用于描述产量和声誉。N =1,094,177 表示互惠性。
产量和声誉
我们观察到,评论者产量的增加会导致对其评论的投票产生更强的身份效应,无论是在正向还是负向。我们估计,生产量每增加1%会导致赞成投票增加0.127%(95% CI=(0.047, 0.207), P<0.001),反对投票增加0.064%(95% CI=(-0.005, 0.133), P=0.067)。在近期内增加评论与小但重要的身份效应有关,导致收到更多的投票。回复也有0.019%(95% CI=(-0.041, 0.003), P=0.085)的非常小的负面效应,尽管图1表明这可能是由离群值驱动。
声誉是身份效应的一个重要调节因素。较高的声誉指标与较高赞成票有0.163%(95% CI=(0.061, 0.265), P < 0.001)的相关性,与较低赞成投票有-0.199%(95% CI=(-0.332, -0.066), P < 0.001)的相关性。这些影响在绝对量级上是相似的,但身份效应解释了具有+1平均数的评论者的赞成票数增加的0.163/(0.163+0.424)=28%和反对票数减少的0.199/(0.199 + 0.129)=61%。图1描述了正面和负面声誉分数之间的轻微不对称性,并表明声誉的极端值的影响更强。
对于回复,声誉和身份效应之间的联系既不是线性的也不是单调的。线性模型估计值非常小,而且不显著,但图1表明,对于非常低和高的声誉测量,有很大的负面身份效应。
互惠性
互惠性的测量很稀少,只有8%的评论者-浏览者对在之前的L=3天内有互惠的投票。因此,这里的样本要小得多。对于赞成投票和反对投票,我们看到强有力的证据表明,身份线索的存在促成了互惠投票。如果评论者在过去三天里对浏览者的所有评论都投了赞成票,那么身份的影响是额外的2.495%(95% CI=[0.68, 4.31], P = 0.007),或者如果评论者每次都投了反对票,那么赞成票就会减少2.495%。
一致性对反对投票的身份效应与我们的互惠措施呈负相关,最积极的互惠关系与反对投票的-1.183%(95% CI = [-1.904, -0.462], P < 0.001)效应相关。图1为这一估计值提供了一些细微的差别,表明一般来说,负面的互惠关系(评论者经常给观众投反对票)推动了这一估计值,最极端的一对关系在身份信息导致的反对投票中增加了80%。
由于我们的固定效应规范,该估计值来自相同的用户对之间互动的纵向变化。其解释是,身份效应的开启或关闭取决于两个用户之间最近的互动情况。
无论是在线性模型中还是在图形上,我们都没有观察到互惠和身份效应对回复的影响具有关联。
投票前的时间
对于5.3%的以投票为结束的评论曝光事件,我们计算了投票的持续时间——用户花了多长时间阅读评论并对其投票。图2a显示了实验中投票时间的分布,截断为10分钟。在匿名条件下,与确定身份的曝光相比,发生在1-10秒内的投票的密度较低。
图2:投票持续时间的分布和估计的身份效应。a,以投票发生为条件的投票持续时间的核密度估计值。b,固定效应回归的估计值,用于测量身份二元变量的影响,代表投票是否在某个阈值内发生。当身份信息出现时,观众在5秒内投票的可能性增加0.1%,在7秒内投票的可能性增加近0.2%(绝对值)。误差条代表95%置信区间CI,标准误差聚集在浏览者层面。N=672,464.
我们拟合了一个固定效应线性概率模型来估计身份对投票是否在某个阈值时间内发生的影响,条件是投票发生,用浏览者的固定效应来说明浏览者投票时间的异质性,并在浏览者层面进行标准误差的分组。图2b显示了我们对S秒内(S=1, 2,……,15)浏览者对评论投票的概率的身份效应的估计。我们发现,在一定的阈值范围内,效果估计是有统计学意义的——当身份信息出现时,浏览者在5秒内投票的可能性增加0.1%,在7秒内投票的可能性增加近0.2%。
这些结果表明,身份线索的存在促进了观众更快的评价。在两种实验条件下,不同类型的评论都可能会得到投票。因此,我们不能将这一效应完全归因于我们的实验操作,因为我们必须以评论获得投票为条件,而且在我们的两种条件下,哪些评论获得投票可能存在未观察到的差异。但是,这一证据与身份线索允许观众在投票任务中对信息内容进行启发式处理是一致的。
3. 平台启示
富者愈富的动力学
研究结果中的“产量和声誉”表明,身份线索导致一些评论者(那些具有高产量和高声誉的评论者)获得更多的赞成票和更少的反对票。特别是,具有高声誉量的评论者,由于显示了他们的身份,每次曝光的赞成票数都会增加,而且有证据表明这可以通过其评论得分而导致额外的赞成票数的社会影响[4]。
主要的异质效应结果只捕捉到了每次曝光的正向身份效应,这可能不会导致评论者在存在自我修正的动力学情况下持续收到比其潜在质量更好或更差的反馈——如果有足够大比例的观众不受身份线索的影响,而只根据评论的质量来评分[48]。此外,评论者会从声誉调节的身份效应中获益,也会从他们的评论获得的较高分数中放大社会影响偏差[4]。虽然我们研究的语境中并没有对内容进行排名,但如果对评论使用了排名系统,那么被投票的评论也有可能获得更多的曝光,从而获得更多的投票[49]。
如果我们把“质量”定义为在匿名曝光中获得的最高票数,那么富者愈富的动力学(在95%置信区间下)意味着评论者的内在质量和他们的最高票数之间存在差异的长期均衡。补充章节A.8显示了我们数据集中149个最活跃的评论者的特定身份效应,如果我们观察到一个评论者至少有16,210次曝光,就认为他是活跃的,这足以检测出在2%的基准比率下对投票有1%的影响。利用5%的匿名样本来衡量他们的内在“质量”,利用95%的识别样本来估计他们的身份在网站动力学中的近似均衡作用,我们发现149个评论者中的28个表现出身份对赞成投票的影响,达到5%的显著水平,大大超过了我们的偶然预期(P=0.0006)。
这些评论者可能受益于他们在加入这个社区之前的社会资本,但这个平台是假名的。他们也可能是受益于互惠投票模式,而不是声誉的影响,但我们估计只有大约8-13%的曝光是在有互惠投票的评论者之间。我们的研究持续时间较长(22个月), 表明对于长时间活跃的评论者来说,这些是合理的均衡估计。
由于我们的设计只有5%的匿名曝光,在浏览者-评论者层面上是随机的,而且没有一个可以捕捉外溢效应和长期效应的聚类结构,因此我们的实验无法评估在身份线索不那么突出(或不存在)的情况下会出现哪种动力学[50]。补充章节A.8中评论者层面的估计值并不与他们在一个具有不同身份政策的假设平台上获得的互动进行比较。这种效应可以通过引文[47]中开创的“多重世界”设计来估计。这将为我们的结果提供一个重要的补充。在牢记这些注意事项的情况下,这些结果与局部处理效果相结合,强烈地表明在我们的环境中,由身份线索效应引起的富者更富的动力学是存在的。
来自匿名曝光的算法排名
用户产生的内容平台(UGC),如我们所研究的社交新闻网站,通常使用用户提供的投票对内容进行算法排名,并优先考虑收到更多正面和更少负面反馈的类型。这可以实现为内容层面的分数或评论者层面的分数,这些分数可以捕捉到用户通常得到的反馈类型。此外,早期的投票会影响后续投票者的观点,并可能导致羊群效应[4]。虽然我们研究的环境是按时间顺序显示评论,但平台可以选择实施一个排名系统,以改善观众的评论,并通过创造一个更好的内容社会规范来提高用户生成的内容贡献的质量[49]。
在本节中,我们提出了一个简单的模型,用于根据先前的评论者投票对评论进行排名,并通过模拟显示,如果平台的目标是优化匿名评论上的更多正面投票和更少负面投票,那么基于已识别的曝光的投票的排名可以被基于匿名曝光的投票的排名所改进。
假设评论是由用户给评论投赞成票或投反对票的估计概率的凸组合来评分的:αPr(赞成票 | 评论者) - (1-α)Pr(反对票 | 评论者)。我们估计评论者在其评论上收到赞成票和反对票的概率,以建立一个以α为参数的简单声誉系统。我们比较了两种估计这些评论者特定概率的方法,即利用评论者在已识别的曝光上收到的反馈来估计投票概率,或只使用匿名曝光。然后我们模拟浏览者根据这种算法阅读前50、100和200条评论。在图3中,我们绘制了在不同的α值下从模拟中得到的每条评论的赞成和反对的数量,α值控制着赞成票数量多于反对票数量的程度。
图3:算法排名模拟。
垂直面板显示了用户根据一个月期间收集的反馈对排名靠前的评论的前 50、100 和 200 条评论生成的模拟匿名反馈。我们通过设置参数 α ∈ [0, 1] 来权衡提高赞成票和限制反对票,该参数沿图的 x 轴变化。更好的策略往往会在每条评论中获得更多的赞成票和更少的反对票。我们得出结论,基于对已识别身份的评论的投票进行排名对于赞成票(上图)同样具有信息效应,但对匿名评论使用评级对于限制收到匿名反对票的评论(下图)更具信效应。
模拟的结果显示在图3中。使用匿名曝光来估计概率,对于让将获得赞成票的评论上浮提供了类似效果,但在让不太可能获得反对票的评论上浮方面,表现一致地更好。这与我们在“结果”小节中的“一致性”中的发现是一致的,这表明大量的反对票是由被识别条件下的评论者之间的关系驱动的在身份信息存在的情况下产生的负面反馈,将关于内容本身的负面反馈与基于先前关系的二元信号混为一谈。
如果平台提供者认为对匿名内容的反馈提供了更好的基础真相——对内容质量的较少偏见的评估——那么他们可以通过随机对一些观众的内容进行匿名,并捕捉其反馈,特别是负面反馈,来获得有价值的排名和评价信号。
表2:实验汇总统计。虚线表示我们无法通过处理状态来计算该统计数据。
我们接下来讨论我们的发现的广泛意义。表2列出了实验的汇总统计。方法中的“平衡检查”提出了随机化检查,图4中检查了新颖性的影响。潜在的干扰在图5中被检查。
图4. 实验中每个月的身份的平均处理效果。固定效应模型估计在实验期间每个月对赞成、反对和回复的平均处理效果。线条表示 95% 置信区间CI。标准误差聚集在浏览者-评论者层面。N = 12,583,408。
图5. 因果图,指示我们测试的干扰以及我们通过假设排除的类型。
在这里,处理状态Dj1有三个潜在的效果。首先是Yij1,直接效应(实线)和本文的主要关注点。其次是Yi'j2,对观众对同一篇文章的相邻评论行为的溢出效应(虚线)。第三,关于Yi'j3,(更间接的)溢出效应(虚线)对观众对其他文章的评论的行为。我们将干扰部分用于理解第二种效应,并假设第三种效应不存在。
4. 讨论
社交媒体中的身份线索传达了关于内容创作者的丰富信息,以及浏览者与他们的关系。我们的实验表明,这些信息的存在会导致浏览者如何处理他们看到的内容,以及随后他们如何投票和是否回复。我们提出了三个衡量标准,这些标准是由以前关于评论者和其与评论观众关系的文献所激发的,它们反映了评论者参与社区的三种主要方式:通过撰写评论(生产),通过撰写获得较高/较低得分的评论(声誉),以及通过对其他人的评论投票(互惠)。我们发现一致的证据,所有这三种措施都与对评级的身份效应的差异有关。观众的投票决定由于身份线索的可用性而发生变化,而这种影响显然取决于他们对评论者的了解。
通过对投票速度这一结果的调查,我们了解到,身份线索会导致更快的投票,这与使启发式处理取代高认知成本的内容评估方式相一致。综上所述,我们的结果描绘了一幅身份线索在社区内作为社会支架运作的画面,为评论者提供了关于评论者最近活动、以前的评论投票和相互投票模式的隐性信息,这反过来又改变了浏览者对评论者内容的评价。
从社会科学的角度来看,考虑统一提供或隐藏身份线索的平台的反事实,对于可以选择突出哪些和多少关于他人的信息的平台来说,既有理论价值,也有实际价值[51]。虽然我们的实验分离出了身份线索塑造观点动力学涌现行为的具体机制,但各种反馈回路的合理性使得将我们的发现推断到平台层面的反事实(如实名制政策的整体效果)具有挑战性,在这种情况下,身份线索被普遍提供或隐藏。也就是说,我们的结果与身份线索介导的“马太效应”大体一致,与身份效应较弱的世界相比,它将正反馈集中在一个较小的群体中。最近有高票的评论者收到的高票明显更多。我们从之前的工作中得知,这些较高的分数会导致更多的赞成票数[4],如果评论被算法排名,这些评论者很可能会因为他们收到的积极反馈而享有更多的知名度[49]。所有这些都表明,当身份信息突显时,有富者愈富效应。
身份线索在网上无处不在,加上对其对观点和社区动力学的影响缺乏因果关系的了解,突出了我们发现的重要性。社交平台已经推行了有争议的“实名制”政策,试图遏制网上的有害言论。但是,一些国家,如德国,已经裁定这种识别政策违反了隐私法。在我们努力解决网上身份识别的公共政策时,我们必须了解身份线索对观点和社区动力学的影响。身份效应占与本研究相关的投票变化的28-61%,影响内容评价的动力学,改变对内容进行排名的反馈机制,并促进健康的互动。本工作强调了在平台和政策制定者决定何时以及如何识别在线互动,更深入地了解身份线索效应的重要性。
参考文献
1. Burns, W. Is it time to require identity verification for everyone using social media? Forbeshttps://www.forbes.com/sites/willburns/2018/02/22/is-it-time-to-require-identity-verification-for-everyone-using-social-media/?sh=74308aec8683 (2018).
2. Salganik, M. J. & Watts, D. J. Leading the herd astray: an experimental study of self-fulfilling prophecies in an artificial cultural market. Soc. Psychol. Q.71, 338–355 (2008).
3. Lorenz, J., Rauhut, H., Schweitzer, F. & Helbing, D. How social influence can undermine the wisdom of crowd effect. Proc. Natl Acad. Sci. USA108, 9020–9025 (2011).
4. Muchnik, L., Aral, S. & Taylor, S. J. Social influence bias: a randomized experiment. Science341, 647–651 (2013).
5. Chaiken, S. Heuristic versus systematic information processing and the use of source versus message cues in persuasion. J. Pers. Soc. Psychol.39, 752–766 (1980).
6. Chaiken, S. in Social Influence: The Ontario Symposium Vol. 5 (eds Zanna, M. P. et al.) 3–39 (Lawrence Erlbaum Associates, 1987).
7. Hass, R. G. in Cognitive Responses in Persuasion Vol. 2 (eds Petty, R. E. et al.) Ch. 7 (Lawrence Erlbaum Associates, 1981); https://doi.org/10.4324/9781315803012
8. Walther, J. B. Relational aspects of computer-mediated communication: experimental observations over time. Organ. Sci.6, 186–203 (1995).
9. Walther, J. B. Computer-mediated communication: impersonal, interpersonal, and hyperpersonal interaction. Commun. Res.23, 3–43 (1996).
10. Resnick, P., Kuwabara, K., Zeckhauser, R. & Friedman, E. Reputation systems. Commun. ACM43, 45–48 (2000).
11. Pavlou, P. A. & Gefen, D. Building effective online marketplaces with institution-based trust. Inf. Syst. Res.15, 37–59 (2004).
12. Moon, J. Y. & Sproull, L. S. The role of feedback in managing the Internet-based volunteer work force. Inf. Syst. Res.19, 494–515 (2008).
13. Wetzer, I. M., Zeelenberg, M. & Pieters, R. “Never eat in that restaurant, I did!”: exploring why people engage in negative word-of-mouth communication. Psychol. Mark.24, 661–680 (2007).
14. Wood, W. Attitude change: persuasion and social influence. Annu. Rev. Psychol.51, 539–570 (2000).
15. Cialdini, R. B. & Trost, M. R. Social Influence: Social Norms, Conformity and Compliance. The handbook of social psychology, McGraw-Hill, 151–192 (1998).
16. Chaiken, S., Wood, W. & Eagly, A. H. Principles of Persuasion. Social psychology: Handbook of basic principles. Guilford, 702–742 (1996).
17. Chen, S., Shechter, D. & Chaiken, S. Getting at the truth or getting along: accuracy- versus impression-motivated heuristic and systematic processing. J. Pers. Soc. Psychol.71, 262–275 (1996).
18. Lundgren, S. R. & Prislin, R. Motivated cognitive processing and attitude change. Pers. Soc. Psychol. Bull.24, 715–726 (1998).
19. Petty, R. E. & Wegener, D. T. Matching versus mismatching attitude functions: implications for scrutiny of persuasive messages. Pers. Soc. Psychol. Bull.24, 227–240 (1998).
20. Tajfel, H. Social psychology of intergroup relations. Annu. Rev. Psychol.33, 1–39 (1982).
21. Turner, J. C. Social Influence (Thomson Brooks/Cole, 1991).
22. Flache, A. Models of social influence: towards the next frontiers. J. Artif. Soc. Soc. Simul.https://doi.org/10.18564/jasss.3521 (2017).
23. Aral, S. & Walker, D. Creating social contagion through viral product design: a randomized trial of peer influence in networks. Manag. Sci.57, 1623–1639 (2011).
24. Aral, S. & Walker, D. Identifying influential and susceptible members of social networks. Science337, 337–341 (2012).
25. Bakshy, E., Eckles, D., Yan, R. & Rosenn, I. Social influence in social advertising: evidence from field experiments. In Proc. 13th ACM Conference on Electronic Commerce 146–161 (ACM, 2012); https://doi.org/10.1145/2229012.2229027
26. Aral, S. & Walker, D. Tie strength, embeddedness, and social influence: a large-scale networked experiment. Manag. Sci.60, 1352–1370 (2014).
27. Tucker, C. Social Advertising: How Advertising that Explicitly Promotes Social Influence Can Backfire. SSRNhttps://doi.org/10.2139/ssrn.1975897 (2016).
28. Bakshy, E., Rosenn, I., Marlow, C. & Adamic, L. The role of social networks in information diffusion. In Proc. 21st International Conference on World Wide Web 519–528 (ACM, 2012).
29. Bapna, R. & Umyarov, A. Do your online friends make you pay? A randomized field experiment on peer influence in online social networks. Manag. Sci.61, 1902–1920 (2015).
30. Luc, J. G. Y. et al. Does tweeting improve citations? One-year results from the TSSMN prospective randomized trial. Ann. Thorac. Surg.111, 296–300 (2021).
31. Forman, C., Ghose, A. & Wiesenfeld, B. Examining the relationship between reviews and sales: the role of reviewer identity disclosure in electronic markets. Inf. Syst. Res.19, 291–313 (2008).
32. Ma, M. & Agarwal, R. Through a glass darkly: information technology design, identity verification, and knowledge contribution in online communities. Inf. Syst. Res.18, 42–67 (2007).
33. Shalizi, C. R. & Thomas, A. C. Homophily and contagion are generically confounded in observational social network studies. Sociol. Methods Res.40, 211–239 (2011).
34. Toubia, O. & Stephen, A. T. Intrinsic vs. image-related utility in social media: why do people contribute content to twitter? Mark. Sci.32, 368–392 (2013).
35. Taylor, S. J., Bakshy, E. & Aral, S. Selection effects in online sharing: consequences for peer adoption. In ACM Conference on Electronic Commerce 821–836 (ACM, 2013); https://doi.org/10.1145/2492002.2482604
36. Bertrand, M. & Mullainathan, S. Are Emily and Greg more employable than Lakisha and Jamal? A field experiment on labor market discrimination. Am. Econ. Rev.94, 991–1013 (2004).
37. Edelman, B., Luca, M. & Svirsky, D. Racial discrimination in the sharing economy: evidence from a field experiment. Am. Econ. J. Appl. Econ.9, 1–22 (2017).
38. Hu, N., Zhang, J. & Pavlou, P. A. Overcoming the J-shaped distribution of product reviews. Commun. ACM52, 144–147 (2009).
39. Kahneman, D., Sibony, O. & Sunstein, C. R. Noise: A Flaw in Human Judgment (Little, Brown, 2021).
40. Bourdieu, P. in: Handbook for Theory and Research for the Sociology of Education(ed. Richardson, J.). Greenwood Press, 241–258 (1986).
41. Throsby, D. Cultural capital. J. Cult. Econ.23, 3–12 (1999).
42. Putnam, R. The prosperous community: social capital and public life. The American Prospecthttps://prospect.org/infrastructure/prosperous-community-social-capital-public-life (1993).
43. Lin, C.-S. & Chen, Y.-F. Examining social tagging behaviour and the construction of an online folksonomy from the perspectives of cultural capital and social capital. J. Inf. Sci.38, 540–557 (2012).
44. Simon, H.A. On a class of skew distribution functions. Biometrika42, 425–440 (1955).
45. Merton, R. K. The Matthew effect in science. Science159, 56–63 (1968).
46. Barabási, A.-L. & Albert, R. Emergence of scaling in random networks. Science286, 509–512 (1999).
47. Salganik, M. J., Dodds, P. S. & Watts, D. J. Experimental study of inequality and unpredictability in an artificial cultural market. Science311, 854–856 (2006).
48. Van de Rijt, A. Self-correcting dynamics in social influence processes. Am. J. Sociol.124, 1468–1495 (2019).
49. Berry, G. & Taylor, S. J. Discussion quality diffuses in the digital public square. In Proc. 26th International Conference on World Wide Web 1371–1380 (ACM, 2017); https://doi.org/10.1145/3038912.3052666
50. Taylor, S. J. & Eckles, D. in Complex Spreading Phenomena in Social Systems (eds Lehmann, S. & Ahn, Y. Y.) 289–322 (Springer, 2018); https://doi.org/10.1007/978-3-319-77332-2_16
51. Sun, T. & Taylor, S. J. Displaying things in common to encourage friendship formation: a large randomized field experiment. Quant. Mark. Econ.18, 237–271 (2020).
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「我的集智」推送论文信息。
原标题:《社交媒体中的身份效应:决定你点赞的是内容还是人?》