顾楚丹|华东理工大学社会学系讲师、博士后

杨发祥|华东理工大学应用社会学研究所所长暨社会学系教授

本文原载《探索与争鸣》2023年第5期

具体内容以正刊为准

非经注明,文中图片均来自网络

社交媒体平台对文化生活的社会、制度和经济渗透从根本上改变了文化内容的生产、分发和商品化。文化生产的平台化模糊了传统媒体形式之间的界限,并带来用户生成内容生产的指数级增长,涌现了各种不同领域和类型的具有灵活、灵气和灵捷特征的“数字灵工”。所谓数字灵工,指依托互联网平台进行文化内容创作,提供线上文化服务的青年群体,如音频播客、视频博主、自媒体创作者等。其中,内容生产的关键是通过创造性的内容获得尽可能多的在线流量,而算法被用来回答(并制定)这个问题:什么应该被显示,以及对谁可见?在社交平台自我塑造职业生涯的可能,也让“数字灵工”逐渐将其内容生产和流通策略,转向决定其内容推荐、排名和受众的算法。在计算机学科视野下,算法是根据指定计算将输入数据转化为输出结果的一套编码程序。所谓的“算法转向”是“目前影响媒体行业的最明显和潜在的重大转变”之一,正如James Gleick在《信息》中所言,“20世纪赋予了算法一个中心角色”。但由于算法非常复杂且不透明,对其认知和理解有技术门槛,更是平台企业核心的商业机密,普通用户在面对算法黑箱时通常只能为算法逻辑所驯化,丢失了其作为行动主体的自主性。与此同时,绕过算法的技术黑箱,越来越多的研究从用户的经验参与入手,发现用户在与算法互动过程中展现的能动性和自主性,甚至能够影响系统层面的设计变化和平台组织制度的再生产。

面对算法权力与行动者主体性之间的张力,亟需从用户视角出发,理解人们对算法系统的思考和由此产生的影响。“数字灵工”作为活跃用户,与算法接触的频率和广度都更深入,对算法的感知和理解也更深刻。基于此,本文拟以“数字灵工”的算法实践为分析对象,探究算法的具体运行逻辑和算法关联行动者的算法使用文化,为理解算法是用户与平台关联的互构探寻理论基础。

框架与方法:算法作为一种实践

目前学界对算法的研究主要形成了三条研究进路,即“算法权力”“算法文化”和“作为文化的算法”,这三条研究路径分别呈现了“数字灵工”不同程度的主体性。

(一)从“算法想象”到“算法游戏”:“数字灵工”的算法实践

“算法权力”研究进路关注算法在特定机构的复杂决策制定、解决管理技术问题、创造性思维以及营销战略等方面起到的作用。例如算法可以通过自动分类进行自动决策,从而替代传统人工进行的规制。算法作为社会权力来自“完成给定任务的控制结构”。在算法权力视角下,社交平台的推荐算法可以通过行使“流量奖励”和“不可见的威胁”来影响“数字灵工”的自主权和内容生产。比如对短视频创作者的研究发现,他们依赖于算法带来的螺旋效应,在主体定位、内容策划、数据运营、内容分发等方面,为算法运行逻辑所渗透与驯化。对社交平台内容生态的批判也反映了内容创作者对算法的敏感和刻意迎合算法规则,才导致哗众取宠的低俗内容层出不穷。在这一研究进路中,研究者主要关注算法对创作者内容生产的驯化和规制作用。

“算法文化”(algorithmic culture)研究进路旨在探究算法对社会生活产生的意义,关注被大数据和计算逻辑改变的人类长期以来的实践、体验和理解方式。比如Bucher研究Facebook用户时指出,“算法想象”(algorithmic imaginary)可以用来缩小用户对日常算法系统理解上的差距,进而在特定的算法时刻理解有关算法的信息片段和运作方式。Bishop用“算法八卦”(algorithmic gossip)的概念来研究YouTube美妆博主的算法想象,突出了“算法想象”的自下而上的社群组织对算法知识和实践与算法权力对抗的可能。在进一步的研究中,更多的学者发现个人与算法的有意识互动可能会调节算法决策和行动的能力。关注人与算法的相互关系,并试图在算法操作中感知人类意义构建,“作为文化的算法”强调算法的实践特质开始得到重视。这一观点指出算法和文化一样,都是在与人类相互实践基础上制定的,其本身就是不稳定的对象。比如“玩可见性游戏”(playing the visibility game)的比喻和“时髦的武器”都突出了社交媒体上的微名人与算法架构的有意识互动,他们采取系列算法策略来挑战算法自动化的内容排序,优化他们的可见度,并将其作为一种新兴的抵抗形式,积极参与算法系统的构建。

关于“数字灵工”与算法互动的相关研究呈现了用户对算法认知的提升,共同强调用户在算法环境中的主体性。但现有的研究存在以下三个方面的不足:首先,并不存在一个整体、稳固、一维的算法,算法是复杂、多维且动态的。算法乃是社会实践的结果,算法的“物质性”属性应成为理解算法实践的一个关键概念。“新物质主义”理论提倡的物质所具有的活力、动态性、能动性等属性应予以重视。其次,“数字灵工”是跨平台、多媒介的使用者这一事实常被忽视。也就是说,平台作为重要的变量应纳入算法研究的范畴。不仅如此,“算法”在不同社交平台上的表现也各不相同,不同社交平台比如Facebook和Twitter的算法民间理论就展现了跨平台的背景下不同语境中社会性层面的算法解释。最后,尽管在数字灵工与算法的互动过程中,我们越来越频繁地看到人机关系呈现了一种“双向驯化”的新动态,但是“双向”驯化是如何形成的,又体现在哪些方面,产生了怎样的影响和后果,尚待深入研究。

基于此,本文拟在沿袭“作为文化的算法”研究路径的基础上,从实践逻辑理解算法,具体研究内容如下。首先,探明算法的物质性与能动性,这是算法作为技术的抽象特质、实践特质所在。笔者将以个性化推荐算法为例,考察建构算法的物质基础和技术形貌的“黑箱”实存样态,对不同社交平台的“推荐列表”进行对比,展现算法差异化的运用模式和可见性的管理,呈现算法的能动性。其次,阐述算法关联行动者的算法使用文化。推荐系统的参与者主要包括用户、内容生产者和平台。用户和内容生产者作为多平台的使用者,对不同平台有各自的偏好,因而可能形成不同的算法使用文化类型,对行动者的差异化的算法解释逻辑进行考察,可以呈现关联行动者的实践特质。最后,探讨算法实践的后果。实践是物质性与社会性交织(算法“能动性”与人的“意图性”)的空间。笔者将从算法实践的双重后果来考察以“数字灵工”为代表的人类行动者在算法实践中的多重不确定性,以及算法作为非人类行动者面临的多重挑战,揭示算法与使用者之间的关系机制——互构。算法因其实践特质之一的物质性而具有互构性,算法使用者也因算法主导了内容可见性的管理而具有互构性,两者在文化生产的平台化过程中形成互构。

(二)研究方法与资料来源

本文聚焦 “数字灵工”的算法实践,主要采用网络多点案例研究、网络民族志以及深度访谈的方法收集研究资料。首先,选取当下国内“数字灵工”主要使用的四个社交平台IOS应用软件(新浪微博、小红书、抖音、哔哩哔哩)进行研究。应用walkthrough方法比较App的推荐界面和功能,通过分析应用程序的界面识别嵌入的文化价值,解读不同社交平台的界面设计、算法技术特性、内容形式。其次,从社交平台推荐算法的关联网络出发,采用目的性抽样与异质性抽样相结合的方式,以微信语音通话的方式收集了25位访谈对象的资料,包含平台方(内容审核、内容运营者、算法工程师等)和不同平台、不同类型、在行业中拥有不同程度“影响力”的“数字灵工”,探讨他们对平台和算法使用的不同认知、体验和感受。最后,通过加入“数字灵工”微信群,在社交平台的技术社区进行网络民族志的田野观察,结合行业报告、技术新闻报道、技术沙龙、开发者论坛上的讨论等收集算法的专业知识和特定群体对算法的认知。

编码:算法是物质性与能动性的综合体

算法的编码过程就是算法的物质性和能动性的形成过程,即推荐算法的运行逻辑实施和对内容可见性的再编辑过程。

(一)平台的“算法化”:个性化推荐算法的物质特征

个性化推荐算法被设计用来提升信息的收集和分发效率,帮助用户在大型内容目录中作出更好的选择,通过对用户过去的行为进行分析,预测用户的内容偏好,推荐用户(当前)感兴趣的内容。推荐算法本质是通过拟合三个维度的变量进行目标(点击率、观看市场等)预估。这三个维度的变量分别是:内容(图文、视频)、用户特征(年龄、性别、兴趣标签、用户交互行为)、信息环境特征(不同场景)。平台的“算法化”意味着,社交平台依赖于推荐算法管理内容的“可见性”,推荐算法具有数据依赖性、平台化和个性化的特征。

首先,推荐算法的数据依赖性。内容“可见性”的前提是依赖于数据反馈形成内容推荐闭环。也就是说,只有收集大量的数据进行分析和挖掘,并采集详细的特征工程(包括设备特征、应用特征、体验特征、用户特征、内容特征等),算法的开发才能开始。而输入算法的用户行为数据特征维度越多,算法预测也越准确,越能为用户作出更好的推荐。其中,用户行为数据(包括评分、点赞、点击、播放时长、评论等)是推荐算法最关键的数据,也是推荐算法实践的根本前提和实际建构过程的开端。通过数据收集与分析,算法可以去掉用户身份的物质和社会形式,通过聚类方法进行再类别化,形成“新的算法身份”和垂直领域(target vertical markets)。这潜藏着影响个体文化认同、身份识别,以及社会认同的框架。

其次,推荐算法的平台化。推荐算法是包含了从内容发布到点击的整个链路系统,推荐算法的逻辑是“机器+人工审核→数亿级内容池→万+内容多路召回→5000+内容简单模型粗排→500+内容深度模型精排→100+内容价值模型重排→千人千面个性化推荐页面”。用Seaver的话来说,“‘算法’根本不是算法,而是‘几十’个子算法的合集”。每一个子算法都剖析不同的内容(用户点击频率、过去偏好等),由主算法将子算法的输出编排成一个“合奏”。而随着大数据、人工智能和机器学习的发展,推荐算法也得到不断的增长和迭代,基于海量多模态数据的大模型算法架构成为社交平台的标配,使用深度神经网络综合了多种应用方式,比如基于内容的推荐系统、混合推荐系统,基于过滤器的推荐系统、功能推荐系统等。各大社交平台的推荐算法都开始依托自研的算法平台进行优化,比如小红书技术团队自研的LarC机器学习平台。算法平台涵盖从底层基础设施到计算框架、资源调度、离线应用、在线部署多个层面,能够在海量的多模态数据中挖掘用户感兴趣的内容和优质商业内容实现千人千面的实时推荐。

最后,推荐算法的目标个性化。它包含算法输出内容的用户个性化和算法价值目标的平台个性化两个方面的内容。算法的运行机制是“数据需求—数据开发—特征采集—业务开发—部署发布—业务触发—算法应用—结果处理”。可以看到,平台业务驱动了算法进行优化和迭代,平台制定了推荐的规则和策略。平台企业的公共性技术中介和商业经济体的双重身份,意味着算法运行需要平衡内容生产与消费的供需关系,实现利益调和,也暗示着算法的功能可能从帮助用户选择内容转向最大限度地吸引用户、留存用户、增加用户粘性、提高市场份额、吸引广告投放、拓宽商业模式,从而达到商业营收持续增长的目的。我们可以把这种观点称为“克兰德尔的抱怨”:“如果你不能让算法对你有利,你为什么要建立和运行一个昂贵的算法?”算法服务于平台的商业逻辑和战略规划。

(二)算法的“平台化”:差异化的推荐列表

推荐算法的起点、逻辑和运行机制往往相似,但算法并不是普适的。从这个意义上来说,算法是一种“技术文化实体”,不仅仅是一种技术工具,而且逐渐形成了自身的技术文化与物质属性。对于用户而言,最能直观感知到算法呈现的乃是“推荐列表”,推荐列表的设计、运营和管理可以呈现应用的设计师、开发者、平台所有者希望如何接收内容,并将其整合在他们的技术使用实践中。行业从业人员和学术研究人员都认为,一个推荐系统的界面对用户推荐体验的影响可能远远大于推荐算法的性能。笔者拟通过比较不同社交平台App在推荐界面的结构布局、推荐内容集的组成和推荐解释三个方面的差异来呈现算法的能动性。(表1)

尽管四个社交平台App的首页都是“推荐列表”,但推荐界面的结构布局、内容呈现形式和推荐解释均存在差异。关注这一差异可以发现,算法不仅是用户个性化的,也是平台个性化的。此外,这一差异还将帮助我们洞察平台上内容“可见性”的逻辑,推荐算法形塑了不同平台的内容生产、文本形式、呈现方式和商业化模式。首先,推荐界面的模式反映了平台的推荐逻辑,决定了平台与内容创作者的权力地位。双列模式的推荐逻辑是“你选想看的”,而单列模式的推荐逻辑是“猜你喜欢的”。前者需要用户的主动选择也意味着用户对于原创内容及其创作者有一定粘性,内容优质的创作者可以储存私域流量。后者则创造了“心流”(一种自动的、高度集中的互动感觉),用户更容易关注平台推荐的“爆款内容”,流量的控制力最大限度地掌握在平台手上。其次,不同社交平台偏好的内容呈现形式不同,意味着在不同的社交平台具有不同的可见性。这些可见性形塑了内容生产者的创作内容和呈现方式,也决定了不同社交平台差异化的平台生态,同时也意味着内容创作者的内容不完全具有全平台同步的迁移性,需要适应不同平台的逻辑。再次,推荐解释是用户理解推荐算法策略的有效路径,也反映了算法推荐的呈现逻辑。比如哔哩哔哩基于特征标签的推荐策略是“兴趣标签”“过去关注”“点赞高”,而微博的推荐策略是“热门视频”“热门新闻”等。尽管明确的解释路径能够建立用户对算法的信任,促进数据良性循环,但社交平台对此做得远远不够。最后,四大社交平台均采用了上滑瀑布流的内容获取方式,展现了推荐算法的目的是最大限度地捕获受众的注意力。永无止境的信息瀑布流增加了他们使用社交平台的时长,也方便平台插入广告并从中获利。

解码:“数字灵工”的算法使用文化

平台的“算法化”和算法的“平台化”让我们看到算法的“物质性”和“能动性”。如下,笔者将借鉴传播理论中的“解码”概念作为探索手段,以“数字灵工”为例,探讨他们如何了解和理解算法,以及他们在日常媒体使用中对算法工作的判断和响应。

(一)算法认知差异

不同职业背景的访谈对象对算法的认知和关注存在明显的差异,而这一差异源于算法知识来源不同。对于拥有算法专业知识和技术知识的“算法工程师”而言,“算法主要是让人更方便”,他们认为算法是高效的信息分发工具,可以让自己最快找到感兴趣的内容,并指出不应该人为地给算法加规则,否则会导致算法失真,推荐给用户不必要的内容。而内容创作者、品牌方或者第三方机构(MCN)则通过他们在客户端的使用经验知识来了解算法。比如内容创作者认为,多给自己“打标签”能提高“可见性”,而品牌方将算法视为信息分发的高效工具,他们看中算法的结果,也即实现变现指标,第三方机构则利用算法的经验知识(投放指南、霸屏策略、审核新规等)招揽更多的内容创作者加盟以赚取中介费。当他们转变角色,作为普通用户时会受到第三方知识(主流媒体或网络报道)的影响,一些用户就认为推荐算法应为信息茧房、信息监控、网络言论极化等现象负责。

(二)算法感受差异

如果说识别算法的存在是算法想象的一个条件,那么理解人们如何解码算法的一个关键方面就在于情感遭遇和反应——人们如何感受算法。“数字灵工”基于自己在社交平台上经历过的“内容审核”“爆款”“限流”等积累的经验知识来认识算法,他们将算法视为流量变现的影响因素,称算法为“玄学”,虽然对算法的运作机制知之甚少,但也根据自己对算法的感受提供了与平台高度关联的四种类型的算法评价。

一是抖音的“沉浸型算法”。访谈对象普遍认为抖音的算法粘性强,旨在让用户上瘾,拉长用户使用时长。算法推荐路径是基于个体过去的历史点击推荐当前的内容,导致内容同质性非常强,容易感到腻烦。抖音的算法推荐机制也限制了内容创作者拓宽多元受众的渠道,其对媚俗、精短、强视听刺激的内容更友好,从而限制了创作力。“在抖音你就不能严肃地创作,特效和模仿视频更可能获得好的数据流量。”(YL20221205)

二是小红书的“实用型算法”。大多数访谈对象认为小红书和哔哩哔哩的算法更注重多样性,更了解用户需求,但小红书更注重通过内容进行高效“种草”。算法推荐路径是关注的博主、感兴趣的热门内容以及新人。不少访谈对象都提到,小红书非常的“新人友好”,会给予新的内容创作者流量扶持,在推荐列表中经常能看到新人发布的内容,丰富了自身观看的内容类型。对于内容创作者来说,小红书的算法推荐更偏垂类博主,因此建构算法聚类下的“数字身份”非常重要。

三是哔哩哔哩的“精用型算法”。访谈对象认为哔哩哔哩与小红书的推荐目的不同:哔哩哔哩的推荐是提供了多样化的可供主动选择的观看内容,这些内容基于特征标签进行推送,他们认为哔哩哔哩的算法更注重多样性。但他们对于哔哩哔哩的算法表现出矛盾感,既享受哔哩哔哩推荐的多样化内容,也表达了对时间利用问题的担忧。哔哩哔哩的算法推荐模式赋予了UP主更强的自主权和话语权,也对他们的内容创作质量提出更高的要求,哔哩哔哩的内容运营也极其关注与UP主的关联,会通过组织线上线下的各类活动来营造UP主友好的社区氛围。

四是微博的“温和型算法”。对于微博的推荐算法,大多数访谈对象则更偏中性评价,认为微博的算法机制虽然很复杂但很温和。换句话说,他们没有感受到算法推荐对他们的内容可见性有具体的影响。值得一提的是,微博的推荐算法的数据实践更多的来自粉丝群体,算法将数据思维与程序渗透进粉丝的日常实践和文化逻辑中,帮助他们喜爱的明星提高可见性,呈现出典型的“参与式文化”特征。(表2)

(三)行动策略差异

Shaw将斯图亚特·霍尔(Stuart Hall)的三种解码方式(主导、协商和对立)应用于新媒体环境中,并认为解码反映在用户与数字媒体的互动方式上。“数字灵工”对算法的感受差异影响了自身的行动逻辑和策略,形成了以下三种解码模式。

一是解码算法的主导地位及适应模式。在这一模式中,内容创作者认可推荐算法的工具性作用,他们积极向算法提供内容、信息和行为数据,加强与算法的交互作用。比如建立数字新身份,以平台的博主标签、内容分区来定义自我,选用平台偏好的内容形式,追随平台运营的话题来生产内容等。

二是解码算法的协商立场及利用模式。在这一模式中,内容创作者会更加审慎地与算法互动,他们可能会对某些算法有轻微的负面评价,但通常会支持并利用算法进行内容开发和推广。比如通过观察算法是否做关联推荐来重组新的内容产品,或者把分散的内容进行整合,建立具有内在关联的内容素材库、集群场景、热门话题来提高可见性,或者购买平台的流量包来快速获得“可见性”完成品牌方的数据要求等。

三是解码算法的对立立场及抵抗模式。这一部分的内容创作者要么完全漠视算法的作用,认为内容的质量而非算法才是关键,因此他们更关注内容的选题、创作和布局,强调“利他性”的重要性,坚守创作初心;要么当他们切换成普通用户时,可能会采取调教、戏弄或退出的方式抵制算法。

互构:算法实践的双重后果

算法实践与算法的“物质—能动性”和其关联的人类行动者的算法认知、感受、行动策略是相互“纠缠”的,并在纠缠式的互构关系中形塑着另一方,充满着异质性、不稳定性和意外后果。一方面,平台个性化的算法推荐逻辑塑造了“数字灵工”的文化生产过程和惯习,使得他们的内容生产和日常工作生活置于多重不确定性中。另一方面,“数字灵工”多重角色也对算法建构产生多重影响,并将推荐算法置于多元挑战中。

(一)“数字灵工”的多重不确定性

在用户个性化的推荐算法下,“一个平台的算法变化足以成就或摧毁整个职业生涯”。算法操纵的“可见性”的不稳定性是内容创造者面临的最大不确定性。推荐算法通过审核机制(决定什么可见和不可见)和流量控制(决定什么可爆和什么不可爆)机制,对“数字灵工”的创作、商业化奖励和身份产生影响。

1.审核与创作的不确定性

内容生产者的内容都需要在审核通过后才会得到推荐。算法内容审核是平台借助算法模型将用户上传的内容与预先建立的数据库进行识别、匹配、预测或分类,从而对在线用户生成的内容进行自动化筛选的一种智能化内容审核模式。其中包括绝对过滤涉政治、色情、暴力、血腥等极端的文本、音频、图像或视频等,也包括过滤不同平台制定的规范政策,从而对该平台的内容进行有限度的限制。其中公开的是平台的《服务条款》和《社区指南》,它用通俗的语言确定了平台上禁止的内容类型。尽管平台与平台之间存在差异,但《社区指南》通常概述平台寻求推广的话语类型的总体愿景,包括违规类型、违规词指南、行业合作规范等。

随着算法审核越来越无缝融入用户的日常在线体验,几乎所有的访谈对象都经历过审核过程,因此他们在内容发布之前需要对内容进行“自我消毒”,自主规避可能的敏感话语,对内容作绿色和无害化处理。如果审核不通过,他们会根据平台的反馈结果调整内容后再次提交审核或者进行人工申诉。由于不同平台有各自的审核规定,应对审核积累下的经验知识不完全具有迁移性。更关键的是平台的审核规定会随着社会热点或平台业务调整发生变动,因此经常会出现“以前或现在可以发布的内容,后面就不行了”。(AZ20220919)

内容尺度把控的不确定性缩小了“数字灵工”可能创作的议题范围,内容审核带来的多次调整或不明缘由的作品不被通过或下架,也严重影响了创作者的创作欲望。让他们更为担心的是,由于内容审核越来越依靠算法自动化审核,一旦触发将会面临账号被封禁的风险,而这很大程度不是他们能控制的,用户的评论和举报等都可能触发违禁关键词,引发算法审核进而影响博主的账号安全。“有些账号被封禁被限流是有迹可循的,可能发布了不合规的言论和内容,但有的毫无预警先兆就可能账号消失,我们也完全不知道为什么。这个是比较头疼的。”(XL20221105)

2.流量生意的不确定性

尽管绝大多数“数字灵工”都出于兴趣、专长、“利他性”、热爱分享等情感价值需求开展创作,但经济利益就像是额外奖励能够刺激内容创作者可持续发展。一般而言,“数字灵工”有三种内容商业化变现方式:品牌商品置换、广告收益、平台广告分成收益,这些都与平台推荐算法相关,但这一“流量生意”并不是稳定的。

首先,算法介入内容创作者的内部定级和商业考核。算法将包括粉丝量和交互数据(转发、点赞、评论、收藏等)在内的内容创作者,划分为数字影响力级别不同的“数字灵工”(头、中、尾),不同级别的“数字灵工”对于推荐算法的依赖程度,以及匹配的服务体系和权限是不同的。众多的研究表明,主流的推荐算法(比如协同过滤算法)是具有马太效应的,中小数字影响力的“数字灵工”的内容可见性更依赖于推荐流量,因此他们的“流量生意”更具不确定性。

其次,平台流量非均衡分布。平台通过算法将内容聚类为各“垂直领域”,如小红书划分了31个垂直领域(如穿搭、美食、职场等),不同垂直领域分属不同行业,行业的发展影响“数字灵工”的变现能力,而平台往往更倾向于增加对高变现领域的流量倾斜。

最后,根据平台的业务需求或者政策规制变化的推荐策略会有相应调整。比如2022年小红书更积极推广短视频内容,那么相较图文内容,短视频的内容创作在该平台就更容易得到流量补贴和商务资源的优先推荐。总的来说,“流量生意”的不确定性是巨大的,正如访谈对象所言:“这里的悖论在于,你不花时间和精力研究平台的算法和流量机制去完成相应的内容创作激励指标,你就拿不到流量,更别提变现了,但即便你认真孵化了1~2年的账号,仍然可能很难变现。”(XW20220920)

3.身份的不确定性

“数字灵工”把他们在社交平台上发布的内容视为“个人产品”或“个人形象”用心经营,既是一种极度个体化的实践,以呈现身份/自我,也是一种公共实践,展现出谁应参与这一实践、又应当如何呈现自己的文化规范。这一点使得“数字灵工”拥有多个身份和多重自我,因为他们追求自我与其他身份及非人类环境互动的情境始终是在变动的。

首先,算法通过代码和模型对文化进行重新分类,以算法标签创造了新的“身份类别”,这些由统计数据导出的控制论分类模式,可能与“数字灵工”对自己的感觉和看法相冲突。

其次,“数字灵工”可能是在不同社交平台上建构不同身份类别、面对不同受众、在不同的生命阶段获得不同身份的主体,他们往往需要开展“边界工作”,在多个受众中管理自己的身份表现。因此他们不再是统一于连贯“自我”的身份,而总处于一个不断变动的过程。

最后,在社交媒体上的自我反省和自我塑造的全部意义,是让他人来审视这些内容并给予主体回应。也就是说,“数字灵工”的文化身份建构始终与粉丝和受众的互动相关,需通过主体在话语中占据的具体位置或主体所处的不同认同过程或样态来呈现,这类互动可以是享受性的,因为他们能够创造和支持亲密感、娱乐和友谊,产生价值感,也是衡量自身创作内容成功的尺度,但同样也意味着我们很难捕捉到身份的真实内核。

对于“数字灵工”来说,身份从来不是单一的,而是构建在许多充满异质性、对抗性、交叉性的论述、实践及地位上的多元组合。

(二)推荐算法面临的多重影响

算法的建构逻辑是“数据输入—运行过程—内容输出”,“数字灵工”的三重角色在算法建构的三个层面均产生影响。推荐算法面临的挑战是如何获得并保持一个积极的反馈循环。

1.作为数据的“数字灵工”与输入挑战

任何的算法实践都依赖于用户的行为数据以形成数据反馈循环。作为社交平台的活跃用户,“数字灵工”差异化的数据反馈循环成为其影响算法实践的根本前提和实际建构的开端。“数字灵工”对自我数据资源的控制力使得其可以在算法建构的输入逻辑上产生三方面的影响。

一是输入的选择性对算法推送配置的影响。尽管高度依赖于社交平台进行内容创作,但创作的间隔和频率是由“数字灵工”掌控的,他们从事的创造性工作常会出现灵感不足导致的“间歇性中缀行为”,即可能出现短时间断更然后又恢复使用的做法,甚至出现停更或者更换平台的情况。这种拒绝和选择让算法继续吸取自身数据的做法,使得“数字灵工”对算法实践结果也保持一定的控制强度。这也迫使算法的推送需要在各类型拥有不同数字影响力的“数字灵工”上维持平衡,既要给予创作人以新人激励流量,又需为有一定数字影响力的创作者留存流量空间,还要通过各种内容创作者的运营活动(比如线上挑战赛、线下活动)来维持创作者持续创新的活力。

二是输入的内容偏好性对推荐的多样性挑战。如前所述,内容创作者会利用算法逻辑而按照平台偏好的内容形式、模板和套路进行内容创作,算法主导的个性化精准推送机制遵循“GIGO定律”。也就是说,输入各平台算法的文化内容同质化趋势增强,平台呈现的内容同质性也更高。这不仅影响了文化创新制作,也增加了版权侵犯纠纷的风险。

三是输入的跨平台性带来社交平台算法推荐模式趋同。“数字灵工”对算法的态度及行为最终反映在平台抉择上,在“媒竞人择”的背景下,创作者在平台间迁徙趋势增加,为了留住更多的“数字灵工”,缩小与其他平台用户体验差距,不同社交媒体平台的流量分发逻辑会越来越趋近,其结果是愈加依赖同一完美推荐算法决定内容分发。

2.作为利益相关方的“数字灵工”对算法模型运行过程的约束

“数字灵工”是社交平台维系平台内容生态的关键,也是提高平台经济价值和社会价值的重要手段。作为利益相关方,“数字灵工”参与算法运行过程主要表现为促进平台内部的算法治理。

一是利用负向反馈,弥补算法模型漏洞。以虚假流量为例,“数字灵工”在社交平台获得的阅读、点赞、收藏、评论等数据是算法推送的重要依据,并可以为其谋得商业价值,由此也催生了刷量产业链公司的兴起。这种刷量行为给内容创作环境带来负面影响,而且有的创作者还会采取陷害同行的方式开展不正当竞争。比如在博主的某一博文下进行刷量,导致算法误判博主及其创作内容,伤害相应的内容创作者。对此,不少平台通过内容创作者的举报和人工反馈等方式,都在算法推荐模型中加入了行为序列分析、图文分析等以提高算法模型的识别性,保护广大内容创作者的权益。

二是利用数字影响力形成约束算法的组织力量。据字节跳动《2022巨量星图达人生态报告》统计,2022年6月,抖音万粉以上创作者数量达到320万,创作者粉丝总量超过4300亿。与愈发庞大的“数字灵工”群体相对应的是,内容部门在平台企业的人员规模和重要程度的增加,对算法形成了组织层面的约束。比如抖音阶梯式流量供给包括自然流量、算法流量、运营干预流量以及商业化投流。其中,运营干预流量就是“数字灵工”在组织层面获得的话语权,能够对算法推荐序列产生影响,在算法实践过程中对内容创作者的期待作出积极反馈和回应。

3.作为产消者的“数字灵工”对算法输出产生的影响

对于社交平台来说,算法的输出是平衡多元利益主体诉求的结果。“数字灵工”不仅是内容生产者,而且是内容消费者,同时还是内容获利者。从算法输出结果上讲,由算法推荐输出的任何内容都是“数字灵工”与算法相互建构的结果。即便是流行、热门、爆款等内容,也都离不开“数字灵工”对文化符号的差异化解读和多路径建构。

从算法输出目标来讲,“数字灵工”产消者身份加剧了算法输出目标的商业性和公共性矛盾。作为商业利益主体,平台将自身的商业化需求转化为推荐系统的规则,创造了内容结构性的“偏见激励”。一个以利润为导向的平台的算法架构,可能会降低那些不能为平台带来收益的内容的可见性,而增加平台认为“有价值且有利可图”的内容的可见度。比如有些内容更适合广告插入,从而为平台积累收益,而那些无法为平台赚钱的内容将陷入可见度不断下降的恶性循环。这强化了平台内容创作的商业化取向,呈现出“内容即广告”的创作趋势,平台作为公共空间的公共性价值受到挑战。

从算法输出反馈来讲,算法建构始终在算法知识获得—算法系统调整的递归迭代中。为了应对复杂的算法技术系统,“数字灵工”除了会通过自己在算法交互过程中的推理,总结算法的技术逻辑与运作模式外,还会通过网络社群进行互助和结果验证。比如,笔者进行网络田野的小红书内容创造者社群,常常会就流量推荐展开讨论以更新自己的算法知识,也催生了部分分享算法知识和应对算法策略的草根“算法专家”。但从算法知识公之于众的那一刻起,它就失去了时效性。因此,算法及其使用者永远处于不停歇的猫鼠游戏中,算法也因此是不稳定的。

余论:面向算法实践的多维治理策略

文化生产的平台化使得算法的影响是持续性的、变化性的。本文基于实践逻辑提出了算法的分析路径,包含算法的“物质—能动性”、算法关联行动者的使用文化和算法实践的后果三个方面的内容。算法本质是一种感性实践关系,也是一场社会性的试验过程,是可认知的亦可塑造的。

从认识论层面而言,算法作为技术,其与使用者的关系不是相互独立且对立的,而是相互制约并依存的。算法实践是一段动态的社会过程——结构与能动性相互交错,不存在纯粹静态的算法权力或孤立的人类内在意图,也不能将其还原为另一方。

在方法论层面,跨平台视角对于算法实践研究是有必要的。因为无论是普通用户还是内容创作者都是跨平台和多媒介的使用者,需要将算法实践置于一种“液态化”的空间中,并在“平台—关联行动者—实践后果”的三元辩证法中建立一种共存共生的关系和流动的权力网络,从而清除算法及其使用者“去主体性”的隐患。

平台作为算法研究的重要变量,有助于更好地理解算法的“物质性”(数据依赖性、平台化和个性化特征)和“能动性”(制造差异)。在“数字灵工”跨平台的文化生产过程中,本文归纳和分析了三类算法知识来源(专业知识、经验知识、第三方知识)、四类算法感受(“沉浸型算法”“实用型算法”“精用型算法”“温和型算法”)和三种算法解码形式下的行动策略(适应、利用和抵抗)。

“数字灵工”的算法实践使“数字灵工”与算法都获得了“互构性”。在算法逻辑将“数字灵工”置于多重不确定性下的同时,“数字灵工”的三重角色也对算法的建构产生了影响,从而对算法的发展与治理带来挑战。“互构”让我们更深刻地认识到算法系统不只是代码和数据,而是人类和非人类行为者的集合,用户和算法之间是有阶段、长期的共时互动关系。这也为我们超越“作为恋物对象的算法”,提出更好的算法治理(governance of algorithms)方案提供了新的思路。笔者认为,从算法实践逻辑出发的治理策略,将走向平台、用户和技术的三维协作互动的算法治理实践,为此需要作三种努力。

第一,应当以落实平台责任为抓手建构算法治理细则。一是督促平台建立算法的“生命周期”治理机制,综合考量算法的运行特征、发展规律、开发团队、数据集、所处环境等要素的交互影响关系,实施全面系统的算法内部监管体系,这有助于妥善应对算法系统的潜在危害或安全问题,并增强算法的透明性。二是完善算法内容的可发现性管理机制。算法推荐策略不仅影响内容条目的可见性,也影响整个文化产业的可见性。可发现性(discoverability)的治理框架强调对平台界面的设计和管理、用户找到内容的途径和选择以及用户体验等方面都予以关注。三是完善算法数据流使用的社会责任治理机制。平台的算法将用户行为数据化,数据流是平台商业利益获得的关键,应以企业的社会责任规范数据流的收集、编码和商品化的权限和边界,坚持算法应用的公共性原则,对算法商业功能、设计目标和可能造成负外部效应中的角色加以判断。四是完善算法伦理标准和法律法规。目前对于算法推荐的规制仅有《互联网信息服务算法推荐管理规定》,制度设立尚处于起步阶段,同时算法备案制度尚不完善。为此,需要持续加强平台算法技术监管的制度供给,完善法律对技术的约束体系,并在算法机制生成和运作过程中添加入价值伦理考量。

第二,将“用户为中心”作为算法设计的核心原则融入算法系统。用户和内容创作者是算法的数据原料,也为数据模型和算法干预提供了接口。一是通过提高用户的算法认知来探索用户和算法的共同进化关系。既然算法和用户有了“互构性”,并在相互影响的同时共同创造现实,那么用户的算法素养也将影响算法的建构。通过算法相关知识教育、提示运作机制等方式,也可以提高用户的算法思维能力,提升对算法逻辑的理解能力和算法的理性批判能力都将促成算法正向迭代。二是通过引导用户对算法进行有效交互来纠正算法系统的价值偏差。用户可以根据已有的算法知识、体验和感受来评价算法,通过反馈循环与算法进行交互来实现算法纠偏。这不仅需要算法服务在设计工作中理解并反映用户的认知过程,还需要在算法系统中建立信任的反馈循环。三是建立多元主体的算法外部审查机制。让用户、内容创造者等算法利益相关者都参与到算法审查中来,建立对话与协商机制,从而形成算法审查的用户力量。

第三,以算法对抗算法。算法的物质性和能动性表明技术的问题还需要技术来解决。以算法对抗算法,是借助算法本身的实践属性来实现对算法治理的程序化牵制。对此,一要建立算法审计框架指导和评估算法的价值伦理。审计涉及收集有关算法在特定环境中使用时的行为数据,然后使用该数据评估该行为是否对某些利益(或权利)产生负面影响,进而对算法的使用方式、目的、利益相关者、有效性、透明性、数据安全等问题进行有效评估,对症纠偏。二是引入对抗性算法策略来对算法实施动态化、常态化的监管。对抗性原则是计算科学和法律程序的基本原则。在计算科学中,对抗性策略被用来探索算法黑箱和机器学习算法的弱点。对抗学习算法为不透明机器算法的持续监控提供了一种工具。例如,我们可以引入生成式对抗机器学习算法,利用无监督机器学习自动识别,从而对算法运行进行有效监督。三是打造可解释性工具、可解释性模型,增加算法可解释性的技术路径和实践路径,从技术层面解决可解释性的问题。比如IBM开发了一套强大且丰富的可解释性360工具包,囊括了诸多可诠释方法与可解释方法,帮助提高机器学习模型的透明度。