热搜上线第十年,为何算法争议仍不止不休?
21世纪经济报道记者 肖潇
热搜再次成为目光焦点。
11月24日,四部门联合开展“清朗·网络平台算法典型问题治理”专项行动,重点整治热搜榜单、信息茧房、沉迷上瘾、大数据杀熟、算法侵蚀新就业形态劳动者权益五类问题。
在热搜问题上,专项行动的《算法专项治理清单指引》明确提出了三点要求:第一,算法规则公示。平台需要公示榜单排序机制机理,包括基本原理和排序依据;第二,日志留存核验。平台应留存榜单相关网络日志,日志内容包括时间、榜单排名、热度值等信息;第三,水军账号识别。平台应健全异常账号监测机制,防范违规操纵榜单、控制热搜等现象。
实际上,国内社交平台上线热搜功能不过十年,已经经历了两次大型整改。微博公布过算法规则,引入了编辑人工审核,可信账号的识别模型每年都在更新,但买榜单、流量造假、娱乐导向过重……纷纷扰扰的争议始终未停。
热搜是如何被算法塑造的,底层问题到底出在哪里?当我们讨论热搜时,还存在哪些误解和盲区?
两次下线,两次升级
微博拥有热搜功能,其实刚到十年。
2014年,热搜在微博手机端正式上线。当时热搜的唯一指标就是“实时搜索次数”,榜单每十分钟更新一次。《微博搜索白皮书》显示,热搜上线的第二年,日均曝光量达到2.5亿。
2018年1月,热搜被网信办启动为期一周的下线整改。因PG One粉丝刷榜的“紫光阁地沟油”热搜,微博相关负责人被北京市网信办约谈,被指“用户发布违法违规信息未尽到审查义务,持续传播炒作导向错误、低俗色情等违法违规有害信息。”
通过这次整改,热搜算法迎来了第一次升级——一个话题要成为热搜,除了单纯的搜索次数,还需考虑传播热度、互动率、话题率。
当时微博副总裁曹增辉还对界面新闻表示,热搜不再是纯粹的算法排序,开始引入编辑人工干预,整治虚假信息和谣言。
2020年6月,热搜再次被启动为期一周的下线整改。据国家网信办对外发布的公告,微博被指在阿里蒋凡舆论事件中,干扰网上传播秩序、传播违法违规信息。当年开始实施的《网络信息内容生态治理规定》将热搜列为网络信息内容的重点展示环节,指出要应当防范和抵制不良信息。
热搜算法因此有了第二次升级,并且进行了公开说明。这一大体规则此后没有更新,其计算公式是:(搜索热度+传播热度 +讨论热度) x互动率。
在官方公式中,互动数是一个很重要的衡量指标,也就是通常所说的转发、点赞、评论。不难看出,比起一次搜索,在热搜页面进行的一次互动能带来的分数更高,话题因此登上热搜的概率也更大。
郑州大学新闻与传播学院副教授王茜长期研究热搜,她的论文《批判算法研究视角下微博“热搜”的把关标准考察》被引用超过六千次。王茜在采访中告诉21记者,2018年算法升级后,“热搜”仍然是原来的排行榜,但对“热门”的定义发生了根本改变,互动性成为更重要的价值因子,而且近年来在平台中的份量越来越重。
“热搜依据用户的真实行为产生,这么说当然没有错。但哪些行为更重要?是一次搜索更能说明用户的关注度,还是一次评论?”王茜说。
决定这一答案的,是算法公式。学者米歇尔·威尔森 (Michele Willson) 用一个更生动的例子说明了算法的权力,他把用户的原始行为、原始数据比喻为食材,把算法比喻为食谱,不同算法能烹饪出不一样的菜肴,直接影响了最终呈现的内容。王茜表示,算法正是以这种不可见的、隐蔽的方式进行价值判断。
算法的设计和偏见
在王茜看来,热搜的“搜索”是一种私下的行为,具有隐蔽性;而转发点赞评论是公开互动,往往有公开表演的成分。公开“转赞评”的内容和私下“搜索”的内容,其实可能有着很大不同。
从心理学的角度来看,人类为了生存,有需要感知威胁、躲避危险的天性,这种“人性弱点”体现在社交平台上,便是暗含危险、愤怒的负性信息更容易获得公开互动。不少社会研究已经证明了这一点,先进网络分析研究小组(GANA)曾对约7000万条微博数据进行情绪分析,结果表明,愤怒是网络上相关性最强、最易传播的情绪,远超过喜悦和低落。
另一方面,强调互动数的热搜算法,也放大了意见领袖(KOL)的影响力。“如果把热搜看成一个话题投票箱,原本大家是一人一票,普通人搜索一次和名人搜索一次贡献是一样的。现在拥有更多粉丝和资源的人,比普通个体的权重更高。”王茜解释。
根据互动数划分不同权重的逻辑,直观体现在热搜的页面里。点进热搜词条,除了热搜主持人置顶的微博,用户首先能看到的便是10~20条左右,互动量高,它们左右着用户对热搜内容的初印象。
有明星后援会的粉丝告诉21记者,这几年算法机制变得越来越复杂,一条评论要在热评区被优先展示,除了需要有高赞数和高评论数,账号本身还需要大概650分的“信用分”,上热门转发则需要690分左右的“信用分”。决定信用分的,是账号发微博的活跃度、社交关系、举报扣分情况等一系列指标。
换句话说,不是所有微博用户都会被纳入热搜考量范围,算法会筛选出“可信用户”。“普通账号的信用比较低的话,怎么评论都上不了热门,微博也上不了热搜广场,甚至可能被屏蔽。所以平时就要多发原创微博,多带话题跟大V互动,提高账号的权重。”前述粉丝说。
这也许能解释为什么能吸引更多回复的,或者来自大V的评论总能被“顶”上前排,获得更多曝光。
王茜说,微博最初发布这一规则时,出发点是识别水军、确保热搜的真实性。“但大数据一定会抹除一些细节。如果要定义哪些是僵尸号水军、哪些是活跃用户,那些只看不常发微博的人就会被判定不可信,筛选出来的就是一批最活跃用户的想法。”
算法抹除的不止用户痕迹。海外社交平台X(前Twitter)同样具有热搜功能,不过显示的是词语,而微博热搜通常是由热搜主持人提前设定好的一句主、谓、宾语完整的句子。王茜指出,虽然这样看起来提供了更多事实,但仍然抹除了细节和语境,属于一种印象式的消息,有时误导性可能更强。
举例来说,2021年的一个热搜#大学教授说娶到大才女李清照是倒八辈子霉#看起来在批评李清照,其实原视频中大学教授是在戏谑对比,但如果不点进视频,或者没有点进完整的热搜页面,很可能就会先留下先入为主的印象。
通过对内容和用户的一系列筛选,热搜能呈现的往往就是一部分活跃用户的、青年群体的、更有争议性的内容。
不应一味追求热搜KPI
如今各大互联网平台都采用流量主导的热搜算法,对商业发展而言是必然选择。
苏州大学传媒学院执行院长陈龙认为,Web2.0技术的普及解决了社交媒体互动性问题。从“转赞评”到“一键三连”,本质都是流量优先的逻辑。通过增加用户粘性,最终将注意力作为商业化的基础,实现自身的发展与扩张。
陈龙告诉21记者,在多个社交平台的竞争下,争夺用户有限的注意力是一场零和博弈。越来越多用户流向短视频平台,原本属于微博的的时间被吞噬。从2018年初开始,新浪股价一路下行,当2021年新浪宣布退出美股时,市值已经萎缩了近五分之一。2023年第三季度最新财报显示,微博营收32.07亿元人民币,同比下滑了3%。如何保用户、保营收是经营者不得不思考的问题。
与此同时,微博是为数不多的公共讨论场地,在社会事件的传播上有着难以替代的影响力。中国政法大学数据法治研究院教授张凌寒提醒,在缺乏监管的情况下,冲突性的内容泛滥是必然结果。而很多冷嘲热讽、煽风点火、阴阳怪气等言论一旦高强度聚集,会对社会事件的当事人造成极大的伤害。
比如,在此前的粉红头发女孩被网暴事件、收件人被快递员造谣出轨事件中,一条评论单看也许只是玩笑话,但海量的负面评论叠加,可能就会形成一场网暴。热搜在网络暴力的生成、传播、聚合中,起着“放大镜”的关键作用。
去年《关于依法惩治网络暴力违法犯罪的指导意见(征求意见稿)》出台,严惩基于蹭炒热度、推广引流等目的,对于网暴信息不履行安全管理义务的行为。2022年《互联网信息服务算法推荐管理规定》要求,要建立完善人工干预和用户自主选择机制,“在首页首屏、热搜、精选、榜单类、弹窗等重点环节积极呈现符合主流价值导向的信息内容。”
尽管有了人工干预,但难题仍然不少。张凌寒指出,治理最大的难题仍是在保障言论自由和维护秩序之间找到平衡。阴阳怪气、冷嘲热讽的互联网信息难以根治,一禁了之既不利于实现有效的公共讨论,长远而言也无益于和谐社会的建设。
张凌寒认为,关键在于通过智能识别等技术对热搜进行及时、全面、准确的分析研判,实现灵活有效的舆论治理。陈龙则建议,语言暴力的边界难以界定,针对具体问题建立人工管理员或投票机制,也是一种方法。
多位受访学者还不约而同地表示,平台热搜的商业性和公共性存在悖论。当下亟需提高算法素养,剥除算法客观性的光环。社会各界也不以热搜当作传播标准,并一味追求上热搜的KPI指标。
“需要认识到的是,尽管热搜在大家心中扮演了民意风向标的角色,但事实上它没法呈现完全的客观性。每种算法都存在一定的缺陷和偏见,要理性看待热搜的性质。”王茜说。
主题: