摘要:本研究探讨社交机器人在Twitter空间参与中美贸易谈判议题的行为,通过网络爬虫技术获取2019年5月1日至2019年5月31日讨论最高峰期间相关数据共计211088条。研究发现:在有关中美贸易谈判议题讨论中,社交机器人占比13%,发布内容占比接近20%;社交机器人的粉丝数量与正在关注数量呈强相关关系;参与中美贸易谈判话题的社交机器人策略主要是消息推送,没有发现意见领袖等;从话题倾向性上看,社交机器人中反对贸易谈判的占了多数(55%),大部分内容跟美国农民有关。


关键词:中美贸易谈判、社交机器人、社交媒体


一、背景


社交机器人是在社交网络中扮演人的身份、拥有不同程度人格属性、且与人进行互动的虚拟AI形象。简单说,社交机器人是一种承担任务并利用算法生成的社交媒体账户。它可以像人一样传递新闻和信息,也可以进行恶意活动,如发送垃圾信息、发布骚扰和仇恨言论等,无论它们的用途是什么,社交机器人都能够快速发布消息,并进行复制,最终以人类用户的身份将消息传递出去。


社交机器人正在成为社交媒体空间有关政治、经济等重大议题的一个重要参与者。有研究指出,社交机器人占所有Twitter账户的9%~15%,而Facebook也曾在2012年公开宣称社交机器人占其所有账户的8.7%,大约8300万个账户。根据安全公司InCapita在2015年发布的一项研究显示,机器人产生了几乎一半的网络流量。这说明虽然机器人账户的占比只有10%左右,但其在社交媒体平台上非常活跃,产生了大量的流量(内容)。有学者认为在社交媒体平台中,社交机器人生成的内容比比皆是,社交媒体正在变为 “人+社交机器人”共生的生态。


中美两国作为世界上最大的两个经济体,两国GDP之和几乎占据全球GDP的2/5,中美贸易谈判不仅会对中美两国产生影响,更会对全球经济造成影响。2019年5月,经济合作与发展组织(OECD)称,美国与中国之间贸易谈判的不确定性已经对全球经济增长和商业投资产生了负面影响。在中美两国之外,中美贸易谈判产生一系列连锁反应。Sun等人考察了美中贸易谈判对第三国日本的影响,使用日本跨国公司(MNC)的详细数据,发现日本公司同样也受到了美中贸易谈判的波及。彼得森国际经济研究所高级研究员Sherman Robinson在文章中指出,随着中美贸易谈判的进行,双方关税的增加将影响世界价格,各国进出口价格将发生变化。


社交媒体中的社交机器人是改变公共话语和舆论议程重要且神秘的因素,不仅是社交媒体,它们在广义的互联网媒体中也发挥着重要作用。对于中美贸易谈判议题,在社交媒体空间还没有专门关于社交机器人的参与情况的研究,本文试图通过挖掘Twitter平台数据对这一个重大议题的社交机器人参与行为展开分析。


二、文献回顾与研究问题


全球范围内重大事件的传播活动中都有社交机器人的身影,它们模仿人类在社交媒体平台上的表达方式执行某一特定任务。鉴于前期社交机器人参与有关中国议题的研究缺乏,本研究试图通过对同类主题的文献梳理,提出探讨社交机器人行为的基本问题。


1.社交机器人账号数量与发文数量的比重


在一些国际重大事件中,社交机器人的参与占比虽然不高但其十分活跃。根据Howard等学者的研究,在关于英国脱欧公投的推特流量中,不到1%的账户生产了几乎三分之一的信息,其中绝大多数是自动化或半自动的机器人。同样,在2016年美国大选、乌克兰冲突和土耳其政治审查这三大事件中,社交机器人的参与率高于人类用户。Schuchard等学者指出,尽管社交机器人的在线对话参与者只占所有用户的0.28%,但它们在所有对话的显著中心性排名中占据相当大的比例。显著中心性主要指的是社交机器人在网络中的受欢迎程度和对整个网络的影响水平。


根据Kollanyi等学者的研究,在2016年美国大选中支持特朗普的推特流量是支持希拉里推特流量的2倍,其中,支持特朗普推文中36.1%是由社交机器人驱动的,而支持希拉里的推文中23.5%是由社交机器人驱动的。从双方生产的推文数量上来看,社交机器人所生产的支持特朗普的推文是支持希拉里的7倍。由此可见,特朗普在社交媒体空间拥有较高的自动化水平,社交机器人可持续地产生更多的内容用来支持自己。


2.社交机器人与人类账户比较


在当前“人+社交机器人”共生的社交媒体生态中,社交机器人与人类用户的对比研究成为学者关注的焦点。一个典型的案例是在法国大选前夕的“马克龙泄密”事件,南加州大学学者Ferrara对该事件中的社交机器人和人类用户进行了对比分析,发现参与“马克龙泄密事件”的社交机器人账户的发推量(Tweets)、追随者(Followers)、关注者(Friends)、点赞数(Favorites)、被加入列表数(Listed)都低于人类用户。


同时,他还发人类用户的这五项特征之间不存在显著相关性,而社交机器人的五项特征之间存在显著相关性,机器人关注用户越多,越可能出现在其他人的列表中,Ferrara认为这是一种自我提升机制,社交机器人会通过关注他人,来提高自己被关注的可能性。


3.社交机器人参与讨论的行为特点


社交机器人的行为始终离不开背后操控者的意图,执行不同任务的社交机器人通常会表现出截然不同的行为方式。因此,识别社交机器人参与议题讨论的行为模式也成为学者们研究的一个方向。


在英国脱欧公投的辩论中,研究者发现社交机器人主要用来放大信息,而不是参与辩论。也就是说社交机器人会通过大量复制或分享人类用户的信息,来达到放大某一观点的目的。根据Schafer等学者的研究,在日本大选中社交机器人通过推送重复内容来扩散支持安倍的言论。在有关委内瑞拉的政治讨论中,机器人被用来转发政客的内容,以扩大他们在社交媒体上的影响力。


除大量转发和复制信息外,社交机器人也会采用一些传播策略来表现得更像人,并躲避一些基础的机器人检测。在有关乌克兰冲突事件的研究中,Hegelich和Janetzko发现Twitter上的社交机器人不仅通过大量重复消息和转发特定的推文来推广某些主题,而且还表现出一种“模仿”的行为:这些社交机器人试图通过发布新闻报道、性别歧视笑话和热门电影下载链接等非政治性信息来模仿用户行为,躲避基于重复推文的简单检测算法。


在社交网络中,社交机器人不仅可以用来放大特定立场,还可以通过制造虚假信息、垃圾信息的方式大规模压制其反对意见。在2016年美国大选中,高度自动化的账户被用来传播有政治倾向的假新闻和谣言,分享垃圾信息,并为美国选民提供直接跳转到政治新闻的链接和俄罗斯来源的信息。这些假新闻和谣言多用来误导选民,有多家媒体报道了假新闻是如何推动特朗普获胜的。另外,根据Ferrara的研究,在马克龙泄密事件中,社交机器人生成的推文数量的峰值通常略早于人类帖子数量峰值出现,换言之,社交机器人可能生产虚假信息发起虚假宣传。


4.研究问题


在这些政治事件中,社交机器人往往像人一样参与有关议题的讨论,它潜在的影响引发了人们对于社交机器人操控公众舆论的担忧。虽然目前社交机器人对公众舆论的影响难以准确估量,但社交机器人的确在社交媒体空间中发挥作用,影响着政治、经济等方面重大议题的决策。为了进一步探究社交机器人在塑造公共舆论,影响事件发展等方面的影响,基于上述文献,本研究提出以下六个研究问题:


1. 社交机器人在Twitter空间参与有关中美贸易谈判议题的账号数量和发文数量如何?


2. 在Twitter空间有关中美贸易谈判议题的社交机器人与人类用户的粉丝特点比较。


3. 社交机器人在Twitter空间发布有关中美贸易谈判话题的推文特征如何?


4. 社交机器人与人类账户在Twitter空间发布有关中美贸易谈判推文的时间序列比较。


5. 社交机器人在Twitter空间发布有关中美贸易谈判推文的话题标签、@、链接使用策略如何?


6. 社交机器人在Twitter空间发布有关中美贸易谈判推文的立场分布如何?


三、研究方法


1.数据采集与处理


中美两国贸易谈判始于2018年3月。在Google Trends上搜索“tradewar”,设定时间范围为2018年1月1日至2020年1月16日,发现搜索热度大致出现三次大高潮,分别为2018年3月底至4月初、2018年6月中旬至7月初、2019年5月。2019年5月这一讨论热潮是迄今为止热度最高的一场讨论,在这一月内中美双方多次交锋,贸易谈判相关搜索热度持续上升,成为一个热度最高的时间段。因此,本文选取2019年5月为时间节点来一窥中美贸易谈判的相关讨论。


图1 中美贸易谈判Google趋势图(注:第一个点表示骤升是5月5日开始的,第二个点表示最高点是5月19日-25日)


本文采用数据挖掘方法,通过Python编程获取“中美贸易谈判”在Twitter上的相关讨论。以“tradewar”为关键词,以2019年5月1日至2019年5月31日为时间节点,以文本内容(text)、发推时间、发推人(账号ID)为标准筛除无效或重复推文后,得到推文217505条。为便于后续操作分析,去除非英文推文内容,最后得到211088条英文推文数据,其中包括独立用户85856个。


2.社交机器人检测


在社交机器人的检测上,本文采用开源工具Botometer识别社交机器人。Botometer是目前检测Twitter社交机器人最为成熟和广泛使用的检测工具,在已发表的诸多学术论文中均使用Botometer进行社交机器人检测。


在Botometer(https://botometer.iuni.iu.edu/#!/)网页上输入账号的screen_name(带@的名字)即可得到一个取值范围为0~5的得分,得分越高约可能是社交机器人。如输入@cctv即可得到CCTV的Twitter账号的检测得分为0.5(见图),这表明所检测的账号极不可能是社交机器人,与事实相符。


在检测大批量账号时,本文选用了Botometer提供的API调用方式(https://rapidapi.com/OSoMe/api/botometer-pro),使用Python程序调用API,检测结果会得到一个取值范围为0~5的得分区间(display score),得分越高越可能是社交机器人。对于英语用户来说,display score得分与Botometer页面检测0~5分制得分是相对应的。本文按照通常判断标准,将Botometer得分在3分及以上的账号判定为社交机器人。


图2 Botometer检测示例图


虽然Botometer广泛应用于社交机器人研究中,但并非所有账号都能够通过Botometer检测,因为Botometer依赖账号自身发布的推文信息进行特征识别,如果无法获取推文,则无法进行检测。在检查已被暂停、保护、隔离或删除的Twitter账户时,无法获取账号相关信息,也使得Botometer无法给出检测得分。比如@HuckerRahman这一账号因为被怀疑就无法进行检测,检测结果是“forbidden”;又比如@CleverTony2这一账号从没有发布过推文,无法从其账号获取推文信息,检测结果是“No Timeline”;@ ajustpeace4all这一账号由于没有权限查看其推文,检测结果是“unauthorized”。


在本文中,对85856个独立用户进行检测,其中71013个账号能检测,占比82.7%,14843个无法检测。


图3 Botometer检测出现错误提示示例图


四、结果分析


1.社交机器人比例及发文量分析


首先,分析考察账号中的社交机器人比例。根据检测结果,71013个独立账号中Botometer得分在3分及以上的有9177个,也就是说,社交机器人账号占比12.92%。


图4 社交机器人与人类用户占比


图5 社交机器人与人类用户发布内容占比


2.社交机器人与人类用户的粉丝特点比较


为了探究社交机器人与人类用户之间的差异,本文将粉丝数量和正在关注数量进行对比分析,发现在社交机器人与人类用户的粉丝数量和正在关注数量之间存在两种不同的模式。


1.账号粉丝数量分布比较:有40%社交机器人的粉丝在500以下


在社交媒体平台上,粉丝数能够从一定程度上折射出用户的影响力。根据Chu等学者的研究,政客们会通过购买大量的机器人来大幅增加粉丝数量,以提高自己在社交媒体空间的影响力。在有关中美贸易谈判的讨论中,社交机器人也通过增加一定的粉丝数量来获取关注,但并没有达到一定的量级。


粉丝量在5000以下时,社交机器人的比例高于人类用户,而粉丝量在5000以上时,社交机器人的比例低于人类用户。具体来看,当粉丝数量高于5000后,随着粉丝量的增大两者的差异愈发明显,仅有0.30%的社交机器人粉丝量在10万至100万,而人类用户的这一比例是5.4%,远高于社交机器人;没有社交机器人的粉丝量在100万以上,人类用户却有2.7%粉丝量在100万以上,其中1237个人类账户粉丝在100万至1000万之间,432个人类账户粉丝在1000万及以上。绝大多数账号的粉丝量在5000以下,社交机器人和人类账号粉丝量在5000以下的比例分别为69.9%、82%。另外,粉丝数量在100及以下的社交机器人明显多于人类用户。


图6 社交机器人与人类用户粉丝数量对比图


2.正在关注数量分布对比:社交机器人和人类用户差异不大


从社交机器人与人类用户正在关注数量分布上可以看出,两者差异不大,正在关注数量在1000至5000区间的占比最高,分别为34.30%和31.60%。其次是100及以下,占比分别为22.50%和15.90%。社交机器人虽然并不像人类用户拥有真实的人际关系网,但社交机器人可能会通过模仿人类用户去关注更多的“大V”或意见领袖来达到混淆视听的目的。


图7 社交机器人与人类用户正在关注对比图


3.粉丝数量与正在关注数量的关系:社交机器人的粉丝数量与正在关注数量呈强相关关系,而人类用户相关度较弱


首先,比较社交机器人与人类用户的粉丝数量与正在关注数量发现,两类账号存在两种不同的模式。对粉丝数量和正在关注数量进行相关性分析显示,社交机器人的粉丝与正在关注呈强相关关系(皮尔逊系数ρ=0.875)。


社交机器人粉丝与正在关注相关性分析


人类用户粉丝与正在关注相关性分析


其次,用坐标轴来直观看,横轴为粉丝数量,纵轴为正在关注数量,每一个点代表一个账号,社交机器人账号和人类用户的粉丝数量、正在关注数量呈现完全不同的关系。根据图8可以看到社交机器人关注的数量越多,粉丝数量也随之增加。这与Ferrara的研究不谋而合,社交机器人系统存在一种自动的、互惠机制 ,即社交机器人会通过主动关注别人从而来增加自己的粉丝数量,以提高自己的影响力。


而人类用户的粉丝数量和正在关注之间相关关系较弱(ρ=0.147),但根据图9还是可以看到一些趋势,即粉丝数量很多的人类用户反而正在关注数量很少,正在关注很多的人反而粉丝数量很少。


社交机器人粉丝与正在关注分布


人类用户粉丝与正在关注分布


3.社交机器人发布推文的特征


社交机器人的行为特点主要是从其发布推文的方式进行分析,发现社交机器人在发布的方式上具备一些特点:一是体现在发布内容数量上,社交机器人更可能发布多条推文参与议题讨论;二是社交机器人经常发布一些相似的内容,主要有两种情况,一种情况是同一账号发布相似内容,另一种情况是若干不同的社交机器人账号发布相似的内容,实现社交机器人系统之间的一种联动。


1.发布多条推文参与讨论


通过分析每个账号发布推文数量发现,总体上,不管是社交机器人账号还是人类账号大部分均只发布1-2条推文,仅少数发布3条内容及以上。但比较两类账号发贴量发现,社交机器人账户更可能发布多条推文:近七成人类账号仅发布1条推文,社交机器人账号仅发布1条推文不到六成,有1.67%少量社交机器人账号发布30条以上内容。


社交机器人与人类用户单个账号发布推文的数量分布


2.经常发布相似内容推文


在以往的研究中,学者们已经证明社交机器人会通过复制相似内容来达到扩大立场的作用。在本研究中,社交机器人同样出现发布相似内容这种行为模式,主要表现在以下两个方面。


一是同一个账号发布多条相似内容。举例来说,MyAllies News(@ MyAlliesNews)这一账号共发布441条推文,是发布推文最多的社交机器人账号,其在不同时间发布的推文内容常常极为相似,可能只是个别词语的同义替换表达,如“Airbus CEO says all planemakers to suffer from 'lose-lose' trade war”和“Airbus CEO says all planemakers would lose from trade war”;甚至是一样的文本内容,仅仅是分享链接显示不同,这些看起来不一样的链接均指向同一个网站。


又如,HEDGE energy(@ HEDGEenergy)这一账号共发布推文335条,是发布推文第二多的社交机器人账号,也频频出现上述两种情况,发布的推文极其相似。其中有178条“New Article:”开头的推文,即以分享文章为引子的推文,比如在2019年5月10日下午14:30发布推文“New Article: Trump says no hurry to sign China deal as trade war escalates https://t.co/gLZiaAbeKp #businessNews May 10, 2019”、下午16:00发布推文“New Article: Trump says no hurry to sign deal with China as trade war escalates https://t.co/sM78tjZSqC #businessNews May 10, 2019”,两条推文文本内容一致,链接显示不同,但点开依旧发现是同一个网站的不同页面——虽然标题一致、简讯内容一致,但标题下面的创建时间不一致。



链接不同但内容相似的网站示例


二是不同账号发布相似内容。在机器人账号中,不同账号发布相似内容推文的情况非常常见,其发布时间也非常接近,推文的点赞、评论、转发基本都为0。如下表所举例的推文,这8个社交机器人账号中7个在5月13日晚上20点14分之后陆续发布内容,时间间隔大于为1分钟,这8条推文的点赞量、评论量、转发量均为0。


不同账号发布相似内容示例


4.社交机器人与人类账户发布推文的时间序列比较


根据社交机器人与人类用户发布推文的时间序列,整体上来看社交机器人发布推文的高峰与低谷基本上与人类用户相吻合,但人类用户发布推文的最高峰要早社交机器人两天。


首先,从人类用户发文的时间序列上来看,2019年5月5日之后出现一个小高峰,结合中美贸易谈判的时间线,美国总统特朗普5日在其推特上宣布将2000亿美元的中国商品关税从10%上调到25%,并于5月11日生效引发热议。5月9日至10日,中美双方在华盛顿举行第十一轮经贸高级别磋商,紧接着5月10日出现另一个小高峰。5月13日,中国国务院关税税则委员会宣布自6月1日起对原产于美国价值600亿美元的部分进口商品提高到加征5%至25%的关税,引发网民激烈讨论,形成了中美贸易谈判讨论最高峰值。从讨论量上来看,网民讨论的热度随着事件的发展而出现波动,中国对美国的反制措施加剧了此次讨论的升温。


第二,从社交机器人发文的时间序列上来看,5月6日和5月10日同样出现了两个小高峰,但时间上要滞后于人类用户。社交机器人发文的最高峰出现在5月15日,同样晚于人类用户的最高峰。由此可以推断,在中美贸易谈判的相关讨论中,人类用户率先参与到事件的讨论中,而社交机器人在人类用户的讨论形成一定的声量之后才开始加入,起到一种扩大信息、放大立场的作用。


第三,5月15日之后,不管是人类用户还是社交机器人用户,发布推文的数量均出现明显下降,在5月25日至5月28日之间出现沉默期。但是,在5月29日之后,社交机器人单日的发文量要等于甚至高于其在中期(5月16日至5月28日)的发文量,而人类用户在同一时段的发文量则低于之前。


社交机器人与人类用户生成内容的时间序列图


5.社交机器人的话题标签、@、链接使用策略


在211088条推文中,能够检测账号是否是机器人的推文是175863条,其中社交机器人发布33867条,人类用户发布141996条。识别并统计推文内容中的话题标签(hashtag)、@的人、分享的链接,比较社交机器人账号和人类用户账号在这三者上的异同,进而发现在中美贸易摩擦相关Twitter讨论中两类账户推文的不同特征。


1.通过新闻类话题标签快速传递信息


获取推文内容中社交机器人账号最常使用的前20个话题标签、人类账号最常使用的前20个话题标签,并进行比较。


在相同点方面,首先,两者均含有若干表示“贸易谈判”含义的话题标签,即#tradewar、#TradeWar、#Tradewar、#TradeWars;其次,均含有体现中美贸易摩擦双方的话题标签,即#China、#china、#US、#USA,以及与美国总统特朗普相关的标签#Trump、#trump;第三,均含有跟经济相关的术语,表示 “贸易”“关税”“股票”等话题标签,即#trade、#Trade、#tariffs、#Tariffs、#ChinaTariffs、#stocks,以及#economy、#markets等。


在不同点方面,主要是两类账号使用的话题标签在排序上存在差异,各自首要突出强调的方面不太一样。从最常使用的前20个话题来看,社交机器人账号更频繁使用“#news”“#News”等表示新闻速递的话题标签,社交机器人作为一种高效快速大范围传递信息的功能凸显;社交机器人账号更频繁地使用反对特朗普的话题标签,#ImpeachTrump中“impeach”是“弹劾”的意思,在推文中常与另一高频话题标签“#TheResistance”连用,“Resistance”是“反抗”的意思;社交机器人账号更频繁地使用与商业相关的话题,如#business、#Business、#forex(外汇)、#investing(投资)等的高频使用。


相对地,人类用户更显著关注关税,#tariffs、#Tariffs、#ChinaTariffs三个话题标签体现了对关税的高度关注;人类用户更高频率使用#Huawei这一标签,更为关注华为的动态;人类用户也更频繁地使用#MAGA这一标签,MAGA是特朗普名言“Make American Great Again”的简写。


社交机器人与人类用户使用hashtag排名前20


2.通过@媒体或热点人物扩大影响力


比较社交机器人账号、人类账号在推文中最常@的前20个账号发现:


首先,特朗普(@realDonaldTrump)是被@频率最高的账号,President Trump (@POTUS)这一官方认证账号也频频被@;


第二,高频被@的账号大多是媒体或平台,如@YouTube、@GoogleNews(谷歌新闻)、@nytimes(纽约时报),社交机器人账号最常@的前20个中有14个是媒体账号,人类账号则是13个;


第三,社交机器人账户更频繁地@trish_regan(特丽什·里根)、@thepointwithlx(刘欣),借助刘欣里根的辩论热度来扩大自己的影响力;


第四,人类账户更频繁地@政党相关账号,如@GOP(共和党)、@WhiteHouse(白宫)、@GOPChairwoman(共和党女主席),而社交机器人账户仅有@dccc一个账号与政党密切相关,@dccc是一个官方认证账号,它的简介中写道:“致力于选举民主党人进入美国众议院”。


社交机器人与人类用户使用mention排名前20


3.信息来源不明确且与贸易谈判关联少


本文通过比较社交机器人与人类用户在推文中经常分享或使用的前20个链接,来分析两者获取信息的来源。分析发现,社交机器人最常使用的信息来源不明确,与中美贸易谈判直接相关的网址只有2个,一个是梳理中美贸易谈判的时间线https://t.co/NpKndlNA9g,另一个是分析贸易谈判对特朗普2020选举的不利影响https://t.co/SHRSdbcl8a;其余为新闻聚合类网页链接、金融类服务网站、商业推广网站以及分享生活的网页等,与中美贸易谈判并不直接相关。另外,社交机器人使用的信息来源有大量重复。与社交机器人不同,人类用户使用的信息来源较为明确,前20个人类用户使用的信息来源中有9个与中美贸易谈判直接相关,其余为一些涉及经济的新闻文章、图片、视频等。


社交机器人与人类用户使用http排名前20


6.社交机器人对中美贸易谈判的立场分析


为了探究社交机器人在中美贸易谈判中的态度立场,本研究对社交机器人发布排名前100的推文进行内容分析,将其编码为反对、中立、支持。最后根据研究发现,在转发前100的推文中,反对贸易谈判的推文占比55%,中立的占比15%,支持的占比30%,Trump出现了76次,Farmer出现了25次,American出现了18次。其中,在反对贸易谈判的推文中,大部分内容跟美国农民有关,他们认为特朗普的贸易谈判损害了农民的利益,还有一些推文涉及美国2020大选,主要来自于一些支持民主党的选民,用来反对特朗普。


社交机器人发布内容转发排名前100立场分析


反对贸易谈判推文示例


五、结论与讨论


本文通过对Twitter上关于中美贸易谈判相关推文的分析发现,社交机器人已经参与贸易谈判议题讨论,并呈现明显特征。


1.结论


第一,在Twitter上参与中美贸易谈判议题讨论的社交机器人有一点五成左右比例,极少数社交机器人账号会发布大量推文。研究显示,在Twitter上在参与中美贸易谈判议题讨论的社交机器人账号约占总的账号数量的近13%,发布的推文数量占比近五分之一(19.26%),推文比例高于账号数量比例,与其他前期文献研究发现基本一致。本次研究发现,社交机器人账号中,有1.67%的账号是发文在30条以上,最高账号在分析的一个月时间内发了400条以上推文。


第二,社交机器人发送推文的重复率高,原创性弱。社交机器人发布内容有两个特点:一是在不同时间发布的推文内容常常极为相似,可能只是个别词语的同义替换表达,甚至是一样的文本内容,仅仅是分享链接显示不同,这些看起来不一样的链接均指向同一个网站;二是不同账号发布相似内容,发布时间也非常接近。这些说明社交机器人目前还没有原创性,主要从语料库进行一些词语更替。


第三,社交机器人粉丝数量与正在关注数量呈现强相关关系,八成社交机器人的粉丝数在5000以内。社交机器人与人类账号的粉丝数量、正在关注数量呈现出两种完全不同的关系模式。社交机器人为隐藏身份,会主动与他人联结,并试图通过关注他人来增加自己的粉丝量、提升影响力,因此社交机器人的粉丝数量与正在关注数量呈现强相关关系。而人类用户不需要给自己的身份“披马甲”,粉丝数量与正在关注相关关系较弱,甚至于形成两极分化的“直角”区域——粉丝数量很多的人类用户反而正在关注数量很少,而正在关注很多的人反而粉丝数量很少。八成社交机器人的粉丝数在5000以内,其中有40%社交机器人的粉丝数在500以下,分布特征与人类用户相似。


第四,社交机器人的发文高峰晚于人类用户。从时间序列上看社交机器人与人类账户发文的数量分布发现,人类用户的发文高峰要早于社交机器人,而不是与之前其他研究发现的结论一样。也就是说,人类用户关注事件讨论的高峰在前,之后社交机器人才发力。


第五,社交机器人常使用新闻类话题标签以快速传递讯息,更频繁地@媒体或热点人物来扩大其影响力。社交机器人分享或使用的链接常是与中美贸易谈判关联不紧密的新闻聚合类网页链接、金融类服务网站、商业推广网站以及分享生活的网页等。而人类用户使用的链接则更多地与中美贸易谈判相关。


2.讨论


社交机器人是一个新的传播现象,尤其在我国社会学科还缺少实证研究来探讨这一问题,本次研究发现社交机器人已经实际参与了中美贸易谈判议题的讨论,我们该如何看待这一现象?


首先,与最近五年间全球其他政治、经济等重大事件都有社交机器人参与一样,中美贸易谈判这一影响全球经济的重大事件也有社交机器人参与舆论,并已经占据一定比重。社交机器人已经成为社交媒体的一个有机组成部分,社交机器人参与重大议题讨论已经是一个常态。现在不是讨论社交机器人能不能参与社会重大议题讨论的问题,而是应该进入到研究社交机器人如何参与社会议题讨论的传播机制阶段。


从有关中美贸易谈判的社交机器人参与来看,社交机器人的参与数量与其他重大议题差不多。本次研究发现有关中美贸易谈判议题的社交机器人参与比例是13%,发布的推文量占19.26%。而早在2009年,市场咨询服务公司Sysomos的一份报告就指出,有大约24%的推文内容由社交机器人生成,亚利桑那州立大学的Morstatter和Carley,与卡耐基梅隆大学有的Liu等研究者在2015年度共同指出,Twitter中至少有7%的社交机器人账号,2016年美国大选之时,有将近19%的与大选相关推文是由社交机器人账号发出的。从账号比例和发文比例两个指标看,社交机器人参与中美贸易谈判议题讨论的数量没有特别突出之处,是一个正常的参与。


本次中美贸易谈判议题没有出现针对性非常强的大批量社交机器人参与,而在其他案例中已经有相关例子。如有关英国脱欧公投议题,伦敦大学城市学院的Bastos和Mercea(2017)通过一组预设标签获得了公投前后两周内全部推文及其来源账号,并基于网络特征识别机器人账号,发现有将近34%的账号为机器人账号。这一脱欧议题的社交机器人参与目标非常明确,话题单一,舆论双方的观点很明确,社交机器人的参与比例也很高。但可以预见的是,社交机器人有针对性参与重大议题的行为在下一步是不可避免的,如何探讨这个变量的传播效果是需要我们关注的。


其次,参与中美贸易谈判话题的社交机器人手段运用还比较单一,主要停留在推送消息方面。前面研究发现参与贸易谈判议题的社交机器人发送推文的重复率高,原创性弱,常使用新闻类话题标签以快速传递讯息,更频繁地@媒体或热点人物来扩大其影响力。前期研究归纳出社交机器人的五种参与舆论策略:一是营造虚假人气,二是推送大量政治消息,三是传播虚假或垃圾政治信息干扰舆论,四是制造烟雾遮蔽效应混淆公众视听,五是塑造高度人格化形象的虚拟意见领袖。本次研究显示只出现了第二种推送大量政治消息的策略。没有发现第五种塑造高度人格化形象的虚拟意见领袖的策略,只有发帖量高的社交机器人,但还没有达到意见领袖的程度。但对于一、三、四两种策略,本次研究没有涉及,尤其是三、四两种策略的运用是和舆论直接相关的。这几种策略的都是下一步研究值得跟进分析的。


第三,从话题倾向性来看,还没有明显针对中国方面的社交机器人,主要是美国国内政治争议的一个延展。前面研究发现,反对贸易谈判的比例最高,其中大部分内容跟美国农民有关,他们认为特朗普的贸易谈判损害了农民的利益,还有一些推文涉及美国2020大选,主要来自于一些支持民主党的选民,用来反对特朗普。本次社交机器人不是很聚焦的常态参与可能有三点原因:一是话题本身聚焦性不强,不像国外的总统选举、或者脱欧这种议题,话题非常聚焦,也是一个普遍可以发表意见的事情。而贸易谈判是一个专业性高、话题比较分散的事件。二是总统选举、脱欧等议题都有党派支持,有专门的公关经费,社交媒体又是一个重要的发声平台,社交机器人的参与度自然就会高。而中美贸易谈判是国与国之间的一个政策谈判,公关的需求就会弱很多。三是贸易谈判周期长,不是短暂时间可以决定的事。


另外,本研究的创新之处是在国内率先对社交机器人在社交媒体空间参与有关中国议题的讨论进行实证分析,并将计算科学与社会科学相结合,实现了跨学科的交叉研究。当然,限于可行性还有值得后续研究关注的:一是本研究只选取了中美贸易谈判过程中一个月进行数据挖掘,如果是全样本就会更全面。二是在对社交机器人的行为分析时只详细分析了其发布推文的行为方式,对转发等行为并没有涉及,在今后的研究中将重点关注这部分的内容。社交机器人到底是如何影响以及影响了多少还是一个需要进一步研究的问题。在未来,我们将会继续关注社交机器人在不同事件中的作用,探究社交机器人对公众舆论产生的影响。