别的网站都巴不得用户每天从睁开眼睛开始就长在自己的平台上,推特倒好,直接对用户做出了限制每日浏览量的规定。看起来似乎很奇怪,毕竟这直接关乎到平台的广告收入。可事实也并没有那么简单。
马斯克发布这个消息到现在不到20个小时,已经有4.4亿的访问量,几十万的互动,连他自己都惊呼创下了记录。
虽然大多数回复都是对他阴阳怪气。
根据马斯克的说法,这个限制措施是临时的,随时可能改动或取消。
至于原因,他提到是因为“数百个组织(也许更多)正在非常频繁地抓取Twitter数据”,使得服务器受到了巨大的负担,不得不经常在紧急情况下上线大量服务器以保证平台正常运行。
他指的其实是一些人工智能公司为了训练大型语言模型的在推特上抓取大量推文(对话)作为训练数据。因为LLM需要从大量真实的人类对话中学习。但训练数据的质量对于AI模型的表现非常重要。像Twitter和Rdt美版贴吧(这个网站全名打出来貌似会被屏蔽)这样的社交平台上,有数十亿的帖子,对话质量都很高,被认为是优质UGC(用户生成内容),因此常被人工智能公司用来训练AI模型。像OpenAI、谷歌等公司的大模型早已将这些平台的公开数据用于自家AI语言模型的训练之中。
但是这些平台也希望用户能为这些数据付费,谁也不想看着自己平台上生产的优质内容被别的公司白白拿去使用,同时还要承受着频繁的API访问带来的服务器维护压力和额外成本,颇有一番给别人做嫁衣的意味。所以,一边是平台想着收钱,另一边是用户想着白嫖,矛盾就这样产生了。
上个月美版贴吧就因为其公司CEO决定要提高API接口的使用费用而遭到大量版主的抵制,还发起了“灭灯”运动——关闭板块访问,超过8000个板块被设置为“私人板块”,外人无法访问,但是最后,平台也没有妥协。
推特此前也调整过API的收费策略。此次又整出来一个限制每日浏览量,基本上也证实了这些平台的态度——想白嫖数据,难了。
另外,也有人分析这次事件其实是因为推特和谷歌云的合同在6月30号到期了,传言称,马斯克一直在努力将所有内容迁出,以避免支付10亿美元(据报道)的费用。合同到期后,谷歌云可能对Twitter的数据进行了速率限制。而马斯克此番限制用户访问数量,也是试图减轻损失或协商降低使用费用,并通过这种限制保持网站运行正常,直到数据迁移完成,或达成与Google Cloud的账单合同。