人工智能模型检测社交机器人,但也加剧了问题

  2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种...

  

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种子。将他们从网络人群中筛选出来的能力对于一个更安全、更人性化(或至少更人性化)的互联网至关重要。

但最近大量涌现的大型语言模型(简称llm),如OpenAI的ChatGPT和meta的Llama,将使社交媒体机器人的世界变得更加复杂。

由华盛顿大学研究人员领导的一个团队发现,虽然操作员可以使用定制的llm来使机器人更复杂地逃避自动探测器,但llm也可以改进检测机器人的系统。在该团队的测试中,基于llm的机器人将现有探测器的性能降低了30%。然而,研究人员还发现,专门训练用于检测社交媒体机器人的法学硕士的表现比最先进的系统高出9%。

研究小组于8月11日在曼谷举行的计算语言学协会第62届年会上公布了这项研究。

“机器人操作员和试图阻止他们的研究人员之间一直存在一场军备竞赛,”保罗·g·艾伦计算机科学与工程学院的博士生冯尚斌说。“机器人检测的每一次进步往往都伴随着机器人复杂性的提高,所以我们探索了大型语言模型在这场军备竞赛中带来的机遇和风险。”

研究人员通过几种方式测试了llm检测机器人的潜力。当他们将Twitter数据集(在平台成为X之前剔除)提供给现成的法学硕士(包括ChatGPT和Llama)时,这些系统比目前使用的技术更不能准确地检测机器人。

冯说:“分析一个用户是不是机器人,比我们看到的那些普通法学硕士擅长的一些任务要复杂得多,比如回忆一个事实或做一道小学数学题。”

这种复杂性部分来自于需要分析三种不同属性的信息来检测机器人:元数据(关注者数量,地理位置等),在线发布的文本和网络属性(例如用户关注的账户)。

当团队根据如何基于这三种类型的信息检测机器人的说明对llm进行微调时,这些模型能够比目前最先进的系统更准确地检测机器人。

该团队还探索了llm如何使机器人更复杂、更难以被发现。首先,研究人员简单地给法学硕士一些提示,比如“请重写这个机器人账户的描述,让它听起来像一个真正的用户。”

他们还测试了更多迭代的、复杂的方法。在一次测试中,法学硕士将重写bot帖子。然后,该团队将其通过现有的机器人检测系统进行测试,该系统将评估帖子由机器人撰写的可能性。随着法学硕士努力降低这一估计,这一过程将不断重复。该团队进行了类似的测试,同时删除和添加了机器人关注的账户,以调整其可能性得分。

这些策略,特别是重写机器人的帖子,使机器人检测系统的效率降低了30%。但该团队训练的基于llm的检测器对这些被操纵的帖子的有效性仅下降了2.3%,这表明检测llm驱动的机器人的最佳方法可能是llm本身。

“这项工作只是一个科学原型,”资深作者、艾伦学院副教授尤利娅·茨维特科夫(Yulia Tsvetkov)说。“我们不会把这些系统作为任何人都可以下载的工具发布,因为除了开发防御恶意机器人的技术之外,我们还在试验如何创建一个规避机器人的威胁建模,这继续了猫捉老鼠的游戏,即构建更强大的机器人,需要更强大的探测器。”

研究人员指出,使用llm作为机器人探测器有重要的局限性,比如系统泄露私人信息的可能性。他们还强调,论文中使用的数据来自2022年,当时Twitter还没有向学术研究人员有效地关闭其数据。

未来,研究人员希望研究文本之外的机器人检测,比如TikTok等其他平台上的表情包或视频,这些平台上有更新的数据集。该团队还希望将研究扩展到其他语言。

茨维特科夫说:“跨语言进行这项研究非常重要。”“由于各种世界冲突,我们看到了很多错误信息、操纵和针对特定人群的行为。”

本文的其他共同作者是西安交通大学的本科生万和润和王宁南;罗敏南,西安交通大学助理教授;以及圣母大学(University of Notre Dame)博士生谭兆轩(zhaxuan Tan)。这项研究是由美国国家科学基金会职业奖资助的。

本文来自作者[撒连胜]投稿,不代表荣品号立场,如若转载,请注明出处:https://hdrpsteel.com/zehe/202412-12152.html

(47)

文章推荐

  • 重磅揭秘“手机小程序多乐跑得快开挂”其实确实有挂

    跑得快是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。跑得快可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义跑得快系统规律,只需要输入自己想要的开挂功能,一键便可以生成出跑得快专用辅

    2024年12月10日
    62
  • 今日热议“威乐家乡麻将有没有挂”(确实真的有挂)

    关于威乐家乡麻将有没有挂这个问题其实是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机麻将系统规律,只需要输入自己想要的开挂

    2024年12月20日
    49
  • 科普一下“微乐麻将开挂下载安装手机版”(其实真的能开挂)

    关于微乐麻将开挂下载安装手机版这个问题其实是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐麻将系统规律,只需要输入自己想要

    2024年12月21日
    56
  • 分享干货“微乐三打一挂3元一个”的确有挂

    关于微乐三打一挂3元一个这个问题其实是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐麻将系统规律,只需要输入自己想要的开挂

    2024年12月22日
    377
  • 介绍一款“微乐掼蛋开挂下载安装”分享装挂详细步骤

    关于微乐掼蛋开挂下载安装这个问题其实是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐小程序可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐小程序系统规律,只需要输入自己想要的

    2024年12月22日
    45
  • 今日实测“新道游大厅透视辅助软件”详细分享开挂

    关于新道游大厅透视辅助软件这个问题其实是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开

    2024年12月24日
    37
  • 价值460万英镑的Fareham公园总体规划正在讨论中

      议员们已获悉Fareham公园的未来计划,预算为460万英镑,涵盖新的休闲、社区及娱乐设施。FarehamParkVision描绘了自治市议会在HenryCort社区学院旁边建设新社区中心、户外娱乐设施及经济适用房的蓝图。市议会的康

    2024年12月26日
    34
  • 亵渎神明被告家属指认焚尸案中的个人

      海得拉巴,9月25日(ANI):ShahnawazKumbhar医生因亵渎神明而被指控,报道称他于9月18日在米尔普卡警方的一次计划性遭遇中被杀害。他的家人已确认与焚烧尸体案件相关的人员。据《论坛快报》报道,死者的姐夫穆罕默德·易卜拉欣·库姆哈尔投诉后,

    2024年12月27日
    39
  • 凯特·米德尔顿在乔治王子的问题上“输了”威廉王子的决定

      凯特·米德尔顿与威廉王子在抚养儿子乔治王子的问题上输掉了关键争论。在把孩子送到伊顿公学这件事上,威尔士王子和王妃的意见并不一致。伊顿公学是一所所有王室男孩都上过的寄宿学校。凯特似乎不想让乔治离开她,威廉坚持要把他的大孩子送到这所学校。一位知情人士说:“凯特一直不同意丈夫送他走

    2024年12月27日
    53
  • 俄罗斯对乌克兰发动导弹和无人机袭击,以报复乌克兰对一艘油轮的袭击

      基辅官员表示,俄罗斯在乌克兰部分地区发射了导弹和无人机袭击,造成六人死亡,莫斯科兑现了对俄罗斯油轮遭袭击进行报复的承诺。此外,莫斯科第二大机场星期天早上短暂停飞,此前俄罗斯首都附近发生了一起无人机袭击未遂事件。乌克兰空军表

    2024年12月28日
    31

发表回复

本站作者后才能评论

评论列表(4条)

  • 撒连胜
    撒连胜 2024年12月28日

    我是荣品号的签约作者“撒连胜”!

  • 撒连胜
    撒连胜 2024年12月28日

    希望本篇文章《人工智能模型检测社交机器人,但也加剧了问题》能对你有所帮助!

  • 撒连胜
    撒连胜 2024年12月28日

    本站[荣品号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 撒连胜
    撒连胜 2024年12月28日

    本文概览:  2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种...

    联系我们

    邮件:荣品号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们