关键词搜索
底部横幅广告

美科学家实证研究:现代人工智能系统通过图灵测试

【金色港湾资讯网为您推荐阅读】

机器装人骗过你眼睛 圣迭戈五百人参与测试

近日,美国加州大学圣迭戈分校有着科学家,他们公布了一项重磅研究结果,那就是现代人工智能系统,首次在严格实施实验里通过了让那图灵测试,这意味着AI现在能够逼真去模仿人类对话,以致于能使得人们难以分辨对面究竟是机器还是真人,而且这项研究还发表在了最新一期的《美国国家科学院院刊》之上,并且进行这项研究时共有近500人去参与实验之举,这其中包含大学生以及在线展开招募得来的普通网友。

英国数学家、有“计算机科学之父”之称的阿兰·图灵于1950年提出了图灵测试,它是检验机器能不能像人那般聊天的关键判别标准。简而言之,若是一台机器在对话期间致使他人误认其为真人,那就算是通过了测试。此次实验是首个严格运用图灵测试去评估大语言模型的研究,结果一经公布,马上引发了科技界以及普通民众的普遍关注。

四个模型同台竞技 GPT-4.5表现最惊艳

在实验里头,参与者是同时跟两方展开聊天的,其中一方是人类,而另一方则是AI模型,研究人员针对四个模型做了测试,那个四个模型分别是最先进的GPT - 4.5以及LLaMa - 3.1 - 405B,还有较旧的GPT - 4o以及上世纪60年代的经典聊天机器人ELIZA,测试结果表明,GPT - 4.5在73%的情形下是被判定为人类的,甚至比真人还要像真人,也就是说参与者选择它作为“人类”的频率,显著高于选择真实人类参与者的频率。

它也毫不示弱,在存在着某些情况之下被选定作为“人类”,并且这个情况占到了百分之五十六,于此种状况下它与真实人类的表现不存在显著的差异。然而老款那一类的模型就显得逊色许多了:其中ELIZA只有在具备百分之二十三的情况时才会被误以为是人类的表现,而GPT - 4o则仅仅是在百分之二十一它出现的时候才会被错认为人类。这也就表明了,人工智能在模拟拟人类像具备人类特征这一方面的能力在过去的几年时间里面有极大的进步,特别是最新的那一批模型已经达到了一种能够使得真人与模拟者之间难易辨别清楚的程度。

美科学家实证研究:现代人工智能系统通过图灵测试(图1)

AI装人靠的不是知识 而是会犯傻会幽默

有不少人觉得,有着通过图灵测试这般情况的AI,得凭借展现出渊博的知识才行,然而研究得到的结果却正好相反 ,科学家提出,这些大语言模型能够骗过人类,并非源于它们具备多聪明、多博学的特质,而是在于它们学会了像人那样出现犯错的情况、讲出让人觉得有趣的话语,甚至还呈现出直率以及幽默这些特点 ,比方说,GPT一4.5在对话期间会特意表现得有点“愚笨”,又或者去开个玩笑,如此一来就让它看上去更为真实。

团队提出,每一个大语言模型都具备自身独有的“性格”,它们能够设定特定的人物设定 和沟通风格,使得人感觉仿佛是在与一个真实存在的人进行交谈,而非面对着冰冷的机器,这种对于社会行为特征的呈现,对于人们怎样看待AI有着重大的意义,未来我们或许真的不能够凭借聊天来判定对方究竟是不是人了。

不给提示AI就露馅 装人还得靠指令

然而,研究察觉到了一项关键前提,要是不对AI予以清晰提示,那它的装人能力便会大幅降低,在实验里,在研究人员未给GPT - 4.5任何有关“怎样像人那般说话”的指令之际,它被错认为人类的概率由73%陡然降至36%,同样,LLaMa - 3.1 - 405B的获选率也降到了38%,老款模型ELIZA和GPT - 4o更是低得令人咋舌。

这体现出,AI去装人并非是天生就具备的那种能力,而是得要人类给予它“剧本”以及“人设”。科学家觉得,此发现十分重要,缘由在于它揭开了AI的本质——它依旧是一台依照指令去执行任务的机器,只不过是在特定情形下能够模仿得极为逼真。这给我们敲响了警钟,千万别轻易被AI呈现出的“人样”给迷惑住,在关键时候还是得多留个心眼儿。

技术进步的利与弊 社区生活可能改变

美科学家实证研究:现代人工智能系统通过图灵测试(图2)

这样一项技术突破会给普通人的生活带去怎样的影响呢?专家进行分析,短期内最为明显的变化或许存在于客服、咨询、教育等这些领域。举例来说,往后当你拨打一个电话去询问银行相关问题时,对面所呈现的可能会是伪装成真人模样的AI,而非那冷冰冰的语音菜单了。社区里的某些服务,像是针对老年人的陪伴以及儿童的学习辅导,也极有可能会运用上这类AI,从而使得互动能变得更为自然。

那技术可是存在隐患的呀,要是AI能够完美地去装人,网络诈骗以及虚假信息传播的风险就会有所增添呢,骗子有可能借助AI去冒充亲友或者工作人员,进而骗取信任以及钱财,社区里特别是老年群体,就得提高警惕,要学会去识别这些“假人”,未来,我们大概得学会运用新的方式去验证对方身份,像要求语音视频或者线下见面这样。

图灵测试的意义变了 AI未来何去何从

图灵测试当初旨在检验机器是否具备“思考能力”,但于今科学家觉得,此标准或许得重新予以审视。研究察觉,AI借助模仿社交行为通过测试,并非依靠数学及逻辑解题能力。这跟当年图灵所设想之事不太相同——机器并非处于“思考”状态,而是在进行“表演”。

团队发出呼吁,在未来针对AI展开评估之时,不能仅仅着眼于它可不可以骗过人类这种情况,而更应当着重关注它是不是具备可靠、安全以及公平的特性。对于那些身为社区居民的人们来讲,这就意味着我们不但要尽情享用AI所带来的便利之处,而且还得始终保持头脑清醒。你能够尝试着跟AI去进行一番聊天,瞧瞧能不能辨别出它究竟是机器还是真人?欢迎诸位在评论区分享各自的经历,同时点赞并发动转发,从而让更多的人去了解这一全新的变化!

看完这篇文章,你觉得你能在聊天中分辨出对面是真人还是AI吗?欢迎在评论区分享你的看法,点赞转发让更多人参与讨论!

更多精彩文章请关注=>金色港湾资讯网 www.fzjsgw.com

分享更多
0
加载中~

您可能还会对下面的文章感兴趣:

底部横幅广告