随着现在的主流大模型都能轻松通过图灵测试,这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准,可以更好地衡量究竟怎样AI才算拥有真正的智能。
在过去的一年里,如果你还在用图灵测试来评判一款大模型是否聪明,那可能已经有点跟不上节奏了。
从GPT-4、Claude 2、Gemini、LLaMA 3开始的这些模型,已经可以轻轻松松在图灵测试中拿到通行证。
有研究者甚至表示:图灵测试已经过时了。
只要模型在网上混得久一点、见多识广一点,就能骗过绝大多数人类评审。
问题是:一台会说话的机器,真的代表它理解你说的话吗?
在最近的Axel Springer颁奖典礼上,奥特曼和量子物理学家David Deutsch正面交锋,提出了一个新标准。

他们的对话中,一个大胆的提议浮出水面——图灵测试2.0。