GPT-4偷袭发布！ChatGPT能识图和逻辑推理，靠自己考上斯坦福【附发布会中英文字幕版】-- 迪族网

GPT-4偷袭发布！ChatGPT能识图和逻辑推理，靠自己考上斯坦福【附发布会中英文字幕版】

来源：物联网智库　2023-03-18 17:35:01

(相关资料图)

物联网智库整理发布

导读

今日凌晨1点，OpenAI正式推出GPT-4。

一觉醒来，GPT-4突然间就来了，而这距离ChatGPT的发布，才仅仅过去了四个多月。

此前，曾传闻GPT-4有100万亿参数，比现在的ChatGPT强大500多倍，不过这一说法很快被辟谣。近日，OpenAI的CTO曾经对媒体表示，让大家“少一些关于GPT-4的炒作会更好”，而从今天发布的GPT-4来看，这句话多少带点欲扬先抑的意味。在发布的博文中，OpenAI这样表示：

GPT-4是OpenAI努力扩展深度学习的最新里程碑，它是一个大型多模态模型（接受图像和文本输入，提供文本输出），虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平。

GPT-4都强在哪里

加入图片识别功能

和外界此前的猜测一样，GPT-4是一个多模态大型语言模型，不再仅仅处理文本数据，对图片也有了理解能力。但相比于此前各大科技公司推出的多模态模型，GPT-4可以说是遥遥领先。虽然官方表示，GPT-4现在只开放了文字输入的功能，图片输入功能还在加紧开发中。但在官方的文章中，OpenAI给出了几个使用范例，如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等，已经让人大开眼界。

在OpenAI官方发布的视频中，GPT-4通过识别上图中随便画出的草图，就识别出了这是一个关于网站的草图，然后“顺手”生成了建成这个网页的全部代码，再然后...一个网站就这样建成了。

强大的推理能力

还有一个官方示例也值得一提，当被问到下图的笑点在哪里时，GPT-4的回答更是让人惊叹：“这张图片中的幽默来自于将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法”，从这一回答中可以看出，GPT-4所具备的推理能力已经有了大幅度提高。

一直以来，人工智能虽然表现出了强大的能力，但逻辑推理依然是人类区别于AI的最显著特征，而GPT-4表现出的逻辑和推理能力，需要所有人开始重新思考人类区别于AI的本质到底是什么。

支持更长的输入和输出

相比于ChatGPT，GPT-4可接受的文字输入长度增加到3.2万个Token，约2.4万单词，同时也支持更长的输出，大约能处理长达25000字的文本，这使得更多的应用场景变为可能，例如长文本的创建、超长对话和文档的搜寻和分析等，仅需一次对话，就足够写一部剧本或者短篇小说了。

考试能力超过90%人类

对于GPT-4来说，最强的并不是视觉能力的加入，因为很多的多模态模型早就已经做出了类似的功能，其最亮眼的功能是它所表现出的推理能力，在GRE、SAT和美国法学院考试等我们较为熟悉的美国考试中，GPT-4的得分几乎和人类考生没有区别了，其中，GPT-4在模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。在GRE考试中的数学部分，满分是170分，GPT-4获得163分，而上一代GPT-3.5得分为147分，在GRE语言部分，GPT-4得分为169分，GPT-3.5得分为154分。

也就是说，GPT-4已经可以靠自己考上斯坦福大学。

从下图中也可以看出，GPT-4相比于GPT-3.5，在多项专业考试中都有了巨大的提升（绿色部分为GPT-4提升的部分）。不过，OpenAI官方也警告说，新版本还不完美，在许多情况下，它的能力不如人类。

支持更多语言

许多现有的机器翻译的基准测试都是用英语编写的。而为了初步了解 GPT-4 在其他语言上的能力，OpenAI的研究团队还使用Azure Translate将MMLU基准翻译成多种语言，这套基准涵盖了57个主题的14000个多项选择题，在测试的26种语言的24种中，GPT-4全部优于GPT-3.5和其他大语言模型。

以上这些也仅仅只是OpenAI官方示例的一小部分，OpenAI的总裁和联合创始人还展示了GPT-4有关总结文章、写代码、报税、写诗等一系列能，可以说GPT-3.5做不到的， GPT-4大都可以轻松解决。

微软新必应早已用上GPT-4

GPT-4发布之后，微软在第一时间表示：“如果你在过去五周内的任何时候使用过新的 Bing 预览版，你就已经提前了解了 OpenAI 最新模型的强大功能”。是的，新版必应搜索早已经用上了GPT-4，在过去五周中，很多人体验的必应就是GPT-4加强过的，只不过仅仅开放使用了文字能力而已。虽然微软没有用全球首发的字眼来描述，毕竟微软在OpenAPI上已经投入了130亿美元（约合人民币900亿元），换来的这样的待遇也是情理之中。

在搜索上，微软的必应长期以来都无法跟谷歌相竞争，市场份额更是差了一个量级，但是随着ChatGPT的问世，微软率先接入使用，CEO纳德拉表示他们的搜索已经优于谷歌了。而这次GPT-4也被曝用在了必应搜索中，不知道谷歌方面是否依然还能“坐怀不乱”。

可以说，微软是ChatGPT和GPT-4的最大赢家。在过去的两年里，OpenAI重建了整个深度学习堆栈，并利用微软的Azure设计了一台超级计算机，以便于应对他们超高的工作负载，通过此前获得的经验，GPT-4才能快速而稳定的完成了GPT-4的训练，也为微软的云服务赢得了更多的业务。

如何才能用上GPT-4