作者:Mitchell clark |
Benj Edwards|
编译:唐诗 |
(资料图片)
OpenAI 现宣布,它现在允许第三方开发者通过 API 将 ChatGPT 集成到他们的应用程序和服务中,这样做将比使用现有的语言模型便宜得多。
API(应用程序编程接口)是一组协议,允许不同的计算机程序相互通信。在这种情况下,应用程序开发人员可以使用OpenAI技术扩展其应用程序的功能,并根据使用情况持续收费。
此外,该公司还表示开放 Whisper 的 API,这是一种由人工智能驱动的语音转文本模型,并对其开发人员服务条款进行了一些重要更改。
ChatGPT 于11月下旬推出,可生成多种风格的连贯文本。Whisper是9月份推出的语音转文本模型,可以将语音音频转录为文本。
OpenAI 这次宣布的两项 API,可以说是相当炸裂了。
01
ChatGPT API,使用成本降低 90%
OpenAI 表示,gpt-3.5-turbo 与 ChatGPT 产品中使用的是相同的模型。它的费用是 1000 tokens 只需要 0.002 美元,将此前 GPT-3.5 使用成本降低 90%。
“这比我们现有的 GPT-3.5 模型便宜 90%”,部分原因是“一系列系统范围内的优化”。
虽然 1000 个 token 听起来似乎很多,但正常发送一个文本片段可能就需要花好几个 token。(这里提到的“Token”是指系统将句子和单词分解成的文本块,以便预测接下来应该输出什么文本。)根据 OpenAI 官方文档,“ChatGPT is great!”这组单词需要六个 token—— 它的 API 将其分解为“Chat”、“G”、“PT”、“is”、“great”和“!”。
该公司也为开发者提供了一个工具,用于检查解释一串文本需要多少 token。他们表示,按照一般的经验来看,在英语中“一个 token 通常对应大约 4 个字符”。
gpt-3.5-turbo 对于很多非聊天用例也是最佳模型,测试者只要将他们的 prompts 做少量调整,就能从 text-davinci-003 迁移到 gpt-3.5-turbo。
传统上,GPT 模型使用非结构化文本,这些文本在模型中表示为一系列 tokens。而 ChatGPT 模型改用具有元数据的消息序列。在后台,输入仍然作为 tokens 呈现给模型,模型使用的原始格式是一种被称为 Chat Markup Language(ChatML)的新格式。
OpenAI 创建了一个与 ChatGPT 模型交互的新端点。新 API 同样可以通过 Python 绑定的方式使用,只要「import openai」即可,具体代码如下所示。
该公司表示,如果开发人员通过该 API 运行大量数据,他们也可以获得一个专用的 ChatGPT 实例。据称,这样做可以让你更好地控制该模型,例如响应请求的时间,以及与机器人的对话可以持续多长时间等参数。
02
Whisper API,语音转录更便捷
虽然ChatGPT可能会引起最多的关注,但OpenAI还宣布了Whisper的另一个新API,即其语音转文本模型。该公司表示,您可以使用它来转录或翻译音频,费用为每分钟 0.006 美元。
从技术上讲,Whisper模型是开源的,因此您可以在自己的硬件上运行它而无需支付任何费用。它接受 M4A、MP3、MP4、MPEG、MPGA、WAV 和 WEBM 格式的输入,并且可以将音频转换为文本或以与熟练的人类转录员相当的速度转录,即使是困难的音频。
不过,Whisper也有其局限性,尤其是在“下一个单词”预测方面。OpenAI警告称,Whisper可能会在它的转录中包括一些实际上没有说过的单词,可能是因为它既试图预测音频中的下一个单词,又试图转录音频记录本身。
当OpenAI在2022年9月发布Whisper时,这听起来是一个很棒的发展,但由于实现的难度和成本,该模型的采用比ChatGPT慢得多。
而且,OpenAI可以访问更强大的硬件,因此,如果要快速运行或需要在手机等低功耗设备上进行转录,使用其API可能是最佳选择。
OpenAI还宣布了一些政策变更,据称这些变更是基于开发人员的反馈。其中一个大的变化是,除非客户明确同意,否则它将不再使用通过API提交的数据训练其模型。
换句话说,它正在从一个选择退出系统变成一个选择加入系统。这一变化可能有助于缓解一些人对将专有信息放入机器的担忧,因为一些公司已经完全禁止员工使用该技术。如果该系统是从用户输入中进行学习,那么输入商业机密并不是一个好主意,因为它总是有可能将这些数据传给其他人。
OpenAI还表示,它正在努力提高正常运行时间,其“工程团队的首要任务现在是生产用例的稳定性。”
03
全民AIGC时代
ChatGPT开放API最大的受益者是开发者,有开发者甚至用“变天了”来形容ChatGPT开放API对他们的影响。
在开放API后,价格被压低90%的情况下,利用 ChatGPT 辅助写作、创作的人,则可以在更多场合使用ChatGPT,并且使用的成本急遽下降,他们的创作则被极大地赋能。
除此以外,开放API,ChatGPT 还或许会迎来更多App和软件的开发者。接入 ChatGPT,对于互联网产品的交互方式会产生巨大的变化,也会让用户的使用体验得到巨大的提升。
未来的游戏,可以背靠ChatGPT做出栩栩如生的NPC(非玩家角色);未来的电商,可以为用户提供更好的推荐和比价等服务;未来的社交,能够更好地协助用户匹配,甚至帮助用户破冰,协助人际交往……
这也给了不少开发者传递出了积极的信号——积极拥抱 ChatGPT,或许能创造出更多更好的互联网产品,甚至改变未来人机交互的格局。
当然,ChatGPT自己,也能在这个时代中,获得高速发展的机会。廉价、高效的AI应用,足以帮助其快速地占领大片市场空白。
“天下武功,唯快不破”,在这个互联网市场的真理几乎颠扑不破。后来者如果没有明显更低的价格,或明显更强的性能,在 ChatGPT 站稳脚跟之后,就很难挑战它的地位。
占据了市场,比每1000 token 0.002美元的营收更重要的,是海量用户所提供的数据和产品反馈。
和开源的原理相同,一方面,大规模的使用能够产生大量的数据,进而反哺模型下一步的调整和进化;一方面,用户“用脚投票”,自然会流向更加具有商业价值的场景当中,转身为 ChatGPT 下一步的商业化提供赋能。
和普通开发者“共襄盛举”,ChatGPT API的发布,或许真的意味着,全民AIGC时代的到来。
参考链接:
https://www.theverge.com/2023/3/1/23620783/chatgpt-api-openai-pricing-whisper
https://arstechnica.com/information-technology/2023/03/chatgpt-and-whisper-apis-debut-allowing-devs-to-integrate-them-into-apps/
https://www.163.com/dy/article/HURLLII30511DPVD.html
本文提供的信息仅用于一般指导和信息目的,本文的内容在任何情况下均不应被视为投资、业务、法律或税务建议。