本文最后由 Demo Marco 更新于 2025-02-22. 如有资源已失效,请留言反馈,将会及时处理。 【推荐:不翻墙访问被墙网站方法 | 自用高速专线机场 | 高速CN2线路 | 高质量家宽住宅IP】

在最近的 OpenAI DevDay上,该组织发布了一项备受期待的公告:推出 GPT-4 Turbo,这是其突破性 AI 模型的改进。在这里,我们全面了解 GPT-4 Turbo 是什么、它的主要功能以及它如何使开发人员和用户受益。
什么是 GPT-4 Turbo?
GPT-4 Turbo 是对现有GPT-4 大型语言模型的更新。它带来了多项改进,包括大大增加了上下文窗口和访问更多最新知识的能力。OpenAI 一直在通过添加自定义指令、ChatGPT 插件、DALL-E 3 和高级数据分析来逐步改进 ChatGPT 中 GPT-4 的功能。此最新更新带来了一系列令人兴奋的新功能。
什么是 GPT-4 Turbo With Vision?
带视觉的 GPT-4 Turbo 是 GPT-4 Turbo 的一个变体,它包含光学字符识别 (OCR) 功能。也就是说,您可以为其提供图像,它可以返回图像中包含的任何文本。例如,您可以输入菜单的照片,它会返回该照片中写的食物选择。同样,您可以提供发票的照片并自动提取供应商名称和商品详细信息。
“带视觉”功能将在 ChatGPT 中默认提供,开发人员可以通过在 OpenAI API 中选择“gpt-4-vision”模型来使用。
GPT-4 Turbo 主要功能
GPT-4 Turbo 与之前的型号相比有几项改进,增强了其功能。以下是使其脱颖而出的一些关键功能:
改进知识截止

Sam Altman 承诺确保 ChatGPT 保持最新状态
GPT-3.5 和 GPT-4 的现有版本的知识截止日期为 2021 年 9 月。这意味着,除非能够访问外部数据源,否则它们无法回答有关该时间之后发生的现实世界事件的问题。
GPT-4 将知识截止期限延长了 19 个月,至 2023 年 4 月。这意味着 GPT-4 Turbo 可以访问截至该日期的信息和事件,从而使其成为更明智和可靠的信息来源。此外,OpenAI 的首席执行官 Sam Altman 承诺“[OpenAI] 将努力不再让 [GPT] 过时。”
128K 上下文窗口
大型语言模型 (LLM) 的上下文窗口衡量了其对对话的记忆持续时间。如果模型的上下文窗口为 4,000 个标记(约 3,000 个单词),那么聊天中超过 4,000 个标记的所有内容都将被忽略,并且响应可能会变得不太准确,甚至与之前的响应相矛盾。这对于处理较长的文档或进行长时间对话的聊天机器人来说是一个问题。
GPT-4 的最大上下文长度为 32k(32,000)个 token。GPT-4 Turbo 将其增加到 128k 个 token(约 240 页,每页 400 个单词)。这超过了Anthropic 的 Claude 2 模型的最大上下文长度 100k ,并使其与Nous Research 的 YARN-MISTRAL-7b-128k 模型保持一致。
较长的上下文窗口是否能在整个窗口内带来令人满意的响应效果还有待观察。斯坦福大学最近的研究表明,现有的长上下文模型只有在检索文档开头或结尾附近的信息时才能提供准确的响应。
值得注意的是,128k 似乎只是实现“无限上下文”梦想的垫脚石。微软和西安交通大学的早期研究旨在将 LLM 扩展到十亿个上下文标记。
GPT 开始发售
OpenAI 已对 LLM 市场日益激烈的竞争作出回应,并降低了 GPT-4 Turbo 的价格,以方便开发人员使用。使用 OpenAI API 时,GPT-4 Turbo 输入代币的价格现在是之前价格的三分之一,从每 1000 个代币 3 美分降至 1 美分。输出代币的价格现在是一半,从每 1000 个代币 6 美分降至 3 美分。
GPT-3.5 Turbo 模型也延续了同样的趋势,输入代币便宜 3 倍,每 1000 个代币便宜 0.1 美分,输出代币便宜 2 倍,每 1000 个代币便宜 0.2 美分。
此外,经过微调的 GPT-3.5 Turbo 4K 模型输入代币现在便宜了 4 倍,价格从每 1000 个代币 1.2 美分降至 0.3 美分,输出代币便宜了 2.7 倍,从每 1000 个代币 1.6 美分降至 0.6 美分。训练价格保持不变,为每 1000 个代币 0.8 美分。
此次价格调整旨在让开发者能够更经济高效地使用先进的人工智能模型。
GPT 走向多模式:图像提示和文本转语音
“GPT-4 Turbo with vision” 已宣布即将推出。您很快就能使用图像作为提示来提示 GPT-4 Turbo,只需在聊天框中直接输入图像即可。然后,该工具将能够生成字幕或提供图像所描绘内容的描述。它还将处理文本转语音请求。
函数调用更新
函数调用是开发人员将生成式 AI 融入其应用程序的一项功能。它使他们能够向 GPT-4 Turbo 描述其应用程序或外部 API 的功能。通过在一条消息中调用多个函数,此功能简化了与模型的交互。例如,用户可以发送一条消息请求多个操作,从而无需与模型进行多次来回交互。
如何访问 GPT-4 Turbo
“所有付费开发者”都可以访问 GPT-4 Turbo,这意味着如果您有 API 访问权限,您只需在 OpenAI API 中传递“gpt-4-1106-preview”作为模型名称即可。同样,对于具有视觉功能的 GPT-4 Turbo,您可以传递“gpt-4-vision-preview”作为模型名称。
请注意,这些预览模型尚未被认为适合用于生产。不过,作为公告的一部分,Altman 还承诺将在未来几周内推出可用于生产的版本。
对于非开发人员来说,GPT-4 Turbo 可能会在未来几周内向 ChatGPT Plus 和 ChatGPT Enterprise 用户开放。
速率限制
通过 OpenAI API 访问 GPt 模型受到速率限制。也就是说,您每月只能向 API 发出有限数量的请求。OpenAI 现已发布有关速率限制如何运作的更清晰的指南,因此您的应用程序不会意外中断。
此外,GPT-4 的速率限制已翻倍
由于 GPT-4 Turbo 目前处于预览阶段,因此GPT-4 Turbo 的速率限制设置为每分钟 20 个请求和每天 100 个请求。OpenAI 表示他们目前不会为该模型增加速率限制。但是,一旦公开版本可用,他们很可能会这样做。