本文最后由 Demo Marco 更新于 2025-02-22. 如有资源已失效,请留言反馈,将会及时处理。 【推荐:不翻墙访问被墙网站方法 | 自用高速专线机场 | 高速CN2线路 | 高质量家宽住宅IP】
随着 ChatGPT 的发布,人工智能及其应用在世界各地引起了广泛关注,尤其是在非技术高级业务利益相关者中。所有企业都希望利用他们在 ChatGPT 中体验到的技术,以适应他们的行业和发展。
但我们如何才能实现这个目标呢?
答案很简单:企业可以使用由 ChatGPT 制造商构建和提供的快速发展的 OpenAI API,创建根据企业需求定制的解决方案。
作为初级数据科学家和机器学习从业者,我们知道 OpenAI 已经存在了一段时间,甚至在 ChatGPT 炒作之前,但我们大多数人并没有使用它们来解决行业中的业务问题。随着近年来取得的所有进展,全面了解 API 比以往任何时候都更加重要。
在本教程中,我们将做到这一点:介绍 OpenAI 及其 API,从创建 OpenAI 帐户到使用 API 获取响应,并讨论使用 API 时的最佳实践,以提供 OpenAI API 的全面概述。
有兴趣看看 OpenAPI 的实际应用吗?查看我们 使用 OpenAI API 和 Pinecone 构建聊天机器人的代码:
https://www.youtube-nocookie.com/embed/xBBH7t_f1cU?si=s5f88eCzQoJNwRqc
OpenAI 及其 API 概述
OpenAI 是一家人工智能研究和部署公司,致力于确保通用人工智能造福全人类。
该公司成立于 2015 年,是一家非营利性公司,创始团队包括埃隆·马斯克和萨姆·奥特曼等人。多年来,OpenAI 从非营利性起步转变为更加多元化的模式,以实现其使命,并与微软等科技巨头建立了合作伙伴关系。
什么是 OpenAI API?
OpenAI API(应用程序编程接口)是通向 OpenAI 强大的机器学习模型的桥梁,使您能够相对轻松地将尖端的 AI 功能集成到您的项目中。
简单来说,API 就像一个助手,可让您在项目中使用 OpenAI 的智能程序。例如,您可以添加理解和创建文本等酷炫功能,而无需了解底层模型的所有细节。
OpenAI API 功能
对于任何希望将 AI 融入其业务的人来说,以下是使 OpenAI API 成为有价值的工具的一些关键功能:
1. 预先训练的人工智能模型
预训练模型是机器学习模型,在用于特定任务之前,已在大型数据集上进行过训练,通常是针对一般任务。OpenAI 团队已训练并以 API 形式发布这些模型,这意味着“它们训练一次,我们使用多次”,这可以节省大量时间和资源。
已发布的部分型号如下:
- GPT-4:GPT-3.5 模型的改进版本,能够理解和创建文本和代码。
- GPT-3.5 :: GPT-3 模型的增强版本,能够理解和生成文本或代码。
- GPT Base:可以处理和生成文本或代码,但缺乏指令遵循能力的模型。
- DALL·E:根据文本提示创建和修改图像的模型。
- 耳语:将音频输入转换为书面文本。
- 嵌入:将文本转换为数字值的模型。
- 审核:经过微调的模型,可识别潜在的敏感或不安全的文本。
这些模型已在大量数据上进行训练,并利用了极高的计算能力,而这通常是个人甚至许多组织无法获得或负担得起的。现在,数据科学家和企业可以轻松地以 API 的形式利用预先训练好的模型。
2.可定制的AI模型
OpenAI API 中的定制模型主要涉及称为微调的过程,该过程允许用户调整预先训练的模型以更好地适应他们的特定用例。
OpenAI API 允许我们采用预先训练的模型并使用我们的训练数据,进一步训练模型,并将经过微调的模型用于我们的用例。
3.简单的API接口
OpenAI API 平台直观易用,初学者也可以轻松使用。借助全面的文档和快速入门示例,只需几行代码,即可直接开始在您的用例中使用 API,而无需经历陡峭的学习曲线。
这种简单性对于数据职业生涯早期的个人来说非常有帮助,使得进入人工智能领域变得不那么令人生畏且更具吸引力。
4.可扩展的基础设施
OpenAI 已将Kubernetes 集群扩展到 7,500 个节点,为 GPT-3、CLIP 和 DALL·E 等大型模型以及快速小规模迭代研究提供可扩展的基础架构。Azure OpenAI 服务在 Azure 全球基础架构上运行,以满足关键企业安全性、合规性和区域可用性等生产需求,这表明可扩展的基础架构可支持 OpenAI API 的使用。
随着项目规模越来越大、越来越复杂,您需要一个可以随之成长的基础设施。OpenAI API 在使用量增加时能够扩展的能力在您从小型项目转向更大、要求更高的项目时尤其有用,这使得 OpenAI API 成为您项目的可靠工具。
OpenAI API 的行业用例
目前有超过 300 个应用程序正在通过 OpenAI API 使用 GPT-3,这表明全球正在开发大量富有创意和独特的应用程序。以下是 OpenAI API 的一些常见行业应用:
1.聊天机器人和虚拟助手
OpenAI API 能够理解和生成类似人类的文本,这使其成为创建智能聊天机器人和虚拟助手的首选。GPT-4 或 ChatGPT 等预训练模型可用于为能够自然直观地与用户互动的对话代理提供支持。这些代理可以部署在网站、应用程序或客户服务平台上,以增强用户参与度并提供自动化支持。
2. 情绪分析
情绪分析是关于理解文本数据背后的情绪。借助 OpenAI API,您可以分析客户评论、社交媒体评论或任何文本数据,以衡量公众舆论或客户满意度。通过利用GPT-4 或 3.5等模型,您可以自动化情绪分析过程,从而获得对业务战略至关重要的见解。
3.图像识别
尽管 OpenAI 通常与文本处理相关,但它也通过 CLIP 等模型涉足图像识别领域。CLIP 是一种从自然语言描述中学习视觉概念的模型,可以通过 OpenAI API 用于对象检测、图像分类等任务。这为医疗保健等各个领域开辟了可能性,其中图像识别可用于从图像数据中识别医疗状况。
4. 游戏和强化学习
OpenAI API 还可用于游戏行业和强化学习环境。模型可以经过训练或微调,与游戏环境进行交互,做出自主玩游戏或协助玩家玩游戏的决策。
OpenAI 已通过 Dactyl 等模型展示了这一点,该模型使用强化学习学会了解决魔方,而 OpenAI Five 则在 Dota 2 游戏中与人类玩家竞争。
现在我们已经了解了 OpenAI API 及其用例,让我们开始实际使用它。
实践:开始使用 OpenAI API
我们假设您是 OpenAI API 的初学者,并让您逐步地进行第一次 API 调用。
步骤 1:创建 OpenAI 平台账户
首先,您需要在 OpenAI 平台上建立一个帐户。
前往OpenAI 平台并按照提示创建帐户。注册后你应该会看到类似这样的内容:

第 2 步:获取 API 密钥
设置好您的帐户后,您将需要检索您的 API 密钥,这对于与 API 交互至关重要。
导航到您的 OpenAI 帐户上的 API 密钥页面,如下图所示。

您现在可以创建一个 API 密钥,您必须复制并妥善保存,因为您将无法再次查看它。但是,如果您丢失了它或需要新的密钥,则可以生成一个新的。

步骤 3:安装 OpenAI Python 库
现在帐户设置和 API 密钥已准备就绪,下一步是进行本地机器设置。我们可以通过 OpenAI 的 Python 库从本地机器访问 OpenAI API。
您可以使用以下命令使用 pip 安装它:
pip install openai
步骤 4:进行第一次 API 调用
现在您已经安装了 API 密钥和 OpenAI 库,是时候进行第一次 API 调用了。
以下是执行此操作的代码:
def get_chat_completion(prompt, model="gpt-3.5-turbo"):
# Creating a message as required by the API
messages = [{"role": "user", "content": prompt}]
# Calling the ChatCompletion API
response = openai.ChatCompletion.create(
model=model,
messages=messages,
temperature=0,
)
# Returning the extracted response
return response.choices[0].message["content"]
response = get_chat_completion("Translate into Spanish: As a beginner data scientist, I'm excited to learn about OpenAI API!")
print(response)
我们编写了一个辅助函数来通过选择“gpt-3.5-turbo”模型来使用 ChatCompletion API,该模型接受用户生成的提示并返回响应。
以下是答复(如果您懂一点西班牙语,请随时验证!):

第五步:进一步探索
完成首次 API 调用后,您就大功告成了!以下是需要考虑的几个后续步骤:
- 探索不同的引擎并找到最适合您的用例的引擎。
- 尝试不同的提示和参数来查看 API 如何响应。
- 深入研究OpenAI 文档,了解有关如何使用 API 的更多信息。
这里的想法是,您必须从这里集思广益,考虑如何使用 API 解决手头的业务问题(本教程结束时提供了更多资源。)
使用 OpenAI API 的最佳实践
现在您已经可以轻松地开始使用 API,在项目中使用它们之前,请注意以下一些最佳做法:
1. 了解 API 的定价
该 API 提供一系列模型,每个模型具有不同的功能和价格点,采用按使用量付费的方式。费用按每 1,000 个代币计算,其中代币本质上是单词片段,1,000 个代币相当于约 750 个单词。您可以从OpenAI 定价页面找到所有模型的最新定价。
注册后,您将获得 5 美元的免费信用额度,可在前三个月内使用。在决定付款之前,您可以试用教程并更好地了解 API。
2. 保护您的 API 密钥
不要直接在应用程序的源代码中对 API 密钥进行硬编码,而是使用环境变量来存储和检索 API 密钥,这是一种更安全的做法。
管理硬编码 API 密钥也极具挑战性,尤其是在团队环境中。如果需要轮换或更改密钥,则需要找到并更新源代码中硬编码密钥的每个实例。
3. 使用最新模型
当有多个版本可用时,OpenAI 建议使用最新模型来解决您想要解决的问题。这是有道理的,因为较新的模型功能更强大,但成本也更高。一般来说,值得尝试一些可用的模型,并选择最适合您用例需求的模型,同时考虑成本与性能的权衡。
4. 通过批处理有效利用代币限制
批处理是一种技术,允许您将多个任务分组为一个 API 请求,以便有效地一起处理它们,而不是为每个任务发送单独的请求。
OpenAI API 对每分钟可处理的请求数和每分钟可处理的令牌数分别施加了限制。如果您达到了每分钟请求数限制,但每分钟令牌数限制中还有未使用的容量,则批处理可以帮助有效利用此容量。
通过将多个较小的任务分组为单个请求,您可以减少发送的请求总数,同时可能在单个请求中处理更多令牌,从而保持在速率限制之下并优化成本。
结论
如果您是数据科学领域的新手,您可能对 API 了解不多。虽然这在过去很正常,但随着 OpenAI 等公司在 AI 领域的快速进步和能力,了解如何通过 API 有效使用预训练模型(并对其进行微调)已成为每位数据科学家节省时间、成本和其他资源的必备技能。
本教程介绍了 OpenAI、其 API 以及一些常见的行业特定用例。它还指导您亲手使用 OpenAI API 以及要遵循的最佳实践。