本文最后由 Demo Marco 更新于 2025-02-22. 如有资源已失效,请留言反馈,将会及时处理。 【推荐:不翻墙访问被墙网站方法 | 自用高速专线机场 | 高速CN2线路 | 高质量家宽住宅IP】
ChatGPT 已席卷(数据)世界,并逐渐成为各种任务中最有用的工具之一。在此备忘单中,我们将重点介绍数据科学家可以在 ChatGPT 中作为其数据工作流程的一部分使用的有用提示。

随身携带这份备忘单下载 PDF
常规编码工作流程的提示
代码调试工作流程
调试 Python 代码
我希望你是一名 Python 程序员,这里有一段 Python 代码,包含 {问题} — {插入代码片段} — 我收到以下错误 {插入错误}。错误的原因是什么?
调试 R 代码
我希望你是一名 R 程序员,这里有一段包含 {问题} — {插入代码片段} — 的 R 代码,我收到以下错误 {插入错误}。错误的原因是什么?
调试 SQL 代码
我希望你是一名 SQL 程序员,这里有一段包含 {问题} — {插入代码片段} — 的 SQL 代码,我收到以下错误 {插入错误}。错误的原因是什么?
代码解释工作流程
Python代码解释
我想让你解释一下 Python 中的代码。我不明白这个函数。你能解释一下它的作用吗,并提供一个例子?{插入函数}
R代码解释
我想让你解释一下 R 中的代码。我不明白这个函数。你能解释一下它的作用吗,并提供一个例子?{插入函数}
SQL代码解释
我希望你能解释一下 SQL 中的代码。我不明白这个代码片段。你能解释一下它的作用并提供一个例子吗?
{插入 SQL 查询}
代码优化工作流程
Python代码优化
我希望你担任 Python 代码优化师。{如果可能,请描述当前代码的问题}。你能让代码{更 Pythonic/更简洁/更高效/运行更快/更易读}吗?{插入代码}
R 代码优化
我希望你担任 R 中的代码优化师。{如果可能,请描述当前代码的问题}。你能让代码{更简洁/更高效/运行更快/更易读}吗?{插入代码}
SQL代码优化
我希望您担任 SQL 中的查询优化器。{如果可能,请描述当前代码中的问题}。您能建议一些方法让查询{运行得更快/更易读/更简单}吗?{插入代码}
代码简化工作流程
Python 代码简化
我想要你扮演一名 Python 程序员。请简化此代码,同时确保它{高效/易读/Pythonic}?{插入代码}
R 代码简化
我想要你扮演一名 R 程序员。请简化此代码,同时确保它{高效/易读}?{插入代码}
SQL 代码简化
我想要你担任 SQL 程序员。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。你能否简化此查询{同时确保其高效/易于阅读/插入任何其他要求}?
代码翻译工作流程
从 R 到 Python 代码的翻译
我想要你扮演一名 R 程序员。请将此代码翻译成 Python。{插入代码}
从 Python 到 R 代码的翻译
我想要你扮演一名 Python 程序员。请将这段代码翻译成 R。{插入代码}
代码质量和测试工作流程
比较 Python 中的函数速度
我想要你扮演一名 Python 程序员。你能编写代码来比较两个函数 和 的速度吗?{插入函数}
在 R 中编写单元测试
我想让你担任 R 程序员。你能为函数 编写单元测试吗?{插入单元测试要求(如果有)} {插入代码}
使用 Python 编写单元测试
我想让你担任 Python 程序员。你能为函数 编写单元测试吗?{插入单元测试要求(如果有)} {插入代码}
数据分析工作流程提示
SQL 数据分析工作流程
数据生成和创建表
我希望你充当数据生成器。你能在 {数据库版本} 中编写 SQL 查询来创建包含 {列名} 列的表 {表名} 吗?包括相关约束和索引。
公用表表达式
我想要你充当 SQL 代码程序员。我正在运行 {数据库版本}。你能使用 CTE 重写此查询吗?{插入查询}
使用自然语言编写 SQL 查询
示例:SQL 中的数据聚合
我希望你扮演数据科学家的角色。{插入表格描述}。你能对{插入过滤器}的{值}进行{计数/求和/取平均值}吗
示例:SQL 中的 7 天移动平均值
我想要你担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。你能写一个查询来查找 的 7 天移动平均值吗?
示例:SQL 中的窗口函数
我希望您担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。您能编写一个查找 {required window function} 的查询吗?
示例:SQL 中的窗口函数
我希望您担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。您能编写一个查找 {required window function} 的查询吗?
Python 数据分析工作流程
数据生成工作流程
示例:生成 Markdown
我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到
示例:生成 CSV
我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 CSV 文件吗?将文件保存到
示例:生成 JSON
我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 JSON 文件吗?将文件保存到
数据清理工作流程
我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个包含 {dataframe name} 数据的 CSV 文件,其中 {colum names} 为 {dataset context} 的列,请编写代码来清理数据?{插入数据要求}
Pandas 中的数据分析工作流程
示例:数据聚合
我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {列名} 组成的表 {表名},你能编写一个查找 {需求} 的查询吗?
示例:数据合并
我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个包含列 {列名} 的表 {表 1 名称} 和另一个包含列 {列名} 的表 {表 2 名称},请合并这两个表。{插入其他要求(如果有)}
示例:数据重塑
我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {列名} 组成的表 {表名},你能否按 {列} 聚合 {值} 并将其从长格式转换为宽格式?
示例:生成 Markdown
我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到
R 数据分析工作流程
数据生成工作流程
示例:生成 Markdown
我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到
示例:生成 CSV
我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 CSV 文件吗?将文件保存到
示例:生成 JSON
我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 JSON 文件吗?将文件保存到
数据清理工作流程
我希望你扮演一名使用 R tidyr 编程的数据科学家。你将获得一个包含列 {column name} 的 {dataframe name} 数据框。{插入要求}
tidyr 中的数据分析工作流程
数据聚合
我希望你扮演一名使用 R tidyr 编程的数据科学家。你将获得一个包含列 {column name} 的 {dataframe name} 数据框。{插入要求}
数据合并
我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe 1 name} 数据框。您还有一个包含列 {column name} 的 {dataframe 2 name} 数据框。找到 {required output}
示例:数据重塑(长到宽)
我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为宽格式。
示例:数据重塑(宽到长)
我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为长格式。
数据可视化工作流程提示
R 数据可视化工作流程
在 ggplot2 中创建图表
我希望你扮演一名用 R 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称},使用 ggplot2 绘制 {图表类型和要求}。
ggplot2 中的网格图可视化
我希望您扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称}。使用 ggplot2 绘制配对图,显示一个变量与另一个变量之间的关系。
注释和格式化图表
我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制 {chart type} 中 之间的关系。{插入注释和格式要求}
在 ggplot2 中更改情节主题
我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制 {chart type} 中 之间的关系。更改颜色主题以匹配
Python 数据可视化工作流程
使用 matplotlib 创建图表
我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称},使用 matplotlib 绘制 {图表类型和要求}。
使用 matplotlib 创建配对图
我希望您扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称}。使用 matplotlib 绘制一对图,显示一个变量与另一个变量之间的关系。
在 matplotlib 中注释和格式化图表
我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制 {chart type} 以表示 之间的关系。{插入注释和格式要求}
在 matplotlib 中更改情节主题
我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制 {chart type} 来表示 之间的关系。更改颜色主题以匹配
机器学习工作流程的提示
通用机器学习工作流程
特征工程构思
我希望你扮演一名数据科学家。给定一个包含 的 {dataset name} 数据集,你需要预测 {predicted variable}。建议对此问题有帮助的数据并针对此问题执行特征工程。
Python 机器学习工作流程
模型训练工作流程
我希望你扮演一名使用 Python 编程的数据科学家。给定一个包含 {列名称} 的 {数据框名称} 数据集,编写代码来预测 {输出变量}。
超参数调整工作流程
我希望你扮演一名使用 Python 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数。
模型可解释性工作流程
我希望你扮演一名使用 Python 编程的数据科学家。给定一个预测{预测变量}的{模型类型},编写使用 Shap 值解释输出的代码。
R 机器学习工作流程
模型训练工作流程
我希望你扮演一名使用 R 编程的数据科学家。给定一个包含 {列名} 的 {数据框名称} 数据框,编写代码来预测 {输出}。
超参数调整工作流程
我希望你扮演一名用 R 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数。
模型可解释性工作流程
我希望你扮演一名使用 R 编程的数据科学家。给定一个预测{预测变量}的{模型类型},编写代码使用 Shap 值解释输出。
时间序列分析工作流程提示
Python 时间序列分析工作流程
使用 Pandas 改变时间范围
我希望你扮演一名使用 Python 编写代码的数据科学家。给定 Pandas 数据框 {数据框名称} 中的时间序列数据,其中时间戳索引位于 {原始频率} 频率中,有一列 {列名称},将时间戳频率转换为 {所需频率}。
建立测试系列模型
我希望你扮演一个用 Python 编写代码的数据科学家。给定一个数据框 {数据框名称} 中的时间序列数据,其中包含时间戳索引,索引位于 {原始频率} 频率中,有一列 {列名称},建立一个预测模型,假设数据是平稳的。
执行平稳性检验
我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个数据框 {dataframe name} 中的时间序列数据,该数据框带有时间戳索引,索引位于 {original frequency} 频率中,有一列 {column name},执行 Dicky Fuller 测试。
R 时间序列分析工作流程
改变时间范围
我希望你扮演一名用 R 语言编写数据科学家的角色。给定数据框 {dataframe name} 中的时间序列数据,其中 {original frequency} 频率中有时间戳索引,且有一列 {column name},将时间戳频率转换为 {desired frequency}。
改变时间范围
我希望你扮演一个用 R 语言编写代码的数据科学家。给定一个数据框 {dataframe name} 中的时间序列数据,其中带有时间戳索引,索引中包含 {original frequency} 频率和一列 {column name},将时间戳频率转换为 {desired frequency}
执行平稳性检验
我希望你扮演一名使用 R 语言编写数据科学家的角色。给定数据框 {dataframe name} 中的时间序列数据,其中时间戳为 {original frequency} 频率,有一列 {column name},执行 Dicky Fuller 测试。
自然语言处理工作流程的提示
对文本情绪进行分类
我希望你充当情绪分类器。将来自{描述文本来源}的以下文本分类为“积极”、“消极”、“中性”或“不确定”:{插入要分类的文本}。
创建正则表达式
我希望你扮演一名用 Python 编码的程序员,使用正则表达式来测试字符串是否{插入要求}。
文本数据集生成
我希望您充当数据集生成器。请根据{必需文本和上下文}生成{文本数量}文本。{插入其他要求}。
机器翻译
我想要你担任翻译。请将从{origin language}翻译为{translated language}。
概念和职业导向的提示
向企业高管解释数据概念
我想要你担任一家企业的数据科学家。{如果需要,请详细描述内容}请向企业高管解释的含义。
总结文章/论文
我想让你在一家研究初创公司担任数据科学家。请向{难度级别,例如软件开发人员、五岁儿童、企业高管、教授}解释这篇论文。
推荐投资组合项目和想法
我希望您担任数据科学职业教练。我是{描述您的背景},我想{描述职业目标}。建议投资组合项目和想法{描述投资组合目标}
编写教程
我想要你担任数据科学家作家。请为教程写字的简介。{插入相关要点}。