ChatGPT 数据科学速查表

本篇文章目录|Table of Contents Hide
  1. 常规编码工作流程的提示
    1. 代码调试工作流程
      1. 调试 Python 代码
      2. 调试 R 代码
      3. 调试 SQL 代码
    2. 代码解释工作流程
      1. Python代码解释
      2. R代码解释
      3. SQL代码解释
    3. 代码优化工作流程
      1. Python代码优化
      2. R 代码优化
      3. SQL代码优化
    4. 代码简化工作流程
      1. Python 代码简化
      2. R 代码简化
      3. SQL 代码简化
    5. 代码翻译工作流程
      1. 从 R 到 Python 代码的翻译
      2. 从 Python 到 R 代码的翻译
    6. 代码质量和测试工作流程
      1. 比较 Python 中的函数速度
      2. 在 R 中编写单元测试
      3. 使用 Python 编写单元测试
  2. 数据分析工作流程提示
    1. SQL 数据分析工作流程
      1. 数据生成和创建表
      2. 公用表表达式
      3. 使用自然语言编写 SQL 查询
        1. 示例:SQL 中的数据聚合
        2. 示例:SQL 中的 7 天移动平均值
        3. 示例:SQL 中的窗口函数
        4. 示例:SQL 中的窗口函数
    2. Python 数据分析工作流程
      1. 数据生成工作流程
        1. 示例:生成 Markdown
        2. 示例:生成 CSV
        3. 示例:生成 JSON
      2. 数据清理工作流程
      3. Pandas 中的数据分析工作流程
        1. 示例:数据聚合
        2. 示例:数据合并
        3. 示例:数据重塑
        4. 示例:生成 Markdown
    3. R 数据分析工作流程
      1. 数据生成工作流程 
        1. 示例:生成 Markdown
        2. 示例:生成 CSV
        3. 示例:生成 JSON
      2. 数据清理工作流程
      3. tidyr 中的数据分析工作流程
        1. 数据聚合
        2. 数据合并
        3. 示例:数据重塑(长到宽)
        4. 示例:数据重塑(宽到长)
  3. 数据可视化工作流程提示
    1. R 数据可视化工作流程
      1. 在 ggplot2 中创建图表
      2. ggplot2 中的网格图可视化
      3. 注释和格式化图表
      4. 在 ggplot2 中更改情节主题
    2. Python 数据可视化工作流程
      1. 使用 matplotlib 创建图表
      2. 使用 matplotlib 创建配对图
      3. 在 matplotlib 中注释和格式化图表
      4. 在 matplotlib 中更改情节主题
  4. 机器学习工作流程的提示
    1. 通用机器学习工作流程
      1. 特征工程构思
    2. Python 机器学习工作流程
      1. 模型训练工作流程
      2. 超参数调整工作流程
      3. 模型可解释性工作流程
    3. R 机器学习工作流程
      1. 模型训练工作流程
      2. 超参数调整工作流程
      3. 模型可解释性工作流程
  5. 时间序列分析工作流程提示
    1. Python 时间序列分析工作流程
      1. 使用 Pandas 改变时间范围
      2. 建立测试系列模型
      3. 执行平稳性检验
    2. R 时间序列分析工作流程
      1. 改变时间范围 
      2. 改变时间范围 
      3. 执行平稳性检验
  6. 自然语言处理工作流程的提示
    1. 对文本情绪进行分类
    2. 创建正则表达式
    3. 文本数据集生成
    4. 机器翻译
  7. 概念和职业导向的提示
    1. 向企业高管解释数据概念
    2. 总结文章/论文
    3. 推荐投资组合项目和想法
    4. 编写教程
推荐指数

本文最后由 Demo Marco 更新于 2025-02-22. 如有资源已失效,请留言反馈,将会及时处理。 【推荐:不翻墙访问被墙网站方法 | 自用高速专线机场 | 高速CN2线路 | 高质量家宽住宅IP

ChatGPT 已席卷(数据)世界,并逐渐成为各种任务中最有用的工具之一。在此备忘单中,我们将重点介绍数据科学家可以在 ChatGPT 中作为其数据工作流程的一部分使用的有用提示。

chatgpt 备忘单.png

随身携带这份备忘单下载 PDF

常规编码工作流程的提示

代码调试工作流程

调试 Python 代码

我希望你是一名 Python 程序员,这里有一段 Python 代码,包含 {问题} — {插入代码片段} — 我收到以下错误 {插入错误}。错误的原因是什么?

调试 R 代码

我希望你是一名 R 程序员,这里有一段包含 {问题} — {插入代码片段} — 的 R 代码,我收到以下错误 {插入错误}。错误的原因是什么?

调试 SQL 代码

我希望你是一名 SQL 程序员,这里有一段包含 {问题} — {插入代码片段} — 的 SQL 代码,我收到以下错误 {插入错误}。错误的原因是什么?

代码解释工作流程

Python代码解释

我想让你解释一下 Python 中的代码。我不明白这个函数。你能解释一下它的作用吗,并提供一个例子?{插入函数}

R代码解释

我想让你解释一下 R 中的代码。我不明白这个函数。你能解释一下它的作用吗,并提供一个例子?{插入函数}

SQL代码解释

我希望你能解释一下 SQL 中的代码。我不明白这个代码片段。你能解释一下它的作用并提供一个例子吗?

{插入 SQL 查询}

代码优化工作流程

Python代码优化

我希望你担任 Python 代码优化师。{如果可能,请描述当前代码的问题}。你能让代码{更 Pythonic/更简洁/更高效/运行更快/更易读}吗?{插入代码}

R 代码优化

我希望你担任 R 中的代码优化师。{如果可能,请描述当前代码的问题}。你能让代码{更简洁/更高效/运行更快/更易读}吗?{插入代码}

SQL代码优化

我希望您担任 SQL 中的查询优化器。{如果可能,请描述当前代码中的问题}。您能建议一些方法让查询{运行得更快/更易读/更简单}吗?{插入代码}

代码简化工作流程

Python 代码简化

我想要你扮演一名 Python 程序员。请简化此代码,同时确保它{高效/易读/Pythonic}?{插入代码}

R 代码简化

我想要你扮演一名 R 程序员。请简化此代码,同时确保它{高效/易读}?{插入代码}

SQL 代码简化

我想要你担任 SQL 程序员。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。你能否简化此查询{同时确保其高效/易于阅读/插入任何其他要求}?

代码翻译工作流程

从 R 到 Python 代码的翻译

我想要你扮演一名 R 程序员。请将此代码翻译成 Python。{插入代码}

从 Python 到 R 代码的翻译

我想要你扮演一名 Python 程序员。请将这段代码翻译成 R。{插入代码}

代码质量和测试工作流程

比较 Python 中的函数速度

我想要你扮演一名 Python 程序员。你能编写代码来比较两个函数 和 的速度吗?{插入函数}

在 R 中编写单元测试

我想让你担任 R 程序员。你能为函数 编写单元测试吗?{插入单元测试要求(如果有)} {插入代码}

使用 Python 编写单元测试

我想让你担任 Python 程序员。你能为函数 编写单元测试吗?{插入单元测试要求(如果有)} {插入代码}

数据分析工作流程提示

SQL 数据分析工作流程

数据生成和创建表

我希望你充当数据生成器。你能在 {数据库版本} 中编写 SQL 查询来创建包含 {列名} 列的表 {表名} 吗?包括相关约束和索引。

公用表表达式

我想要你充当 SQL 代码程序员。我正在运行 {数据库版本}。你能使用 CTE 重写此查询吗?{插入查询}

使用自然语言编写 SQL 查询

示例:SQL 中的数据聚合

我希望你扮演数据科学家的角色。{插入表格描述}。你能对{插入过滤器}的{值}进行{计数/求和/取平均值}吗

示例:SQL 中的 7 天移动平均值

我想要你担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。你能写一个查询来查找 的 7 天移动平均值吗?

示例:SQL 中的窗口函数

我希望您担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。您能编写一个查找 {required window function} 的查询吗?

示例:SQL 中的窗口函数

我希望您担任数据科学家。我正在运行 {PostgreSQL 14/MySQL 8/SQLite 3.4/其他版本。}。我有表 ,即 {table description}。销售表由列 {column names} 组成。您能编写一个查找 {required window function} 的查询吗?

Python 数据分析工作流程

数据生成工作流程

示例:生成 Markdown

我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到

示例:生成 CSV

我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 CSV 文件吗?将文件保存到

示例:生成 JSON

我想要你用 Python 充当数据生成器。你能生成一个包含{数据要求}的 JSON 文件吗?将文件保存到

数据清理工作流程

我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个包含 {dataframe name} 数据的 CSV 文件,其中 {colum names} 为 {dataset context} 的列,请编写代码来清理数据?{插入数据要求}

Pandas 中的数据分析工作流程

示例:数据聚合

我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {列名} 组成的表 {表名},你能编写一个查找 {需求} 的查询吗?

示例:数据合并

我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个包含列 {列名} 的表 {表 1 名称} 和另一个包含列 {列名} 的表 {表 2 名称},请合并这两个表。{插入其他要求(如果有)}

示例:数据重塑

我想要你扮演一名使用 Python Pandas 编程的数据科学家。给定一个由列 {列名} 组成的表 {表名},你能否按 {列} 聚合 {值} 并将其从长格式转换为宽格式?

示例:生成 Markdown

我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到

R 数据分析工作流程

数据生成工作流程 

示例:生成 Markdown

我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 Markdown 文件吗?将文件保存到

示例:生成 CSV

我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 CSV 文件吗?将文件保存到

示例:生成 JSON

我想要你充当 R 中的数据生成器。你能生成一个包含{数据要求}的 JSON 文件吗?将文件保存到

数据清理工作流程

我希望你扮演一名使用 R tidyr 编程的数据科学家。你将获得一个包含列 {column name} 的 {dataframe name} 数据框。{插入要求}

tidyr 中的数据分析工作流程

数据聚合

我希望你扮演一名使用 R tidyr 编程的数据科学家。你将获得一个包含列 {column name} 的 {dataframe name} 数据框。{插入要求}

数据合并

我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe 1 name} 数据框。您还有一个包含列 {column name} 的 {dataframe 2 name} 数据框。找到 {required output} 

示例:数据重塑(长到宽)

我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为宽格式。

示例:数据重塑(宽到长)

我希望您扮演一名使用 R tidyr 编程的数据科学家。您将获得包含列 {column name} 的 {dataframe name} 数据框。请将数据转换为长格式。

数据可视化工作流程提示

R 数据可视化工作流程

在 ggplot2 中创建图表

我希望你扮演一名用 R 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称},使用 ggplot2 绘制 {图表类型和要求}。

ggplot2 中的网格图可视化

我希望您扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称}。使用 ggplot2 绘制配对图,显示一个变量与另一个变量之间的关系。

注释和格式化图表

我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制 {chart type} 中 之间的关系。{插入注释和格式要求}

在 ggplot2 中更改情节主题

我希望你扮演一名使用 R 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 ggplot2 绘制 {chart type} 中 之间的关系。更改颜色主题以匹配

Python 数据可视化工作流程

使用 matplotlib 创建图表

我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称},使用 matplotlib 绘制 {图表类型和要求}。

使用 matplotlib 创建配对图

我希望您扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {列名} 的数据框 {数据框名称}。使用 matplotlib 绘制一对图,显示一个变量与另一个变量之间的关系。

在 matplotlib 中注释和格式化图表

我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制 {chart type} 以表示 之间的关系。{插入注释和格式要求}

在 matplotlib 中更改情节主题

我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个包含列 {column names} 的数据框 {dataframe name},使用 matplotlib 绘制 {chart type} 来表示 之间的关系。更改颜色主题以匹配

机器学习工作流程的提示

通用机器学习工作流程

特征工程构思

我希望你扮演一名数据科学家。给定一个包含 的 {dataset name} 数据集,你需要预测 {predicted variable}。建议对此问题有帮助的数据并针对此问题执行特征工程。

Python 机器学习工作流程

模型训练工作流程

我希望你扮演一名使用 Python 编程的数据科学家。给定一个包含 {列名称} 的 {数据框名称} 数据集,编写代码来预测 {输出变量}。

超参数调整工作流程

我希望你扮演一名使用 Python 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数。

模型可解释性工作流程

我希望你扮演一名使用 Python 编程的数据科学家。给定一个预测{预测变量}的{模型类型},编写使用 Shap 值解释输出的代码。

R 机器学习工作流程

模型训练工作流程

我希望你扮演一名使用 R 编程的数据科学家。给定一个包含 {列名} 的 {数据框名称} 数据框,编写代码来预测 {输出}。

超参数调整工作流程

我希望你扮演一名用 R 编程的数据科学家。给定一个 {type of model} 模型,编写代码来调整超参数。

模型可解释性工作流程

我希望你扮演一名使用 R 编程的数据科学家。给定一个预测{预测变量}的{模型类型},编写代码使用 Shap 值解释输出。

时间序列分析工作流程提示

Python 时间序列分析工作流程

使用 Pandas 改变时间范围

我希望你扮演一名使用 Python 编写代码的数据科学家。给定 Pandas 数据框 {数据框名称} 中的时间序列数据,其中时间戳索引位于 {原始频率} 频率中,有一列 {列名称},将时间戳频率转换为 {所需频率}。

建立测试系列模型

我希望你扮演一个用 Python 编写代码的数据科学家。给定一个数据框 {数据框名称} 中的时间序列数据,其中包含时间戳索引,索引位于 {原始频率} 频率中,有一列 {列名称},建立一个预测模型,假设数据是平稳的。

执行平稳性检验

我希望你扮演一名使用 Python 编写代码的数据科学家。给定一个数据框 {dataframe name} 中的时间序列数据,该数据框带有时间戳索引,索引位于 {original frequency} 频率中,有一列 {column name},执行 Dicky Fuller 测试。

R 时间序列分析工作流程

改变时间范围 

我希望你扮演一名用 R 语言编写数据科学家的角色。给定数据框 {dataframe name} 中的时间序列数据,其中 {original frequency} 频率中有时间戳索引,且有一列 {column name},将时间戳频率转换为 {desired frequency}。

改变时间范围 

我希望你扮演一个用 R 语言编写代码的数据科学家。给定一个数据框 {dataframe name} 中的时间序列数据,其中带有时间戳索引,索引中包含 {original frequency} 频率和一列 {column name},将时间戳频率转换为 {desired frequency}

执行平稳性检验

我希望你扮演一名使用 R 语言编写数据科学家的角色。给定数据框 {dataframe name} 中的时间序列数据,其中时间戳为 {original frequency} 频率,有一列 {column name},执行 Dicky Fuller 测试。

自然语言处理工作流程的提示

对文本情绪进行分类

我希望你充当情绪分类器。将来自{描述文本来源}的以下文本分类为“积极”、“消极”、“中性”或“不确定”:{插入要分类的文本}。

创建正则表达式

我希望你扮演一名用 Python 编码的程序员,使用正则表达式来测试字符串是否{插入要求}。

文本数据集生成

我希望您充当数据集生成器。请根据{必需文本和上下文}生成{文本数量}文本。{插入其他要求}。

机器翻译

我想要你担任翻译。请将从{origin language}翻译为{translated language}。

概念和职业导向的提示

向企业高管解释数据概念

我想要你担任一家企业的数据科学家。{如果需要,请详细描述内容}请向企业高管解释的含义。

总结文章/论文

我想让你在一家研究初创公司担任数据科学家。请向{难度级别,例如软件开发人员、五岁儿童、企业高管、教授}解释这篇论文。

推荐投资组合项目和想法

我希望您担任数据科学职业教练。我是{描述您的背景},我想{描述职业目标}。建议投资组合项目和想法{描述投资组合目标}

编写教程

我想要你担任数据科学家作家。请为教程写字的简介。{插入相关要点}。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

You May Also Like