首页
看点啥
插画图片
首页 看点啥 Codeium编写数据处理流程提示词如何完整表达限制条件

Codeium编写数据处理流程提示词如何完整表达限制条件

2026-07-05 0

数据清洗必须严格遵循业务规则,否则可能导致统计结果严重失真。以下是确保订单数据准确处理的关键要点。

明确列出所有硬性限制条件

为确保数据处理准确无误,所有约束条件必须清晰表述:

  1. 必须排除status为'cancelled'或'refunded'的订单
  2. order_amount字段需转换为数值后校验>0,非数字值统一置为NULL
  3. 仅处理created_at在2024-04-01至2024-06-30之间的记录
  4. 输出结果按user_id分组,返回各组sum(order_amount)、count(*)、max(created_at)三个字段

用「否则」句式绑定后果

每条限制条件都应附带违规后果说明:

  1. 订单状态为'refunded'的记录必须剔除,否则会导致GMV虚高12%以上
  2. order_amount未转数值就聚合,否则pandas会报TypeError且中断执行
  3. created_at未加日期范围过滤,否则将混入测试环境历史脏数据

提供带注释的输入输出样例

有效的数据样例应包含以下要素:

```csv order_id,user_id,status,order_amount,created_at ORD-001,U-101,paid,299.99,2024-05-12 14:30:00 # 正常有效订单 ORD-002,U-102,refunded,149.50,2024-05-10 09:15:00 # 必须剔除:status=refunded ORD-003,U-103,paid,abc,2024-05-08 20:45:00 # 必须转NULL:order_amount非数字 ```

输出示例应明确展示计算结果:

输出字段:user_id, total_amount, order_count, latest_order_time U-101, 299.99, 1, 2024-05-12 14:30:00 # total_amount=299.99(已剔除refunded/非法金额)

声明数据源与运行环境

数据处理需要明确以下环境要求:

  1. 输入为pandas DataFrame,列名固定为order_id,user_id,status,order_amount,created_at,无索引
  2. 使用pandas 2.0+,禁用for循环,必须用vectorized操作
  3. 遇到NaN的created_at按当前日期前推90天填充,不抛错

通过以上步骤规范数据清洗流程,可确保分析结果准确可靠,避免常见的数据处理陷阱。

喜欢(0)

上一篇

Poe节日营销文案提示词如何生成可发布版本

Poe节日营销文案提示词如何生成可发布版本

下一篇

文心一言创作品牌故事提示词如何摆脱模板化痕迹

文心一言创作品牌故事提示词如何摆脱模板化痕迹
猜你喜欢