[关闭]
@hhlf282 2026-03-20T01:03:58.000000Z 字数 7218 阅读 23

养虾教程 - 详细执行步骤

目标: 详细解释每个阶段的具体执行步骤
版本: 1.0
创建时间: 2026-03-19


Phase 1: 基础认知期 (1-2 周)

目标

让 AI 理解 Daraz 平台规则和选品逻辑,能够回答基础问题,给出简单选品建议。


第 1-3 天:平台规则学习

任务 1.1: 收集平台规则文档

负责人: 运营专员
交付物: 《Daraz 平台规则手册》

执行步骤:

  1. Step 1: 访问 Daraz 官方资源
  2. ├─ Daraz 大学:http://university.daraz.pk/
  3. ├─ 卖家中心:https://seller.daraz.com.my/
  4. └─ 帮助中心:https://buyer-helpcenter.daraz.pk/
  5. Step 2: 收集以下文档
  6. ├─ 禁售/限售商品列表
  7. ├─ 各类目佣金费率表
  8. ├─ 物流时效要求
  9. ├─ 卖家评分规则
  10. ├─ 退换货政策
  11. └─ 违规处罚规则
  12. Step 3: 整理成文档
  13. ├─ 使用 Markdown 格式
  14. ├─ 按主题分类
  15. ├─ 标注重点内容
  16. └─ 保存至:docs/platform-rules.md

文档结构示例:

  1. # Daraz 平台规则手册
  2. ## 1. 禁售商品
  3. ### 1.1 绝对禁售
  4. - 武器、弹药
  5. - 毒品、违禁药品
  6. - 仿牌商品
  7. - 成人用品
  8. ### 1.2 限制销售
  9. - 食品(需卫生许可)
  10. - 化妆品(需 FDA 认证)
  11. - 电子产品(需 CE 认证)
  12. ## 2. 佣金费率
  13. | 类目 | 佣金率 | 备注 |
  14. |------|--------|------|
  15. | 服装 | 8% | - |
  16. | 电子 | 5% | - |
  17. | 家居 | 10% | - |
  18. ...

任务 1.2: 整理历史选品案例

负责人: 运营主管
交付物: 50 个成功/失败案例

执行步骤:

  1. Step 1: 从内部系统导出历史数据
  2. ├─ 成功产品列表 (月销>100 单)
  3. ├─ 失败产品列表 (月销<50 单或下架)
  4. └─ 产品评估记录
  5. Step 2: 选择典型案例
  6. ├─ 成功案例:30
  7. ├─ 不同类目分布
  8. ├─ 不同价格区间
  9. └─ 不同时间段
  10. ├─ 失败案例:20
  11. ├─ 不同失败原因
  12. ├─ 不同风险类型
  13. └─ 不同时间段
  14. Step 3: 按标注规范整理
  15. ├─ 使用数据标注模板
  16. ├─ 填写成功/失败因素
  17. ├─ 填写经验教训
  18. └─ 保存至:data/labeled-cases/

案例选择标准:

类型 标准 数量
成功案例 月销>100 单,毛利率>25% 30
失败案例 - 竞争 竞争过度导致失败 8
失败案例 - 供应链 断货/质量问题 6
失败案例 - 政策 违规下架 4
失败案例 - 其他 其他原因 2

任务 1.3: 构建 AI 知识库

负责人: 程序员
交付物: 向量数据库 + 知识图谱

执行步骤:

  1. Step 1: 准备知识文档
  2. ├─ 平台规则文档 (任务 1.1)
  3. ├─ 历史案例文档 (任务 1.2)
  4. ├─ 选品 SOP 文档
  5. └─ 常见问题 FAQ
  6. Step 2: 文档预处理
  7. ├─ 文本分块 (每块 500-1000 字)
  8. ├─ 去除无关内容
  9. ├─ 添加元数据 (来源、日期、类型)
  10. └─ 保存为 JSONL 格式
  11. Step 3: 向量化
  12. ├─ 选择嵌入模型 (text-embedding-3-large)
  13. ├─ 批量生成向量
  14. └─ 存入向量数据库 (Pinecone/Milvus)
  15. Step 4: 测试检索
  16. ├─ 准备测试问题 (20 个)
  17. ├─ 测试检索准确率
  18. └─ 优化分块策略

代码示例:

  1. # 文档向量化
  2. from langchain.text_splitter import RecursiveCharacterTextSplitter
  3. from langchain.embeddings import OpenAIEmbeddings
  4. from langchain.vectorstores import Pinecone
  5. # 1. 加载文档
  6. with open('docs/platform-rules.md', 'r') as f:
  7. content = f.read()
  8. # 2. 文本分块
  9. text_splitter = RecursiveCharacterTextSplitter(
  10. chunk_size=800,
  11. chunk_overlap=100,
  12. separators=["\n\n", "\n", "。", ""]
  13. )
  14. chunks = text_splitter.split_text(content)
  15. # 3. 生成向量
  16. embeddings = OpenAIEmbeddings(model='text-embedding-3-large')
  17. vectors = embeddings.embed_documents(chunks)
  18. # 4. 存入向量数据库
  19. vectorstore = Pinecone.from_documents(
  20. documents=[Document(page_content=c) for c in chunks],
  21. embedding=embeddings,
  22. index_name='daraz-knowledge'
  23. )
  24. # 5. 测试检索
  25. query = "Daraz 禁售商品有哪些?"
  26. results = vectorstore.similarity_search(query, k=3)
  27. print(results[0].page_content)

第 4-7 天:基础数据爬取

任务 1.4: Daraz 数据爬取

负责人: 程序员
交付物: 1000 SKU 商品数据

执行步骤:

  1. Step 1: 部署爬虫环境
  2. ├─ 安装 Scrapy: pip install scrapy
  3. ├─ 配置代理 IP
  4. ├─ 设置数据库连接
  5. └─ 测试爬虫运行
  6. Step 2: 爬取 TOP 10 类目
  7. ├─ Fashion (服装)
  8. ├─ Electronics (电子)
  9. ├─ Home & Living (家居)
  10. ├─ Health & Beauty (美妆)
  11. ├─ Baby & Toys (母婴)
  12. ├─ Sports & Outdoors (运动)
  13. ├─ Food & Beverages (食品)
  14. ├─ Pet Supplies (宠物)
  15. ├─ Automotive (汽配)
  16. └─ Books & Media (图书)
  17. Step 3: 每个类目爬取 100 个商品
  18. ├─ 商品标题
  19. ├─ 价格信息
  20. ├─ 销量数据
  21. ├─ 评价信息
  22. ├─ 卖家信息
  23. └─ 商品图片
  24. Step 4: 数据清洗入库
  25. ├─ 去重
  26. ├─ 格式化
  27. ├─ 验证完整性
  28. └─ 存入数据库

爬取进度追踪:

  1. -- 查看爬取进度
  2. SELECT
  3. category_name,
  4. COUNT(*) as product_count,
  5. MIN(crawl_time) as first_crawl,
  6. MAX(crawl_time) as last_crawl
  7. FROM products
  8. GROUP BY category_name
  9. ORDER BY product_count DESC;

任务 1.5: 1688 供应链数据对接

负责人: 程序员
交付物: 1688 API 对接完成

执行步骤:

  1. Step 1: 申请 1688 API 账号
  2. ├─ 访问:https://open.1688.com/
  3. ├─ 注册开发者账号
  4. ├─ 创建应用获取 AppKey
  5. └─ 等待审核 (1-2 工作日)
  6. Step 2: 开发对接代码
  7. ├─ 商品搜索 API
  8. ├─ 商品详情 API
  9. ├─ 供应商信息 API
  10. └─ 价格库存 API
  11. Step 3: 测试 API 调用
  12. ├─ 搜索测试商品
  13. ├─ 获取商品详情
  14. ├─ 验证数据准确性
  15. └─ 处理限流问题
  16. Step 4: 建立商品匹配
  17. ├─ 基于标题相似度
  18. ├─ 基于图片相似度
  19. ├─ 人工审核匹配结果
  20. └─ 存入 product_sources

代码示例:

  1. # 1688 API 调用示例
  2. import requests
  3. def search_1688(keywords, page=1):
  4. """
  5. 搜索 1688 商品
  6. """
  7. url = "https://open.1688.com/api/search"
  8. params = {
  9. "app_key": "your_app_key",
  10. "q": keywords,
  11. "page": page,
  12. "page_size": 20
  13. }
  14. response = requests.get(url, params=params)
  15. data = response.json()
  16. return data['items']
  17. # 测试
  18. items = search_1688("无线蓝牙耳机")
  19. for item in items:
  20. print(f"{item['title']}: {item['price']} RMB")

第 8-10 天:AI 基础训练

任务 1.6: AI 问答能力训练

负责人: 程序员 + AI 训练师
交付物: AI 能准确回答平台规则问题

执行步骤:

  1. Step 1: 准备训练数据
  2. ├─ 平台规则问答对 (100 对)
  3. ├─ 选品流程问答对 (50 对)
  4. ├─ 禁售商品判断 (50 对)
  5. └─ 佣金计算问答 (50 对)
  6. Step 2: 配置 RAG 系统
  7. ├─ 连接向量数据库
  8. ├─ 配置检索参数
  9. ├─ 设置 prompt 模板
  10. └─ 测试检索效果
  11. Step 3: 测试问答准确率
  12. ├─ 准备测试问题 (50 个)
  13. ├─ 人工评估答案准确性
  14. ├─ 记录错误类型
  15. └─ 优化检索策略
  16. Step 4: 达到验收标准
  17. ├─ 规则问题准确率 >90%
  18. ├─ 禁售判断准确率 >95%
  19. ├─ 佣金计算准确率 >95%
  20. └─ 运营评分 >7/10

测试问题示例:

  1. 1. Daraz 禁售商品有哪些类别?
  2. 2. 服装类目的佣金费率是多少?
  3. 3. 食品类商品需要什么认证?
  4. 4. 卖家评分低于多少会被处罚?
  5. 5. 退换货政策是怎样的?
  6. 6. 这个产品能卖吗?[提供商品描述]
  7. 7. 售价 2000 LKR 的商品,佣金是多少?

第 11-14 天:简单选品测试

任务 1.7: 简单选品建议测试

负责人: 运营 + AI
交付物: 选品建议准确率>80%

执行步骤:

  1. Step 1: 准备测试商品池
  2. ├─ 从爬取数据中选择 100 个商品
  3. ├─ 覆盖不同类目
  4. ├─ 覆盖不同价格区间
  5. └─ 隐藏实际销售数据
  6. Step 2: AI 给出选品建议
  7. ├─ 输入商品信息
  8. ├─ AI 评估并打分
  9. ├─ 给出推荐/不推荐建议
  10. └─ 记录推荐理由
  11. Step 3: 运营人工评估
  12. ├─ 运营独立评估同样商品
  13. ├─ 给出推荐/不推荐建议
  14. └─ 记录推荐理由
  15. Step 4: 对比准确率
  16. ├─ 计算 AI 与运营一致性
  17. ├─ 分析分歧原因
  18. ├─ 优化评估逻辑
  19. └─ 达到>80% 一致性

验收标准:

指标 目标值 测量方式
推荐一致性
80%
AI 推荐 vs 运营推荐
禁售识别率
95%
禁售商品识别测试
规则问答准确率
90%
50 个规则问题测试
运营满意度
7/10
运营主观评分

Phase 2: 数据积累期 (3-4 周)

目标

建立数据驱动的选品模型,AI 能够预测销量、利润,给出量化评估。


第 15-21 天:历史数据导入

任务 2.1: 销售数据导入

负责人: 程序员
交付物: 1 年历史销售数据

执行步骤:

  1. Step 1: 从内部系统导出数据
  2. ├─ 销售订单表
  3. ├─ 商品主数据
  4. ├─ 库存表
  5. └─ 采购成本表
  6. Step 2: 数据清洗
  7. ├─ 处理缺失值
  8. ├─ 处理异常值
  9. ├─ 统一数据格式
  10. └─ 去重
  11. Step 3: 数据转换
  12. ├─ 计算月销量
  13. ├─ 计算毛利率
  14. ├─ 计算 ROI
  15. └─ 生成时间序列
  16. Step 4: 导入数据库
  17. ├─ 批量插入
  18. ├─ 验证数据完整性
  19. ├─ 建立索引
  20. └─ 备份

数据量目标:
- 销售订单:>10,000 条
- 商品数量:>1,000 个
- 时间跨度:>12 个月


任务 2.2: 竞品数据爬取

负责人: 程序员
交付物: 竞品监控数据库

执行步骤:

  1. Step 1: 确定监控对象
  2. ├─ TOP 卖家 (50 个)
  3. ├─ TOP 商品 (200 个)
  4. └─ 重点类目 (10 个)
  5. Step 2: 配置定时爬取
  6. ├─ 每日爬取价格
  7. ├─ 每周爬取销量
  8. ├─ 每周爬取评价
  9. └─ 每月爬取卖家信息
  10. Step 3: 数据存储
  11. ├─ 价格历史表
  12. ├─ 销量历史表
  13. ├─ 评价历史表
  14. └─ 卖家信息表
  15. Step 4: 数据分析
  16. ├─ 价格趋势分析
  17. ├─ 销量趋势分析
  18. ├─ 竞争度计算
  19. └─ 头部集中度计算

第 22-35 天:模型训练

任务 2.3: 选品模型训练

负责人: 程序员 + AI 训练师
交付物: 选品评分模型 V1

执行步骤:

  1. Step 1: 特征工程
  2. ├─ 商品基础特征 (10 个)
  3. ├─ 市场特征 (10 个)
  4. ├─ 竞争特征 (5 个)
  5. ├─ 供应链特征 (5 个)
  6. ├─ 利润特征 (5 个)
  7. └─ 风险特征 (5 个)
  8. Step 2: 标签生成
  9. ├─ 销量标签 (实际月销量)
  10. ├─ 利润标签 (实际毛利率)
  11. ├─ 风险标签 (成功/失败)
  12. └─ 综合标签 (运营评分)
  13. Step 3: 模型训练
  14. ├─ 划分训练集/测试集 (8:2)
  15. ├─ 训练销量预测模型
  16. ├─ 训练利润预测模型
  17. ├─ 训练风险分类模型
  18. └─ 训练综合评分模型
  19. Step 4: 模型评估
  20. ├─ 销量预测 MAE <30
  21. ├─ 利润预测 MAE <15%
  22. ├─ 风险评估准确率 >85%
  23. └─ 综合评分相关性 >0.6
  24. Step 5: 模型部署
  25. ├─ 封装为 API
  26. ├─ 配置监控
  27. ├─ 压力测试
  28. └─ 上线运行

模型训练代码:

  1. # 销量预测模型训练
  2. from xgboost import XGBRegressor
  3. from sklearn.model_selection import train_test_split
  4. from sklearn.metrics import mean_absolute_error
  5. # 准备数据
  6. X = df[feature_cols]
  7. y = df['actual_monthly_sales']
  8. # 划分数据集
  9. X_train, X_test, y_train, y_test = train_test_split(
  10. X, y, test_size=0.2, random_state=42
  11. )
  12. # 训练模型
  13. model = XGBRegressor(
  14. n_estimators=500,
  15. max_depth=6,
  16. learning_rate=0.05,
  17. subsample=0.8,
  18. colsample_bytree=0.8
  19. )
  20. model.fit(X_train, y_train)
  21. # 评估
  22. y_pred = model.predict(X_test)
  23. mae = mean_absolute_error(y_test, y_pred)
  24. print(f"销量预测 MAE: {mae:.2f}")
  25. # 特征重要性
  26. importance = pd.DataFrame({
  27. 'feature': feature_cols,
  28. 'importance': model.feature_importances_
  29. }).sort_values('importance', ascending=False)
  30. print(importance.head(10))

任务 2.3: 人工标注反馈

负责人: 运营团队
交付物: 1000+ 标注样本

执行步骤:

  1. Step 1: 标注培训
  2. ├─ 学习标注规范
  3. ├─ 实操练习 (5 个案例)
  4. ├─ 主管审核反馈
  5. └─ 独立标注测试
  6. Step 2: 持续标注
  7. ├─ 每日标注 20 个案例
  8. ├─ 每周审核标注质量
  9. ├─ 修正错误标注
  10. └─ 累计 1000+ 样本
  11. Step 3: 模型迭代
  12. ├─ 每周用新标注数据训练
  13. ├─ 评估模型效果提升
  14. ├─ 记录改进点
  15. └─ 保存最佳模型
  16. Step 4: 质量监控
  17. ├─ 标注完整率 >95%
  18. ├─ 标注准确率 >90%
  19. ├─ 多人一致性 >95%
  20. └─ 定期抽检复核

Phase 2 验收标准

指标 目标值 测量方式
销量预测误差 <30% MAE/实际销量
利润预测误差 <15% MAE/实际毛利
风险评估准确率
85%
测试集准确率
选品推荐一致性
70%
AI vs 运营
标注样本量
1000
数据库统计

Phase 3: 实战优化期 (5-8 周)

目标

在实际业务中验证和迭代,AI 推荐选品成功率>60%。


第 36-50 天:真实选品测试

任务 3.1: AI 推荐选品测试

负责人: 运营 + AI
交付物: 20 个选品建议及跟踪

执行步骤:

  1. Step 1: AI 生成选品推荐
  2. ├─ 每日推荐 TOP 10 商品
  3. ├─ 包含评分和理由
  4. ├─ 运营审核
  5. └─ 选择 3-5 个执行
  6. Step 2: 采购执行
  7. ├─ 联系供应商
  8. ├─ 下单采购
  9. ├─ 质量检验
  10. └─ 入库上架
  11. Step 3: 运营推广
  12. ├─ 制定推广计划
  13. ├─ 投放广告
  14. ├─ 参与活动
  15. └─ 监控数据
  16. Step 4: 数据跟踪
  17. ├─ 每日销售数据
  18. ├─ 每周毛利数据
  19. ├─ 库存周转
  20. └─ 问题记录
  21. Step 5: 效果评估
  22. ├─ 月销量是否>100
  23. ├─ 毛利率是否>25%
  24. ├─ ROI 是否>2.0
  25. └─ 成功/失败标注

选品跟踪表:

商品 ID 推荐日期 AI 评分 采购日期 上架日期 当前月销 毛利率 状态
P001 2026-04-01 85 2026-04-05 2026-04-15 150 32% 成功
P002 2026-04-02 78 2026-04-06 2026-04-16 45 18% 失败
... ... ... ... ... ... ... ...

任务 3.2: 模型迭代优化

负责人: 程序员 + AI 训练师
交付物: 选品模型 V2/V3

执行步骤:

  1. Step 1: 收集反馈数据
  2. ├─ 实际销售数据
  3. ├─ 实际利润数据
  4. ├─ 运营反馈
  5. └─ 失败案例标注
  6. Step 2: 分析模型误差
  7. ├─ 预测 vs 实际对比
  8. ├─ 误差分布分析
  9. ├─ 系统性偏差识别
  10. └─ 特征重要性变化
  11. Step 3: 模型优化
  12. ├─ 调整特征权重
  13. ├─ 增加新特征
  14. ├─ 调整模型参数
  15. └─ 重新训练
  16. Step 4: A/B 测试
  17. ├─ 新旧模型并行运行
  18. ├─ 对比推荐效果
  19. ├─ 统计显著性检验
  20. └─ 决定上线版本
  21. Step 5: 模型上线
  22. ├─ 灰度发布 (10% 流量)
  23. ├─ 监控效果
  24. ├─ 全量发布
  25. └─ 持续监控

迭代周期:
- 每 2 周一次小迭代
- 每 4 周一次大迭代
- 记录每次改进内容


第 51-56 天:SOP 固化

任务 3.3: 运营 SOP 制定

负责人: 运营主管
交付物: 《AI 选品运营 SOP》

执行步骤:

  1. Step 1: 流程梳理
  2. ├─ AI 推荐流程
  3. ├─ 人工审核流程
  4. ├─ 采购执行流程
  5. ├─ 运营推广流程
  6. └─ 数据跟踪流程
  7. Step 2: 文档编写
  8. ├─ 每个流程详细步骤
  9. ├─ 负责人和时限
  10. ├─ 输入输出定义
  11. ├─ 质量检查点
  12. └─ 异常处理流程
  13. Step 3: 培训执行
  14. ├─ 全员培训
  15. ├─ 实操练习
  16. ├─ 考核认证
  17. └─ 上岗执行
  18. Step 4: 持续优化
  19. ├─ 每周回顾 SOP 执行
  20. ├─ 收集改进建议
  21. ├─ 更新 SOP 文档
  22. └─ 版本管理

SOP 文档结构:

  1. # AI 选品运营 SOP
  2. ## 1. AI 推荐流程
  3. ### 1.1 每日推荐
  4. - 时间:每日 9:00
  5. - 负责人:AI 系统
  6. - 输出:TOP 10 推荐列表
  7. ### 1.2 推荐审核
  8. - 时间:每日 10:00
  9. - 负责人:运营专员
  10. - 检查项:禁售、风险、供应链
  11. - 输出:审核通过列表
  12. ## 2. 采购执行流程
  13. ...
  14. ## 3. 运营推广流程
  15. ...
  16. ## 4. 数据跟踪流程
  17. ...
  18. ## 5. 异常处理流程
  19. ...

Phase 3 验收标准

指标 目标值 测量方式
AI 推荐选品成功率
60%
月销>100 单比例
AI 推荐平均毛利率
25%
财务数据
运营信任度
8/10
问卷调查
SOP 执行率
95%
流程检查
模型迭代次数
3 次
版本记录

总结:8 周养虾计划

阶段 时间 关键任务 交付物
Phase 1 1-2 周 规则学习、数据爬取、基础训练 规则手册、1000 SKU、知识库
Phase 2 3-4 周 数据导入、模型训练、标注反馈 销售数据库、选品模型 V1、1000+ 标注
Phase 3 5-8 周 实战测试、模型迭代、SOP 固化 20 个测试产品、模型 V3、运营 SOP

版本: 1.0
创建时间: 2026-03-19
维护者: 项目团队

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注