@hhlf282 2026-03-20T01:03:58.000000Z 字数 7218 阅读 23

养虾教程 - 详细执行步骤

目标: 详细解释每个阶段的具体执行步骤
版本: 1.0
创建时间: 2026-03-19

Phase 1: 基础认知期 (1-2 周)

目标

让 AI 理解 Daraz 平台规则和选品逻辑，能够回答基础问题，给出简单选品建议。

第 1-3 天：平台规则学习

任务 1.1: 收集平台规则文档

负责人: 运营专员
交付物: 《Daraz 平台规则手册》

执行步骤:

Step 1: 访问 Daraz 官方资源
├─ Daraz 大学：http://university.daraz.pk/
├─ 卖家中心：https://seller.daraz.com.my/
└─ 帮助中心：https://buyer-helpcenter.daraz.pk/
Step 2: 收集以下文档
├─ 禁售/限售商品列表
├─ 各类目佣金费率表
├─ 物流时效要求
├─ 卖家评分规则
├─ 退换货政策
└─ 违规处罚规则
Step 3: 整理成文档
├─ 使用 Markdown 格式
├─ 按主题分类
├─ 标注重点内容
└─ 保存至：docs/platform-rules.md

文档结构示例:

# Daraz 平台规则手册
## 1. 禁售商品
### 1.1 绝对禁售
- 武器、弹药
- 毒品、违禁药品
- 仿牌商品
- 成人用品
### 1.2 限制销售
- 食品（需卫生许可）
- 化妆品（需 FDA 认证）
- 电子产品（需 CE 认证）
## 2. 佣金费率
| 类目 | 佣金率 | 备注 |
|------|--------|------|
| 服装 | 8% | - |
| 电子 | 5% | - |
| 家居 | 10% | - |
...

任务 1.2: 整理历史选品案例

负责人: 运营主管
交付物: 50 个成功/失败案例

执行步骤:

Step 1: 从内部系统导出历史数据
├─ 成功产品列表 (月销>100 单)
├─ 失败产品列表 (月销<50 单或下架)
└─ 产品评估记录
Step 2: 选择典型案例
├─ 成功案例：30 个
│   ├─ 不同类目分布
│   ├─ 不同价格区间
│   └─ 不同时间段
├─ 失败案例：20 个
│   ├─ 不同失败原因
│   ├─ 不同风险类型
│   └─ 不同时间段
Step 3: 按标注规范整理
├─ 使用数据标注模板
├─ 填写成功/失败因素
├─ 填写经验教训
└─ 保存至：data/labeled-cases/

案例选择标准:

类型标准数量

成功案例月销>100 单，毛利率>25% 30

失败案例 - 竞争竞争过度导致失败 8

失败案例 - 供应链断货/质量问题 6

失败案例 - 政策违规下架 4

失败案例 - 其他其他原因 2

类型	标准	数量
成功案例	月销>100 单，毛利率>25%	30
失败案例 - 竞争	竞争过度导致失败	8
失败案例 - 供应链	断货/质量问题	6
失败案例 - 政策	违规下架	4
失败案例 - 其他	其他原因	2

任务 1.3: 构建 AI 知识库

负责人: 程序员
交付物: 向量数据库 + 知识图谱

执行步骤:

Step 1: 准备知识文档
├─ 平台规则文档 (任务 1.1)
├─ 历史案例文档 (任务 1.2)
├─ 选品 SOP 文档
└─ 常见问题 FAQ
Step 2: 文档预处理
├─ 文本分块 (每块 500-1000 字)
├─ 去除无关内容
├─ 添加元数据 (来源、日期、类型)
└─ 保存为 JSONL 格式
Step 3: 向量化
├─ 选择嵌入模型 (text-embedding-3-large)
├─ 批量生成向量
└─ 存入向量数据库 (Pinecone/Milvus)
Step 4: 测试检索
├─ 准备测试问题 (20 个)
├─ 测试检索准确率
└─ 优化分块策略

代码示例:

# 文档向量化
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Pinecone
# 1. 加载文档
with open('docs/platform-rules.md', 'r') as f:
    content = f.read()
# 2. 文本分块
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=800,
    chunk_overlap=100,
    separators=["\n\n", "\n", "。", ""]
)
chunks = text_splitter.split_text(content)
# 3. 生成向量
embeddings = OpenAIEmbeddings(model='text-embedding-3-large')
vectors = embeddings.embed_documents(chunks)
# 4. 存入向量数据库
vectorstore = Pinecone.from_documents(
    documents=[Document(page_content=c) for c in chunks],
    embedding=embeddings,
    index_name='daraz-knowledge'
)
# 5. 测试检索
query = "Daraz 禁售商品有哪些？"
results = vectorstore.similarity_search(query, k=3)
print(results[0].page_content)

第 4-7 天：基础数据爬取

任务 1.4: Daraz 数据爬取

负责人: 程序员
交付物: 1000 SKU 商品数据

执行步骤:

Step 1: 部署爬虫环境
├─ 安装 Scrapy: pip install scrapy
├─ 配置代理 IP
├─ 设置数据库连接
└─ 测试爬虫运行
Step 2: 爬取 TOP 10 类目
├─ Fashion (服装)
├─ Electronics (电子)
├─ Home & Living (家居)
├─ Health & Beauty (美妆)
├─ Baby & Toys (母婴)
├─ Sports & Outdoors (运动)
├─ Food & Beverages (食品)
├─ Pet Supplies (宠物)
├─ Automotive (汽配)
└─ Books & Media (图书)
Step 3: 每个类目爬取 100 个商品
├─ 商品标题
├─ 价格信息
├─ 销量数据
├─ 评价信息
├─ 卖家信息
└─ 商品图片
Step 4: 数据清洗入库
├─ 去重
├─ 格式化
├─ 验证完整性
└─ 存入数据库

爬取进度追踪:

-- 查看爬取进度
SELECT 
    category_name,
    COUNT(*) as product_count,
    MIN(crawl_time) as first_crawl,
    MAX(crawl_time) as last_crawl
FROM products
GROUP BY category_name
ORDER BY product_count DESC;

任务 1.5: 1688 供应链数据对接

负责人: 程序员
交付物: 1688 API 对接完成

执行步骤:

Step 1: 申请 1688 API 账号
├─ 访问：https://open.1688.com/
├─ 注册开发者账号
├─ 创建应用获取 AppKey
└─ 等待审核 (1-2 工作日)
Step 2: 开发对接代码
├─ 商品搜索 API
├─ 商品详情 API
├─ 供应商信息 API
└─ 价格库存 API
Step 3: 测试 API 调用
├─ 搜索测试商品
├─ 获取商品详情
├─ 验证数据准确性
└─ 处理限流问题
Step 4: 建立商品匹配
├─ 基于标题相似度
├─ 基于图片相似度
├─ 人工审核匹配结果
└─ 存入 product_sources 表

代码示例:

# 1688 API 调用示例
import requests
def search_1688(keywords, page=1):
    """
    搜索 1688 商品
    """
    url = "https://open.1688.com/api/search"
    params = {
        "app_key": "your_app_key",
        "q": keywords,
        "page": page,
        "page_size": 20
    }
    response = requests.get(url, params=params)
    data = response.json()
    return data['items']
# 测试
items = search_1688("无线蓝牙耳机")
for item in items:
    print(f"{item['title']}: {item['price']} RMB")

第 8-10 天：AI 基础训练

任务 1.6: AI 问答能力训练

负责人: 程序员 + AI 训练师
交付物: AI 能准确回答平台规则问题

执行步骤:

Step 1: 准备训练数据
├─ 平台规则问答对 (100 对)
├─ 选品流程问答对 (50 对)
├─ 禁售商品判断 (50 对)
└─ 佣金计算问答 (50 对)
Step 2: 配置 RAG 系统
├─ 连接向量数据库
├─ 配置检索参数
├─ 设置 prompt 模板
└─ 测试检索效果
Step 3: 测试问答准确率
├─ 准备测试问题 (50 个)
├─ 人工评估答案准确性
├─ 记录错误类型
└─ 优化检索策略
Step 4: 达到验收标准
├─ 规则问题准确率 >90%
├─ 禁售判断准确率 >95%
├─ 佣金计算准确率 >95%
└─ 运营评分 >7/10

测试问题示例:

1. Daraz 禁售商品有哪些类别？
2. 服装类目的佣金费率是多少？
3. 食品类商品需要什么认证？
4. 卖家评分低于多少会被处罚？
5. 退换货政策是怎样的？
6. 这个产品能卖吗？[提供商品描述]
7. 售价 2000 LKR 的商品，佣金是多少？

第 11-14 天：简单选品测试

任务 1.7: 简单选品建议测试

负责人: 运营 + AI
交付物: 选品建议准确率>80%

执行步骤:

Step 1: 准备测试商品池
├─ 从爬取数据中选择 100 个商品
├─ 覆盖不同类目
├─ 覆盖不同价格区间
└─ 隐藏实际销售数据
Step 2: AI 给出选品建议
├─ 输入商品信息
├─ AI 评估并打分
├─ 给出推荐/不推荐建议
└─ 记录推荐理由
Step 3: 运营人工评估
├─ 运营独立评估同样商品
├─ 给出推荐/不推荐建议
└─ 记录推荐理由
Step 4: 对比准确率
├─ 计算 AI 与运营一致性
├─ 分析分歧原因
├─ 优化评估逻辑
└─ 达到>80% 一致性

验收标准:

指标目标值测量方式

推荐一致性
80%
AI 推荐 vs 运营推荐

禁售识别率
95%
禁售商品识别测试

规则问答准确率
90%
50 个规则问题测试

运营满意度
7/10
运营主观评分

指标	目标值	测量方式
推荐一致性	80%	AI 推荐 vs 运营推荐
禁售识别率	95%	禁售商品识别测试
规则问答准确率	90%	50 个规则问题测试
运营满意度	7/10	运营主观评分

Phase 2: 数据积累期 (3-4 周)

目标

建立数据驱动的选品模型，AI 能够预测销量、利润，给出量化评估。

第 15-21 天：历史数据导入

任务 2.1: 销售数据导入

负责人: 程序员
交付物: 1 年历史销售数据

执行步骤:

Step 1: 从内部系统导出数据
├─ 销售订单表
├─ 商品主数据
├─ 库存表
└─ 采购成本表
Step 2: 数据清洗
├─ 处理缺失值
├─ 处理异常值
├─ 统一数据格式
└─ 去重
Step 3: 数据转换
├─ 计算月销量
├─ 计算毛利率
├─ 计算 ROI
└─ 生成时间序列
Step 4: 导入数据库
├─ 批量插入
├─ 验证数据完整性
├─ 建立索引
└─ 备份

数据量目标:
- 销售订单：>10,000 条
- 商品数量：>1,000 个
- 时间跨度：>12 个月

任务 2.2: 竞品数据爬取

负责人: 程序员
交付物: 竞品监控数据库

执行步骤:

Step 1: 确定监控对象
├─ TOP 卖家 (50 个)
├─ TOP 商品 (200 个)
└─ 重点类目 (10 个)
Step 2: 配置定时爬取
├─ 每日爬取价格
├─ 每周爬取销量
├─ 每周爬取评价
└─ 每月爬取卖家信息
Step 3: 数据存储
├─ 价格历史表
├─ 销量历史表
├─ 评价历史表
└─ 卖家信息表
Step 4: 数据分析
├─ 价格趋势分析
├─ 销量趋势分析
├─ 竞争度计算
└─ 头部集中度计算

第 22-35 天：模型训练

任务 2.3: 选品模型训练

负责人: 程序员 + AI 训练师
交付物: 选品评分模型 V1

执行步骤:

Step 1: 特征工程
├─ 商品基础特征 (10 个)
├─ 市场特征 (10 个)
├─ 竞争特征 (5 个)
├─ 供应链特征 (5 个)
├─ 利润特征 (5 个)
└─ 风险特征 (5 个)
Step 2: 标签生成
├─ 销量标签 (实际月销量)
├─ 利润标签 (实际毛利率)
├─ 风险标签 (成功/失败)
└─ 综合标签 (运营评分)
Step 3: 模型训练
├─ 划分训练集/测试集 (8:2)
├─ 训练销量预测模型
├─ 训练利润预测模型
├─ 训练风险分类模型
└─ 训练综合评分模型
Step 4: 模型评估
├─ 销量预测 MAE <30
├─ 利润预测 MAE <15%
├─ 风险评估准确率 >85%
└─ 综合评分相关性 >0.6
Step 5: 模型部署
├─ 封装为 API
├─ 配置监控
├─ 压力测试
└─ 上线运行

模型训练代码:

# 销量预测模型训练
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error
# 准备数据
X = df[feature_cols]
y = df['actual_monthly_sales']
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)
# 训练模型
model = XGBRegressor(
    n_estimators=500,
    max_depth=6,
    learning_rate=0.05,
    subsample=0.8,
    colsample_bytree=0.8
)
model.fit(X_train, y_train)
# 评估
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
print(f"销量预测 MAE: {mae:.2f}")
# 特征重要性
importance = pd.DataFrame({
    'feature': feature_cols,
    'importance': model.feature_importances_
}).sort_values('importance', ascending=False)
print(importance.head(10))

任务 2.3: 人工标注反馈

负责人: 运营团队
交付物: 1000+ 标注样本

执行步骤:

Step 1: 标注培训
├─ 学习标注规范
├─ 实操练习 (5 个案例)
├─ 主管审核反馈
└─ 独立标注测试
Step 2: 持续标注
├─ 每日标注 20 个案例
├─ 每周审核标注质量
├─ 修正错误标注
└─ 累计 1000+ 样本
Step 3: 模型迭代
├─ 每周用新标注数据训练
├─ 评估模型效果提升
├─ 记录改进点
└─ 保存最佳模型
Step 4: 质量监控
├─ 标注完整率 >95%
├─ 标注准确率 >90%
├─ 多人一致性 >95%
└─ 定期抽检复核

Phase 2 验收标准

指标目标值测量方式

销量预测误差 <30% MAE/实际销量

利润预测误差 <15% MAE/实际毛利

风险评估准确率
85%
测试集准确率

选品推荐一致性
70%
AI vs 运营

标注样本量
1000
数据库统计

指标	目标值	测量方式
销量预测误差	<30%	MAE/实际销量
利润预测误差	<15%	MAE/实际毛利
风险评估准确率	85%	测试集准确率
选品推荐一致性	70%	AI vs 运营
标注样本量	1000	数据库统计

Phase 3: 实战优化期 (5-8 周)

目标

在实际业务中验证和迭代，AI 推荐选品成功率>60%。

第 36-50 天：真实选品测试

任务 3.1: AI 推荐选品测试

负责人: 运营 + AI
交付物: 20 个选品建议及跟踪

执行步骤:

Step 1: AI 生成选品推荐
├─ 每日推荐 TOP 10 商品
├─ 包含评分和理由
├─ 运营审核
└─ 选择 3-5 个执行
Step 2: 采购执行
├─ 联系供应商
├─ 下单采购
├─ 质量检验
└─ 入库上架
Step 3: 运营推广
├─ 制定推广计划
├─ 投放广告
├─ 参与活动
└─ 监控数据
Step 4: 数据跟踪
├─ 每日销售数据
├─ 每周毛利数据
├─ 库存周转
└─ 问题记录
Step 5: 效果评估
├─ 月销量是否>100 单
├─ 毛利率是否>25%
├─ ROI 是否>2.0
└─ 成功/失败标注

选品跟踪表:

商品 ID 推荐日期 AI 评分采购日期上架日期当前月销毛利率状态

P001 2026-04-01 85 2026-04-05 2026-04-15 150 32% 成功

P002 2026-04-02 78 2026-04-06 2026-04-16 45 18% 失败

... ... ... ... ... ... ... ...

商品 ID	推荐日期	AI 评分	采购日期	上架日期	当前月销	毛利率	状态
P001	2026-04-01	85	2026-04-05	2026-04-15	150	32%	成功
P002	2026-04-02	78	2026-04-06	2026-04-16	45	18%	失败
...	...	...	...	...	...	...	...

任务 3.2: 模型迭代优化

负责人: 程序员 + AI 训练师
交付物: 选品模型 V2/V3

执行步骤:

Step 1: 收集反馈数据
├─ 实际销售数据
├─ 实际利润数据
├─ 运营反馈
└─ 失败案例标注
Step 2: 分析模型误差
├─ 预测 vs 实际对比
├─ 误差分布分析
├─ 系统性偏差识别
└─ 特征重要性变化
Step 3: 模型优化
├─ 调整特征权重
├─ 增加新特征
├─ 调整模型参数
└─ 重新训练
Step 4: A/B 测试
├─ 新旧模型并行运行
├─ 对比推荐效果
├─ 统计显著性检验
└─ 决定上线版本
Step 5: 模型上线
├─ 灰度发布 (10% 流量)
├─ 监控效果
├─ 全量发布
└─ 持续监控

迭代周期:
- 每 2 周一次小迭代
- 每 4 周一次大迭代
- 记录每次改进内容

第 51-56 天：SOP 固化

任务 3.3: 运营 SOP 制定

负责人: 运营主管
交付物: 《AI 选品运营 SOP》

执行步骤:

Step 1: 流程梳理
├─ AI 推荐流程
├─ 人工审核流程
├─ 采购执行流程
├─ 运营推广流程
└─ 数据跟踪流程
Step 2: 文档编写
├─ 每个流程详细步骤
├─ 负责人和时限
├─ 输入输出定义
├─ 质量检查点
└─ 异常处理流程
Step 3: 培训执行
├─ 全员培训
├─ 实操练习
├─ 考核认证
└─ 上岗执行
Step 4: 持续优化
├─ 每周回顾 SOP 执行
├─ 收集改进建议
├─ 更新 SOP 文档
└─ 版本管理

SOP 文档结构:

# AI 选品运营 SOP
## 1. AI 推荐流程
### 1.1 每日推荐
- 时间：每日 9:00
- 负责人：AI 系统
- 输出：TOP 10 推荐列表
### 1.2 推荐审核
- 时间：每日 10:00
- 负责人：运营专员
- 检查项：禁售、风险、供应链
- 输出：审核通过列表
## 2. 采购执行流程
...
## 3. 运营推广流程
...
## 4. 数据跟踪流程
...
## 5. 异常处理流程
...

Phase 3 验收标准

指标目标值测量方式

AI 推荐选品成功率
60%
月销>100 单比例

AI 推荐平均毛利率
25%
财务数据

运营信任度
8/10
问卷调查

SOP 执行率
95%
流程检查

模型迭代次数
3 次
版本记录

指标	目标值	测量方式
AI 推荐选品成功率	60%	月销>100 单比例
AI 推荐平均毛利率	25%	财务数据
运营信任度	8/10	问卷调查
SOP 执行率	95%	流程检查
模型迭代次数	3 次	版本记录

总结：8 周养虾计划

阶段时间关键任务交付物

Phase 1 1-2 周规则学习、数据爬取、基础训练规则手册、1000 SKU、知识库

Phase 2 3-4 周数据导入、模型训练、标注反馈销售数据库、选品模型 V1、1000+ 标注

Phase 3 5-8 周实战测试、模型迭代、SOP 固化 20 个测试产品、模型 V3、运营 SOP

阶段	时间	关键任务	交付物
Phase 1	1-2 周	规则学习、数据爬取、基础训练	规则手册、1000 SKU、知识库
Phase 2	3-4 周	数据导入、模型训练、标注反馈	销售数据库、选品模型 V1、1000+ 标注
Phase 3	5-8 周	实战测试、模型迭代、SOP 固化	20 个测试产品、模型 V3、运营 SOP

版本: 1.0
创建时间: 2026-03-19
维护者: 项目团队

养虾教程 - 详细执行步骤

Phase 1: 基础认知期 (1-2 周)

目标

第 1-3 天：平台规则学习

任务 1.1: 收集平台规则文档

任务 1.2: 整理历史选品案例

类型 标准 数量 成功案例 月销>100 单，毛利率>25% 30 失败案例 - 竞争 竞争过度导致失败 8 失败案例 - 供应链 断货/质量问题 6 失败案例 - 政策 违规下架 4 失败案例 - 其他 其他原因 2

任务 1.3: 构建 AI 知识库

第 4-7 天：基础数据爬取

任务 1.4: Daraz 数据爬取

任务 1.5: 1688 供应链数据对接

第 8-10 天：AI 基础训练

任务 1.6: AI 问答能力训练

第 11-14 天：简单选品测试

任务 1.7: 简单选品建议测试

指标 目标值 测量方式 推荐一致性 80% AI 推荐 vs 运营推荐 禁售识别率 95% 禁售商品识别测试 规则问答准确率 90% 50 个规则问题测试 运营满意度 7/10 运营主观评分

Phase 2: 数据积累期 (3-4 周)

目标

第 15-21 天：历史数据导入

任务 2.1: 销售数据导入

任务 2.2: 竞品数据爬取

第 22-35 天：模型训练

任务 2.3: 选品模型训练

任务 2.3: 人工标注反馈

Phase 2 验收标准

指标 目标值 测量方式 销量预测误差 <30% MAE/实际销量 利润预测误差 <15% MAE/实际毛利 风险评估准确率 85% 测试集准确率 选品推荐一致性 70% AI vs 运营 标注样本量 1000 数据库统计

Phase 3: 实战优化期 (5-8 周)

目标

第 36-50 天：真实选品测试

任务 3.1: AI 推荐选品测试

商品 ID 推荐日期 AI 评分 采购日期 上架日期 当前月销 毛利率 状态 P001 2026-04-01 85 2026-04-05 2026-04-15 150 32% 成功 P002 2026-04-02 78 2026-04-06 2026-04-16 45 18% 失败 ... ... ... ... ... ... ... ...

任务 3.2: 模型迭代优化

第 51-56 天：SOP 固化

任务 3.3: 运营 SOP 制定

Phase 3 验收标准

指标 目标值 测量方式 AI 推荐选品成功率 60% 月销>100 单比例 AI 推荐平均毛利率 25% 财务数据 运营信任度 8/10 问卷调查 SOP 执行率 95% 流程检查 模型迭代次数 3 次 版本记录

总结：8 周养虾计划

内容目录

选择主题

类型标准数量

成功案例月销>100 单，毛利率>25% 30

失败案例 - 竞争竞争过度导致失败 8

失败案例 - 供应链断货/质量问题 6

失败案例 - 政策违规下架 4

失败案例 - 其他其他原因 2

指标目标值测量方式

推荐一致性
80%
AI 推荐 vs 运营推荐

禁售识别率
95%
禁售商品识别测试

规则问答准确率
90%
50 个规则问题测试

运营满意度
7/10
运营主观评分

指标目标值测量方式

销量预测误差 <30% MAE/实际销量

利润预测误差 <15% MAE/实际毛利

风险评估准确率
85%
测试集准确率

选品推荐一致性
70%
AI vs 运营

标注样本量
1000
数据库统计

商品 ID 推荐日期 AI 评分采购日期上架日期当前月销毛利率状态

P001 2026-04-01 85 2026-04-05 2026-04-15 150 32% 成功

P002 2026-04-02 78 2026-04-06 2026-04-16 45 18% 失败

... ... ... ... ... ... ... ...

指标目标值测量方式

AI 推荐选品成功率
60%
月销>100 单比例

AI 推荐平均毛利率
25%
财务数据

运营信任度
8/10
问卷调查

SOP 执行率
95%
流程检查

模型迭代次数
3 次
版本记录