@hhlf282
2026-03-20T01:03:58.000000Z
字数 7218
阅读 23
目标: 详细解释每个阶段的具体执行步骤
版本: 1.0
创建时间: 2026-03-19
让 AI 理解 Daraz 平台规则和选品逻辑,能够回答基础问题,给出简单选品建议。
负责人: 运营专员
交付物: 《Daraz 平台规则手册》
执行步骤:
Step 1: 访问 Daraz 官方资源├─ Daraz 大学:http://university.daraz.pk/├─ 卖家中心:https://seller.daraz.com.my/└─ 帮助中心:https://buyer-helpcenter.daraz.pk/Step 2: 收集以下文档├─ 禁售/限售商品列表├─ 各类目佣金费率表├─ 物流时效要求├─ 卖家评分规则├─ 退换货政策└─ 违规处罚规则Step 3: 整理成文档├─ 使用 Markdown 格式├─ 按主题分类├─ 标注重点内容└─ 保存至:docs/platform-rules.md
文档结构示例:
# Daraz 平台规则手册## 1. 禁售商品### 1.1 绝对禁售- 武器、弹药- 毒品、违禁药品- 仿牌商品- 成人用品### 1.2 限制销售- 食品(需卫生许可)- 化妆品(需 FDA 认证)- 电子产品(需 CE 认证)## 2. 佣金费率| 类目 | 佣金率 | 备注 ||------|--------|------|| 服装 | 8% | - || 电子 | 5% | - || 家居 | 10% | - |...
负责人: 运营主管
交付物: 50 个成功/失败案例
执行步骤:
Step 1: 从内部系统导出历史数据├─ 成功产品列表 (月销>100 单)├─ 失败产品列表 (月销<50 单或下架)└─ 产品评估记录Step 2: 选择典型案例├─ 成功案例:30 个│ ├─ 不同类目分布│ ├─ 不同价格区间│ └─ 不同时间段├─ 失败案例:20 个│ ├─ 不同失败原因│ ├─ 不同风险类型│ └─ 不同时间段Step 3: 按标注规范整理├─ 使用数据标注模板├─ 填写成功/失败因素├─ 填写经验教训└─ 保存至:data/labeled-cases/
案例选择标准:
| 类型 | 标准 | 数量 |
|---|---|---|
| 成功案例 | 月销>100 单,毛利率>25% | 30 |
| 失败案例 - 竞争 | 竞争过度导致失败 | 8 |
| 失败案例 - 供应链 | 断货/质量问题 | 6 |
| 失败案例 - 政策 | 违规下架 | 4 |
| 失败案例 - 其他 | 其他原因 | 2 |
负责人: 程序员
交付物: 向量数据库 + 知识图谱
执行步骤:
Step 1: 准备知识文档├─ 平台规则文档 (任务 1.1)├─ 历史案例文档 (任务 1.2)├─ 选品 SOP 文档└─ 常见问题 FAQStep 2: 文档预处理├─ 文本分块 (每块 500-1000 字)├─ 去除无关内容├─ 添加元数据 (来源、日期、类型)└─ 保存为 JSONL 格式Step 3: 向量化├─ 选择嵌入模型 (text-embedding-3-large)├─ 批量生成向量└─ 存入向量数据库 (Pinecone/Milvus)Step 4: 测试检索├─ 准备测试问题 (20 个)├─ 测试检索准确率└─ 优化分块策略
代码示例:
# 文档向量化from langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.vectorstores import Pinecone# 1. 加载文档with open('docs/platform-rules.md', 'r') as f:content = f.read()# 2. 文本分块text_splitter = RecursiveCharacterTextSplitter(chunk_size=800,chunk_overlap=100,separators=["\n\n", "\n", "。", ""])chunks = text_splitter.split_text(content)# 3. 生成向量embeddings = OpenAIEmbeddings(model='text-embedding-3-large')vectors = embeddings.embed_documents(chunks)# 4. 存入向量数据库vectorstore = Pinecone.from_documents(documents=[Document(page_content=c) for c in chunks],embedding=embeddings,index_name='daraz-knowledge')# 5. 测试检索query = "Daraz 禁售商品有哪些?"results = vectorstore.similarity_search(query, k=3)print(results[0].page_content)
负责人: 程序员
交付物: 1000 SKU 商品数据
执行步骤:
Step 1: 部署爬虫环境├─ 安装 Scrapy: pip install scrapy├─ 配置代理 IP├─ 设置数据库连接└─ 测试爬虫运行Step 2: 爬取 TOP 10 类目├─ Fashion (服装)├─ Electronics (电子)├─ Home & Living (家居)├─ Health & Beauty (美妆)├─ Baby & Toys (母婴)├─ Sports & Outdoors (运动)├─ Food & Beverages (食品)├─ Pet Supplies (宠物)├─ Automotive (汽配)└─ Books & Media (图书)Step 3: 每个类目爬取 100 个商品├─ 商品标题├─ 价格信息├─ 销量数据├─ 评价信息├─ 卖家信息└─ 商品图片Step 4: 数据清洗入库├─ 去重├─ 格式化├─ 验证完整性└─ 存入数据库
爬取进度追踪:
-- 查看爬取进度SELECTcategory_name,COUNT(*) as product_count,MIN(crawl_time) as first_crawl,MAX(crawl_time) as last_crawlFROM productsGROUP BY category_nameORDER BY product_count DESC;
负责人: 程序员
交付物: 1688 API 对接完成
执行步骤:
Step 1: 申请 1688 API 账号├─ 访问:https://open.1688.com/├─ 注册开发者账号├─ 创建应用获取 AppKey└─ 等待审核 (1-2 工作日)Step 2: 开发对接代码├─ 商品搜索 API├─ 商品详情 API├─ 供应商信息 API└─ 价格库存 APIStep 3: 测试 API 调用├─ 搜索测试商品├─ 获取商品详情├─ 验证数据准确性└─ 处理限流问题Step 4: 建立商品匹配├─ 基于标题相似度├─ 基于图片相似度├─ 人工审核匹配结果└─ 存入 product_sources 表
代码示例:
# 1688 API 调用示例import requestsdef search_1688(keywords, page=1):"""搜索 1688 商品"""url = "https://open.1688.com/api/search"params = {"app_key": "your_app_key","q": keywords,"page": page,"page_size": 20}response = requests.get(url, params=params)data = response.json()return data['items']# 测试items = search_1688("无线蓝牙耳机")for item in items:print(f"{item['title']}: {item['price']} RMB")
负责人: 程序员 + AI 训练师
交付物: AI 能准确回答平台规则问题
执行步骤:
Step 1: 准备训练数据├─ 平台规则问答对 (100 对)├─ 选品流程问答对 (50 对)├─ 禁售商品判断 (50 对)└─ 佣金计算问答 (50 对)Step 2: 配置 RAG 系统├─ 连接向量数据库├─ 配置检索参数├─ 设置 prompt 模板└─ 测试检索效果Step 3: 测试问答准确率├─ 准备测试问题 (50 个)├─ 人工评估答案准确性├─ 记录错误类型└─ 优化检索策略Step 4: 达到验收标准├─ 规则问题准确率 >90%├─ 禁售判断准确率 >95%├─ 佣金计算准确率 >95%└─ 运营评分 >7/10
测试问题示例:
1. Daraz 禁售商品有哪些类别?2. 服装类目的佣金费率是多少?3. 食品类商品需要什么认证?4. 卖家评分低于多少会被处罚?5. 退换货政策是怎样的?6. 这个产品能卖吗?[提供商品描述]7. 售价 2000 LKR 的商品,佣金是多少?
负责人: 运营 + AI
交付物: 选品建议准确率>80%
执行步骤:
Step 1: 准备测试商品池├─ 从爬取数据中选择 100 个商品├─ 覆盖不同类目├─ 覆盖不同价格区间└─ 隐藏实际销售数据Step 2: AI 给出选品建议├─ 输入商品信息├─ AI 评估并打分├─ 给出推荐/不推荐建议└─ 记录推荐理由Step 3: 运营人工评估├─ 运营独立评估同样商品├─ 给出推荐/不推荐建议└─ 记录推荐理由Step 4: 对比准确率├─ 计算 AI 与运营一致性├─ 分析分歧原因├─ 优化评估逻辑└─ 达到>80% 一致性
验收标准:
| 指标 | 目标值 | 测量方式 |
|---|---|---|
| 推荐一致性 | 80% |
AI 推荐 vs 运营推荐 |
| 禁售识别率 | 95% |
禁售商品识别测试 |
| 规则问答准确率 | 90% |
50 个规则问题测试 |
| 运营满意度 | 7/10 |
运营主观评分 |
建立数据驱动的选品模型,AI 能够预测销量、利润,给出量化评估。
负责人: 程序员
交付物: 1 年历史销售数据
执行步骤:
Step 1: 从内部系统导出数据├─ 销售订单表├─ 商品主数据├─ 库存表└─ 采购成本表Step 2: 数据清洗├─ 处理缺失值├─ 处理异常值├─ 统一数据格式└─ 去重Step 3: 数据转换├─ 计算月销量├─ 计算毛利率├─ 计算 ROI└─ 生成时间序列Step 4: 导入数据库├─ 批量插入├─ 验证数据完整性├─ 建立索引└─ 备份
数据量目标:
- 销售订单:>10,000 条
- 商品数量:>1,000 个
- 时间跨度:>12 个月
负责人: 程序员
交付物: 竞品监控数据库
执行步骤:
Step 1: 确定监控对象├─ TOP 卖家 (50 个)├─ TOP 商品 (200 个)└─ 重点类目 (10 个)Step 2: 配置定时爬取├─ 每日爬取价格├─ 每周爬取销量├─ 每周爬取评价└─ 每月爬取卖家信息Step 3: 数据存储├─ 价格历史表├─ 销量历史表├─ 评价历史表└─ 卖家信息表Step 4: 数据分析├─ 价格趋势分析├─ 销量趋势分析├─ 竞争度计算└─ 头部集中度计算
负责人: 程序员 + AI 训练师
交付物: 选品评分模型 V1
执行步骤:
Step 1: 特征工程├─ 商品基础特征 (10 个)├─ 市场特征 (10 个)├─ 竞争特征 (5 个)├─ 供应链特征 (5 个)├─ 利润特征 (5 个)└─ 风险特征 (5 个)Step 2: 标签生成├─ 销量标签 (实际月销量)├─ 利润标签 (实际毛利率)├─ 风险标签 (成功/失败)└─ 综合标签 (运营评分)Step 3: 模型训练├─ 划分训练集/测试集 (8:2)├─ 训练销量预测模型├─ 训练利润预测模型├─ 训练风险分类模型└─ 训练综合评分模型Step 4: 模型评估├─ 销量预测 MAE <30├─ 利润预测 MAE <15%├─ 风险评估准确率 >85%└─ 综合评分相关性 >0.6Step 5: 模型部署├─ 封装为 API├─ 配置监控├─ 压力测试└─ 上线运行
模型训练代码:
# 销量预测模型训练from xgboost import XGBRegressorfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_absolute_error# 准备数据X = df[feature_cols]y = df['actual_monthly_sales']# 划分数据集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 训练模型model = XGBRegressor(n_estimators=500,max_depth=6,learning_rate=0.05,subsample=0.8,colsample_bytree=0.8)model.fit(X_train, y_train)# 评估y_pred = model.predict(X_test)mae = mean_absolute_error(y_test, y_pred)print(f"销量预测 MAE: {mae:.2f}")# 特征重要性importance = pd.DataFrame({'feature': feature_cols,'importance': model.feature_importances_}).sort_values('importance', ascending=False)print(importance.head(10))
负责人: 运营团队
交付物: 1000+ 标注样本
执行步骤:
Step 1: 标注培训├─ 学习标注规范├─ 实操练习 (5 个案例)├─ 主管审核反馈└─ 独立标注测试Step 2: 持续标注├─ 每日标注 20 个案例├─ 每周审核标注质量├─ 修正错误标注└─ 累计 1000+ 样本Step 3: 模型迭代├─ 每周用新标注数据训练├─ 评估模型效果提升├─ 记录改进点└─ 保存最佳模型Step 4: 质量监控├─ 标注完整率 >95%├─ 标注准确率 >90%├─ 多人一致性 >95%└─ 定期抽检复核
| 指标 | 目标值 | 测量方式 |
|---|---|---|
| 销量预测误差 | <30% | MAE/实际销量 |
| 利润预测误差 | <15% | MAE/实际毛利 |
| 风险评估准确率 | 85% |
测试集准确率 |
| 选品推荐一致性 | 70% |
AI vs 运营 |
| 标注样本量 | 1000 |
数据库统计 |
在实际业务中验证和迭代,AI 推荐选品成功率>60%。
负责人: 运营 + AI
交付物: 20 个选品建议及跟踪
执行步骤:
Step 1: AI 生成选品推荐├─ 每日推荐 TOP 10 商品├─ 包含评分和理由├─ 运营审核└─ 选择 3-5 个执行Step 2: 采购执行├─ 联系供应商├─ 下单采购├─ 质量检验└─ 入库上架Step 3: 运营推广├─ 制定推广计划├─ 投放广告├─ 参与活动└─ 监控数据Step 4: 数据跟踪├─ 每日销售数据├─ 每周毛利数据├─ 库存周转└─ 问题记录Step 5: 效果评估├─ 月销量是否>100 单├─ 毛利率是否>25%├─ ROI 是否>2.0└─ 成功/失败标注
选品跟踪表:
| 商品 ID | 推荐日期 | AI 评分 | 采购日期 | 上架日期 | 当前月销 | 毛利率 | 状态 |
|---|---|---|---|---|---|---|---|
| P001 | 2026-04-01 | 85 | 2026-04-05 | 2026-04-15 | 150 | 32% | 成功 |
| P002 | 2026-04-02 | 78 | 2026-04-06 | 2026-04-16 | 45 | 18% | 失败 |
| ... | ... | ... | ... | ... | ... | ... | ... |
负责人: 程序员 + AI 训练师
交付物: 选品模型 V2/V3
执行步骤:
Step 1: 收集反馈数据├─ 实际销售数据├─ 实际利润数据├─ 运营反馈└─ 失败案例标注Step 2: 分析模型误差├─ 预测 vs 实际对比├─ 误差分布分析├─ 系统性偏差识别└─ 特征重要性变化Step 3: 模型优化├─ 调整特征权重├─ 增加新特征├─ 调整模型参数└─ 重新训练Step 4: A/B 测试├─ 新旧模型并行运行├─ 对比推荐效果├─ 统计显著性检验└─ 决定上线版本Step 5: 模型上线├─ 灰度发布 (10% 流量)├─ 监控效果├─ 全量发布└─ 持续监控
迭代周期:
- 每 2 周一次小迭代
- 每 4 周一次大迭代
- 记录每次改进内容
负责人: 运营主管
交付物: 《AI 选品运营 SOP》
执行步骤:
Step 1: 流程梳理├─ AI 推荐流程├─ 人工审核流程├─ 采购执行流程├─ 运营推广流程└─ 数据跟踪流程Step 2: 文档编写├─ 每个流程详细步骤├─ 负责人和时限├─ 输入输出定义├─ 质量检查点└─ 异常处理流程Step 3: 培训执行├─ 全员培训├─ 实操练习├─ 考核认证└─ 上岗执行Step 4: 持续优化├─ 每周回顾 SOP 执行├─ 收集改进建议├─ 更新 SOP 文档└─ 版本管理
SOP 文档结构:
# AI 选品运营 SOP## 1. AI 推荐流程### 1.1 每日推荐- 时间:每日 9:00- 负责人:AI 系统- 输出:TOP 10 推荐列表### 1.2 推荐审核- 时间:每日 10:00- 负责人:运营专员- 检查项:禁售、风险、供应链- 输出:审核通过列表## 2. 采购执行流程...## 3. 运营推广流程...## 4. 数据跟踪流程...## 5. 异常处理流程...
| 指标 | 目标值 | 测量方式 |
|---|---|---|
| AI 推荐选品成功率 | 60% |
月销>100 单比例 |
| AI 推荐平均毛利率 | 25% |
财务数据 |
| 运营信任度 | 8/10 |
问卷调查 |
| SOP 执行率 | 95% |
流程检查 |
| 模型迭代次数 | 3 次 |
版本记录 |
| 阶段 | 时间 | 关键任务 | 交付物 |
|---|---|---|---|
| Phase 1 | 1-2 周 | 规则学习、数据爬取、基础训练 | 规则手册、1000 SKU、知识库 |
| Phase 2 | 3-4 周 | 数据导入、模型训练、标注反馈 | 销售数据库、选品模型 V1、1000+ 标注 |
| Phase 3 | 5-8 周 | 实战测试、模型迭代、SOP 固化 | 20 个测试产品、模型 V3、运营 SOP |
版本: 1.0
创建时间: 2026-03-19
维护者: 项目团队