[关闭]
@buptzym 2016-05-07T10:30:58.000000Z 字数 654 阅读 486

数据清洗任务

未分类


1. 用户终端使用变迁

需要对型号进行归一化,但一般很少有人换机只换型号。
需要把所有手机型号的基本信息拿到,发布时间,发布顺序
单用户,多手机数据,判断高价值用户
2016年1-3月的手机发布情况

IMEI,IMSI: 前者是手机,后者是SIM卡

2. 用户兴趣标签

题目一
1、对数据进行初步分析,做出分类或者用户标签,原则一是属性标签化,二是属性交叉率低。

2、属性分类。如人口属性(包括性别[访问IT类、体育类、社会时事类app、购物网站次数]、是否有小孩[访问教育类网站]、年龄[访问健康类app的pv、访问招聘类网站]、交往圈规模等)、商业属性(消费等级[是否有出国行为或者跨省行为、房产类网站、汽车app的pv数、金融类网站]、消费兴趣、)、营销属性(营销敏感度[访问购物类网站次数]、风险偏好[使用股票类app数量、使用理财类app数量])
3、用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
4、运营商:数据种类不够丰富,缺少用户历史消费行为(线上线下),变现收益有限;较大的投入和不确定的收益,使多数大数据应用缺少“性价比”。中小商家:行业市场研究能力不足,无法适应客户消费口味变化;营销能力不足,无法制定与客户口味相关的营销策略;数据挖掘和利用能力不足,无法聚焦目标人群和找到潜在人群;引流成本大。客户:信息过载,寻找有效信息困难并且无趣;线下维权困难,如遇到不满意的服务,很难追回相应损失。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注