@Macux
2015-12-01T07:01:38.000000Z
字数 841
阅读 1160
Google
1、识别列数据中的重复值
2、移除列数据中的缺失值
3、识别列数据中的缺失值
4、查询语句
5、常用的数据转换(data transform)
6、关于“Multi-valued cells”
join Multi-valued cells:在某个属性中,为某一样本添加多个同类值,并自定义分隔符。例如某个客户,具有多个电话号码,多个地址。
split Multi-valued cells:对某一样本在某一属性中的多个值,进行分开存储。
"rows mode"&"record mode":二者的根本区别在于,当某一样本在某个属性存在多个值时,"rows mode"将其视为多个不同的样本,而"record mode"只将其视为一个样本。
增加一列记录multi-valued的个数:
7、修改某一数值的最快速的方法:
8、合并意思相近的属性值
9、替换函数