[关闭]
@EVA001 2017-12-02T12:40:41.000000Z 字数 435 阅读 333

2017-11-11 对不同规模数据集的可视化实验(X)

学术研究


实验目的:
对单机可视化的瓶颈进行实验

实验数据:
下载 Twitter 数据集 links-annon.txt.gz 10.8G 解压后
下载 DBLP 数据集 dblp.xml.gz 395M 解压后 2.01G

DBLP使用:
将dblp.xml和dblp.dtd放在同一级目录
主要借助Python的xml.sax对XML文件进行处理,对内存无限制(核心在实现解析的Handler)

数据规模:(待定)
节点个数: 1000 2000 5000 10000 20000 50000
边条数: 3000 5000 7000 30000 50000 70000

实验环境:
单机 - FRLayout - gephi
单机 - FRLayout - d3js

数据准备:
数据集预处理工具类
实现:节点映射压缩、截取指定规模数据(点规模、边规模)

实验结果:(待定)

- 点 1000 点 2000 点 5000 点 10000 点 20000 点 50000
边 3000
边 5000
边 7000
边 30000
边 50000
边 70000
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注