@EVA001
2017-12-02T12:40:41.000000Z
字数 435
阅读 333
学术研究
实验目的:
对单机可视化的瓶颈进行实验
实验数据:
下载 Twitter 数据集 links-annon.txt.gz 10.8G 解压后
下载 DBLP 数据集 dblp.xml.gz 395M 解压后 2.01G
DBLP使用:
将dblp.xml和dblp.dtd放在同一级目录
主要借助Python的xml.sax对XML文件进行处理,对内存无限制(核心在实现解析的Handler)
数据规模:(待定)
节点个数: 1000 2000 5000 10000 20000 50000
边条数: 3000 5000 7000 30000 50000 70000
实验环境:
单机 - FRLayout - gephi
单机 - FRLayout - d3js
数据准备:
数据集预处理工具类
实现:节点映射压缩、截取指定规模数据(点规模、边规模)
实验结果:(待定)
- | 点 1000 | 点 2000 | 点 5000 | 点 10000 | 点 20000 | 点 50000 |
---|---|---|---|---|---|---|
边 3000 | ||||||
边 5000 | ||||||
边 7000 | ||||||
边 30000 | ||||||
边 50000 | ||||||
边 70000 |