40个可视化数据的基本工具和资源
译者注:本文是上一篇文章,应该使用那些可视化工具/软件?-入门的继续,主要从三个方面讨论了这些工具和资源,一是组织数据,二是图标和图形化数据,三是数据动画/交互式数据可视化。
经常有人问我“ 你用什么软件可视化数据?“很多人都激动地捣鼓他们的数据,但不知道如何去做,也不知道怎么开始。下面是我使用的工具和资源。它们对数据可视化,从组织数据,到形成图形,直至形成动画和交互都有所帮助。
整理数据
很少有数据会以你期望的格式呈现。比如你有一个逗号分隔的文件,但你需要XML格式的,或者你有一个Excel电子表格,需要导入一个MySQL数据库中,或者数据分散在几百个的HTML页面中,你需要将其放在一起。数据的组织非常费力,值得了解这些语言/工具。你想的最后一件事就是严格的限制数据格式。
PHP
PHP的是我学习的第一种脚本语言,它非常适合网络开发,所以我用着很是舒服。本人常常使用PHP,把CSV文件变成XML格式。函数fgetcsv()就能实现。这也是个导入MySQL数据库或调用API的好办法。
资源:
Python
大多数计算机科学数据类型-至少我曾经使用过-在PHP中执行不好。选择Python,主要是因为Python代码有更好的结构和很酷的服务器端函数。我最喜欢的Python的工具包是Beautiful Soup ,这是一个HTML / XML的解析器。这是什么意思呢?Beautiful Soup非常擅长筛选抓取。
资源:
- Official Python Website – Documentation/官方python文档
- Beautiful Soup – HTML/XML Parser/BS-HTML/XML解析器
MySQL
当我有很多的数据-规模成百上千时-我使用PHP或Python将其存到MySQL数据库中。MySQL 几乎可以让我的数据子集以任何格式呈现。
资源:
- Official MySQL Developer Zone/官方mysql开发地带
- Web Database Applications with PHP & MySQL, 2nd Edition/PHP和MYSQL的Web数据库应用,第二版
R
啊哈,又好又老的R 。这就是统计人员使用,无人能超越的语言。有人在自己的计算机上安装,但还没有学习。有时我用R分析。尤其当条件非常复杂,MySQL难以胜任的时候,我用它来从数据集中提取有用的子集,然后导出为CSV文件。
资源:
Microsoft Excel
我们都知道这个。如果一个数据集很小,或者我当时就想点点鼠标,我使用Excel。
图表和图形
到此,数据已经处理,格式化,可以进行下一步。现在,开始进行可视化。使用何种软件形成统计图表和图形取决于我手头的任务,我不想把自己局限在软件里。例如,R是计算快速,能快速形成结果,但不适合Web应用程序。
Adobe Illustrator中
我用Adobe Illustrator制作出版级的图形。当我没有时间限制的去做什么的时候,我学习如何使用它,并一直很喜欢使用它。因为您可以简单地点击和拖动每一个图形元素。
资源:
R
如果你想实现一个(非动画,非交互式)特定类型的统计可视化,你有可能用到它。R是免费的,有无数资源和库。如果你没能找到一满足您的需求的库,您可以随时使用脚本实现。关于R的一个很酷的事情是,你可以保存为PDF格式的图形,然后在Adobe Illustrator中细化它。
资源:
PHP的图形库
对于PHP的GD库 我的经验非常有限。有几个PHP的图形包,但我还没有找到一个我完全喜欢的,所以我通常更喜欢使用GD库绘制自己的图形。在PHP的图形库的Sparklines也不错。
资源:
- Official PHP GD Reference
- PHP GD Resource
- Sparklines PHP graphing library
- JpGraph – PHP Graph Creating Library
使用Javascript的HTML + CSS的+
你可以用一些简单的HTML和CSS,控制图表和表格的绘制,及其颜色和大小。例如,你在网络上看到的大量的标签云就是只用HTML和CSS。 再结合Javascript能够实现交互功能。
资源:
- Accessible Data Visualization with Web Standards (A List Apart)
- 8 CSS Techniques for Charting Data
- jQuery Sparklines
- Google Maps API
- Marking Up a Tag Cloud | 24 Ways
Flash/Actionscript
再动画和移动数据方面,Flash和ActionScript广为人知,但它可以进行统计工作。如果你想添加一些相互作用,如强调或过滤,到你的可视化工作中,使用它们非常不错。
资源:
Microsoft Excel
我很少使用Excel作图。如果我需要的东西非常急,而且这些数据存在Excel电子表格里,我会使用它的图形功能。
资源:
动画数据
有很多方法来创建动画和交互式数据形式可视化,这些是我使用过的(更多的部分,你可以在网络上直接看到)。
Processing
是的,这就是所谓的Processing 。我见过的大多是设计师使用它,但不能说明它不能用在别的地方。Processing使用画布,你画草图,然后,使得到一个Java小程序。Processing就是给非程序员设计的。
资源:
- Official Processing Extended Reference
- Processing: A Programming Handbook for Visual Designers and Artists
- Learning Processing: A Beginner’s Guide to Programming Images, Animation, and Interaction
Flash/Actionscript
我一直对Flash和ActionScript很感兴趣。主要是因为Java小程序是死的,而网络是活的。交互式/动画可视化的例子,你从纽约时报,Stamen Design中看到,Web应用程序通常使用Flash和ActionScript。没看到?简单的右键点击你正在看的,就知道是什么了。从我以前写的ActionScript数据可视化中可以看到更多细节。
资源:
- How to Learn Actionscript for Data Visualization
- Modest Maps Display and Interaction Library
- Flare Visualization Toolkit
- TweenFilterLite by GreenSock
- ActionScript 3.0 Cookbook: Solutions for Flash Platform and Flex Application Developers
- Adobe Flex Builder 3.0
OK,已经很多了。一开始窝只列出10个工具和资源,但它不断增加。说实话,我没有意识到我居然用这么多东西。你用那些工具,取决于你的工作,有时候这个工具不行,那个也许就行了。
令人惊讶的是,这只是我使用的工具。还有很多我没有用过的工具。你使用过那些这里没有列出的可视化工具?或者知道一些其他很有用的资源?
原文链接。












。