存档

文章标签 ‘data’

中国移动积分商城那个商品最值最划算?

2011年4月10日 没有评论

夜里睡不着,总是很无聊。啥也不爱干,于是把数算。这次是中国移动积分商城,网址是http://jf.10086.cn/。如果您用移动手机,或者曾经曾经被积分商城诱惑过的话,这篇文章也许对您有用。我用的是动感地带,所以我以动感地带的积分,也就是M值计算为准,中国移动积分商城,那件商品兑换最值,最划算。

首先,我们要知道,中国移动积分商城动感地带品牌M值是多少钱一分呢?

在中国移动积分商城首页的基础通信里,有一个话费直充的链接,从这里可以看到,30元相当于1430动感地带M值,50元相当于2390动感地带M值,100元相当于4770动感地带M值,300元相当于14290动感地带M值,500元话费相当于23810动感地带M值。用钱数除以积分数就得到1积分相当于多少钱,将其绘制成下图,横坐标是不同积分能够兑换的钱数,中坐标当然就是该兑换方法下,1积分的价格。在中国移动积分商城最上面的50元兑换套餐,居然是最不划算的,而最下面的30元话费直充,其实是很经济的一种,尤其是当积分不是很多的时候,用30元话费直充,比用50元兑换套餐划算得多。

其次,以前面500元套餐的积分价格为基准,中国移动积分商城的商品积分折算成人民币是多少钱呢?500元套餐积分的价格是0.021元/M值。我仅以市场价格透明容易确定的几种商品为例,你可以根据积分价格(0.021元/M值)自行计算你要兑换商品的价格。

在首页,数字礼品里,有游戏点卡,以第一个“盛大互动娱乐3元卡”为例,它的兑换需要的积分是180M值。计算180M值×0.021元/M值=3.78元,比“盛大互动娱乐3元卡”的面值高很多。

我计算了能够在网上查到价格的书籍、软件,中国移动积分商城的价格都高。但是不是话费直充就是中国移动积分商城中,兑换最划算的商品呢?

在让我们关注一下,基础通信下,本地通话商品的兑换。这里我们要计算1分钟通话时间需要多少M值,所以用兑换的分钟除以需要的M值,同样可以得到下图。之所以选择本地通话,是因为我不知道国内长途、短信以及流量的价格。

很显然,列在第四位置的120分钟本地通话商品比较划算。

在这种兑换方式下,最便宜的商品是本地通话380元,它的价格是9.5263M值/分钟本地通话,它折算成钱数是:9.5263M值/分钟本地通话×0.021元/M值=0.2元/分钟本地通话。比我们常规的通话价格(0.25元/分钟本地通话)低,所以,兑换本地通话商品比直接充值更值,更划算,因此,通过我们的计算可以认为,中国移动积分商城的商品中,兑换本地通话时间这件商品最划算。如果您有兴趣,可以计算下国内长途、短信以及流量的价格相比于本地通话那个更划算,我估计,仍然是本地通话最划算。

分类: 幸福生活 标签:

40个可视化数据的基本工具和资源

2011年2月8日 没有评论

译者注:本文是上一篇文章,应该使用那些可视化工具/软件?-入门的继续,主要从三个方面讨论了这些工具和资源,一是组织数据,二是图标和图形化数据,三是数据动画/交互式数据可视化。

经常有人问我“ 你用什么软件可视化数据?“很多人都激动地捣鼓他们的数据,但不知道如何去做,也不知道怎么开始。下面是我使用的工具和资源。它们对数据可视化,从组织数据,到形成图形,直至形成动画和交互都有所帮助。

整理数据


很少有数据会以你期望的格式呈现。比如你有一个逗号分隔的文件,但你需要XML格式的,或者你有一个Excel电子表格,需要导入一个MySQL数据库中,或者数据分散在几百个的HTML页面中,你需要将其放在一起。数据的组织非常费力,值得了解这些语言/工具。你想的最后一件事就是严格的限制数据格式。

PHP

PHP的是我学习的第一种脚本语言,它非常适合网络开发,所以我用着很是舒服。本人常常使用PHP,把CSV文件变成XML格式。函数fgetcsv()就能实现。这也是个导入MySQL数据库或调用API的好办法。

资源:

Python

大多数计算机科学数据类型-至少我曾经使用过-在PHP中执行不好。选择Python,主要是因为Python代码有更好的结构和很酷的服务器端函数。我最喜欢的Python的工具包是Beautiful Soup ,这是一个HTML / XML的解析器。这是什么意思呢?Beautiful Soup非常擅长筛选抓取。

资源:

MySQL

当我有很多的数据-规模成百上千时-我使用PHP或Python将其存到MySQL数据库中。MySQL 几乎可以让我的数据子集以任何格式呈现。

资源:

R

啊哈,又好又老的R 。这就是统计人员使用,无人能超越的语言。有人在自己的计算机上安装,但还没有学习。有时我用R分析。尤其当条件非常复杂,MySQL难以胜任的时候,我用它来从数据集中提取有用的子集,然后导出为CSV文件。

资源:

Microsoft Excel

我们都知道这个。如果一个数据集很小,或者我当时就想点点鼠标,我使用Excel。

图表和图形

到此,数据已经处理,格式化,可以进行下一步。现在,开始进行可视化。使用何种软件形成统计图表和图形取决于我手头的任务,我不想把自己局限在软件里。例如,R是计算快速,能快速形成结果,但不适合Web应用程序。

Adobe Illustrator中

我用Adobe Illustrator制作出版级的图形。当我没有时间限制的去做什么的时候,我学习如何使用它,并一直很喜欢使用它。因为您可以简单地点击和拖动每一个图形元素。

资源:

R

如果你想实现一个(非动画,非交互式)特定类型的统计可视化,你有可能用到它。R是免费的,有无数资源和库。如果你没能找到一满足您的需求的库,您可以随时使用脚本实现。关于R的一个很酷的事情是,你可以保存为PDF格式的图形,然后在Adobe Illustrator中细化它。

资源:

PHP的图形库

对于PHP的GD库 我的经验非常有限。有几个PHP的图形包,但我还没有找到一个我完全喜欢的,所以我通常更喜欢使用GD库绘制自己的图形。在PHP的图形库的Sparklines也不错。

资源:

使用Javascript的HTML + CSS的+

你可以用一些简单的HTML和CSS,控制图表和表格的绘制,及其颜色和大小。例如,你在网络上看到的大量的标签云就是只用HTML和CSS。 再结合Javascript能够实现交互功能。

资源:

Flash/Actionscript

再动画和移动数据方面,Flash和ActionScript广为人知,但它可以进行统计工作。如果你想添加一些相互作用,如强调或过滤,到你的可视化工作中,使用它们非常不错。

资源:

Microsoft Excel

我很少使用Excel作图。如果我需要的东西非常急,而且这些数据存在Excel电子表格里,我会使用它的图形功能。

资源:

动画数据

有很多方法来创建动画和交互式数据形式可视化,这些是我使用过的(更多的部分,你可以在网络上直接看到)。

Processing

是的,这就是所谓的Processing 。我见过的大多是设计师使用它,但不能说明它不能用在别的地方。Processing使用画布,你画草图,然后,使得到一个Java小程序。Processing就是给非程序员设计的。

资源:

Flash/Actionscript

我一直对Flash和ActionScript很感兴趣。主要是因为Java小程序是死的,而网络是活的。交互式/动画可视化的例子,你从纽约时报,Stamen Design中看到,Web应用程序通常使用Flash和ActionScript。没看到?简单的右键点击你正在看的,就知道是什么了。从我以前写的ActionScript数据可视化中可以看到更多细节。

资源:

OK,已经很多了。一开始窝只列出10个工具和资源,但它不断增加。说实话,我没有意识到我居然用这么多东西。你用那些工具,取决于你的工作,有时候这个工具不行,那个也许就行了。

令人惊讶的是,这只是我使用的工具。还有很多我没有用过的工具。你使用过那些这里没有列出的可视化工具?或者知道一些其他很有用的资源?
原文链接

应该使用那些可视化工具/软件?-入门

2011年2月8日 没有评论

译者注:这是一篇非常简单的入门小文,虽然内容不多,但条理清楚。对于高手来说,这些东西本来就很简单。不是吗?


您是否一直想进行数据可视化学习,但不太知道从哪里开始呢?

帮助您可视化数据工具越多,却让你越迷茫,不知道从哪里开始。好消息是,有很多免费可用的工具供你选择,帮助您开始数据可视化之旅。这里,我们需要考虑的是,哪一个最适合你的问题。本指南帮您走出困境。

但是,在我们深入讨论之前,让我们先看几个问题。

你在看什么数据?

希望你已经有一个你感兴趣的数据集,如果没有,去寻找一个。在你学习的时候,使用有实际的数据非常重要,因为它将决定使用什么样的可视化工具。

网络上有很多地方可以找到大量数据。下面是几个不错的地方。

以上的数据集都比较小,别忘记那些政府机构,有些部门很乐意把他们的数据共享。选择一个你感兴趣的数据并得到它。

得到数据了?好,让我们继续。

你可视化的目的是什么?

下一步的问题是你想怎样可视化你的数据。你正在开发一个具有一些图表Web应用程序?它是一个互动的工具吗?你想在您的幻灯片演示更美观的图形呢?还是进行可视化用于出版发布?还是你仅仅需要进行分析?

在说一遍,你在这里决定将影响你使用什么工具。使用什么样的可视化软件。现在你已有两个问题的答案,我们能够决定什么工具最适合你。

用于出版

这意味着像你在报纸上看到图形。大多数人使用Adobe Illustrator 。它赋予您对您的图形中的所有元素的控制 – 颜色,字体,方向等。如果你想要做更复杂的图表,你也可以设计交给在Illustrator,加一些编程或应用一些附加库,同样可是实现。你还可以使用R,一个统计计算的软件环境和图形。用R声场pdf格式的文件,然后导入到Illustrator中进行详细的调整。

例如: The New York Times

用于演示

许多人想在幻灯片上加入一些惹人注意的图形。你可以使用上面的相同的软件,当然也可以使用微软Excel,尽管它太过简陋。这里的关键是不要使用默认设置。实际上,你可以使用Microsoft Excel做很多工作,而且看起来也不错。另外,你不要让包含在演示幻灯片中的图形具有太多细节,因为远处的人们看不到它们。

就个人而言,我不使用Microsoft Excel的图形更因为我很喜欢用R和Illustrator。

用于分析

有很多的分析工具,问一个人一个样。我用R,而这需要一些编程技能。大多数人使用Excel。我也听说Tableau软件很不错 。

用于Web应用程序

我将假定你有一个编程背景,如果你希望做一个Web应用程序的可视化。如果您不会编程,你可以尝试Many Eye或Fusion Charts。但是,你将被限制在这些应用软件的功能上。

现在,如果你正在做Web开发,这里有两个主要选择。首先是Processing ,可以使编码更容易,可以做很多超乎想象的东西。在其论坛和网站上,有丰富的教程和技巧。最终会帮助你形成一个Java小程序。

第二,更受欢迎的选择是Flash。你可以使用Flash程序做你想要的东西,或者你可以使用ActionScript,用纯编码实现你的目的。无论哪种方式,最终的结果必须在Flash环境中运行。Flare visualization toolkit(Flare可视化工具)包能够帮你。

Flash的好处是,它往往比Java加载速度更快,而且,相比于Java环境,更多的人在他们的计算机上安装了Flash环境。如果你使用Flash程序,你可能根本不用代码,但如果你想认真的进行可视化,你需要学习ActionScript。而且,通过Processing可以容易地学习智能编码。而且,它是免费和开源的。

例子: Many Eyes, Rescue Time

用于艺术

Processing明确的说,就是为艺术家和设计人员准备的软件。在说一次,它非常容易学,并且功能巨大。而对于对非交互式图形,Illustrator是最常见的选择,因为它能够对所有的设计元素进行拖拽控制。

例如: Processing Gallery

您使用什么软件?

很显然,我只提到了可视化工具中的一小部分。最终,可视化不仅仅是一堆软件的使用,而是各种供您选择完整的工具箱任你挥洒创意。

这里我列出了经常使用工具和资源。你正在使用什么软件呢?当然,你也可以参考我的翻译
原文链接

一幅图说明学科之间的关系

2010年3月30日 没有评论

对,就是下面这幅图。
图的外圈的四种颜色代表四种主要的期刊组,每组又详细的分列了很多领域,内圈主要是不同的杂志,使用“特征因子”进行划分。一开始画图时,采用了引用链接的头1000个,线条的粗细和透明度代表相关性,然后使用贝捷曲线完成作图。你可以通过点击内圈的任意一段,一段代表一种期刊,或者外圈的领域,显示所有的引用及被引用的链接。

请猛击这里体验
从这幅图可以得出或验证以下结论:
1、生物学已经成为各种科学的基础,尤其医学,环境、营养;
2、经济学、心理学、数学、计算机学这几门学科的独立性较强,尤其经济学,这意味着你学习了这几门中的一门后,以后很难转行,或者说转行后很难利用自己的专业知识,这相比于其他学科,比如医学、生物学等等,互相之间联系很紧密,你学习任意一门,都可以在这些学科中转换;
3、数学学科这一与科学研究紧密的学科竟然与其他学科很少交集,我预测将来随着计算机及应用数学的发展,未来的联系会愈发紧密;
4、science和nature是综合类刊物,因此有些从其中引用而出的关系并不可信;

分类: 数据可视化 标签: ,

有书可读

2009年2月12日 3 条评论

我小时候有个梦想,I have a dream.就是有无数的书来读。今天在网络上无意间发现一些非常creative的书架。折服于设计师的奇思妙想。

继续之前,先牢骚几句,gallery语法居然没有指定显示那幅图片的功能,这很不好。


我突然想起,我自己装修房子时的一点心得,记录在这里,以备不再犯此错误。

  1. 屋里所有的水管水龙头换一遍,没一个能用长久的,尤其是要封在家具里面的水龙头;
  2. 暖水管都要包上防寒棉,用于保温,否则冬天的时候凉的很快;
  3. 电线,网线,水管,都要有备份,万一出现问题不用刨砖;
  4. 最大限度的进行移动装修,不要把家具固定在某一个固定的地方无法移动,这样的房间住来很是无趣;
  5. 冷热阳台的防水,保暖要做好;
  6. 灯具选择容易维护的,不要看其来漂亮,换灯管麻烦的那种。换个灯管要把灯拆掉的灯具,千万不要买;
  7. 在墙上多刨几个坑,用装饰盒盖好,以备以后改变家中布局所需,主要是四线,电线,网线,电话线,有线电视线;
  8. 卫生间和厨房要留出安装有线电视的地方;
分类: 幸福生活 标签: , ,

细说显著性检验和P值

2008年5月7日 3 条评论

P值是怎么来的

从某总体中抽样所得的样本,其参数会与总体参数有所不同,这可能是由于两种原因:

、这一样本是由该总体抽出,其差别是由抽样误差所致;

、这一样本不是从该总体抽出,所以有所不同。

如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是:

、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。、根据选定的显著性水平(0.050.01),决定接受还是拒绝H0。如果P0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P0.05P 0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受令一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。

统计学上规定的P值意义见下表

P

碰巧的概率

对无效假设

统计意义

P0.05

碰巧出现的可能性大于5%

不能否定无效假设

两组差别无显著意义

P0.05

碰巧出现的可能性小于5%

可以否定无效假设

两组差别有显著意义

P 0.01

碰巧出现的可能性小于1%

可以否定无效假设

两者差别有非常显著意义

理解P值,下述几点必须注意:

P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C药取得P0.05D药取得P 0.01并不表示D的药效比C强。

P0.05时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。

统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P 0.001,无此必要。

显著性检验只是统计结论。判断差别还要根据专业知识。

显著性检验的手段

t检验

t检验有其应用条件,那就是数据基本符合常态,且两组方差(标准差的平方值)大致相齐,否则不宜采用t检验。

方差是否相齐

所谓方差不齐,是指两组的标准差相差太大。两组均数的显著性检验时,除要求资料数据符合常态分布外,还有另一前提条件,即两总体的方差(标准差的平方)要相近,因而对数据要进行方差齐性检验。

方差齐性检验的方法

1公式法

S较大者为S1 n1;小者为S2 n2。通过查“F值方差齐性检验表”或经过公式计算出F0.05值,若FF0.05,表示两组方差之差异有显著意义,也就是两组方差不齐。

2简单方法

若两组资料标准差相差超过一倍时,可以肯定两组方差不齐。

分类: 数据可视化 标签: