惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - linkcd

linkcd胡扯职业生涯规划(二): 关于 人 linkcd胡扯职业生涯规划(一): 关于定位 如何才能用好Email? 让Switch-Case/If-Else-If-Else从你系统中走开 Castle.MircoKernel Class Diagram - Part I 一个不错的scheme入门PPT 人格类型 测试结果 .Net 2.0 下Data Container性能比较: Binary Serialize Dataset vs Custom Classes 智能替换DataTable.Select中会导致错误的单引号 - linkcd - 博客园 Nullable Type is an immutable type Why does Dataset NOT serialize its BinaryFormat property? (ADO.net 2.0) Undocumented Keywords in C# System.Int32&是个啥? 《4个程序员的一天》(续) 由idior的问题想到的 回FantasySoft 4个程序员的一天 n久以前写的火星文 Solution for SICP 在Vs.net中集成 NDoc生成的 Html Help 2帮助文档
[翻译]每个作者都应该懂的统计学 Part I
linkcd · 2005-12-18 · via 博客园 - linkcd

因为在研究Six Sigma,需要用到如 标准差 这种 概率论与数理统计 里的概念,但是由于个人经历,没有上过这门课程。

没办法,自己找资料来学吧。

下面的翻译,因为不熟悉专业名词,就保留原文吧。如果有问题请指正,谢谢。
原文链接:
http://www.robertniles.com/stats/

Mean
最常见的统计学工具之一,并且易于计算。全部【相加】,再除以【个数】。举个例子:
比方说你现在要为World Wide Widget公司进行统计。该公司9名职员的薪水如下:

总裁年薪:$100,000
2个经理,每人年薪:$50,000
4个工人年薪:$15,000
2个学徒年薪:$9,000

所以你把所有薪水加起来:$100,000 + $50,000 + $50,000 + $15,000 + $15,000 + $15,000 + $15,000 + $9,000 + $9,000(上面工资表中所有的数值),总和是$278,000。然后再除以9(职员人数)

最后,你得到了Mean:$30,889.

不是个很差的平均年薪,是吧?但是注意:WWW公司全部9名职员中只有3名职员可以挣到这个数字,而其他6个人甚至不能挣到这个平均值的一半。

那么,我们应该用什么样的统计工具来分析WWW公司【普通职员】能挣多少呢?现在让我们来看看Median。

Median
无论何时,如果你发现自己在写如【普通职员】,或是【普通家庭】这类字眼,你不会想去用前面讲到的那种平均值Mean。你需要那种能确实表示大众化情况的统计工具,这就是Median。

同样,这个统计也很好用:正如它字面意思一样,Median就是处在中间的值。只要把你的数值从大到小排列起来,中间的那个值就是你的Median。

就WWW公司的情况来说,让我们来排列一下他们的工资:
For the World Wide Widget Co., here are the worker's salaries:
$100,000
$50,000
$50,000
$15,000
$15,000
$15,000
$15,000
$9,000
$9,000

这里有9个职员,那么正好会有个人处在9个人的中间位置,即第五个值:$15,000。这就是Median。(如果你的数值是偶数,那么去算中间2个值的Mean,即把2个最中间的值加起来除以2)

比较同一集合的mean和median,可以让你知道该集合中数值分部情况。在这个例子里面,WWW公司总裁的薪水和普通员工的薪水水平就差距很大。(当然,在现实世界中,仅仅9个数字远远不够提供什么有价值的信息。但是在这里说明概念就够了)

再来一个例子:10个人在Redmond(译注:微软总部所在地)赶公交车。这10个人年薪的Mean是$50,000,他们年薪的Median恰好也是$50,000。

Joe Blow下了车,Bill Gates上了车。

现在,这些乘客年薪的Median仍然是$50,000,但是Mean却攀升到$50 million这样让译者眼红的数字-_-。有人可以说现在这些乘客的平均年薪是$50 million,但事实上其他9名乘客并没有因为Bill Gates上了车就变成了百万富翁。当我们在讨论这辆车上【普通乘客】的年薪时,仍然应该使用Median值:$50,000,这样才能反应真实的情况。

(统计学有个概念被称为:standard deviation,它会告诉我们在一个集合中各个值的分部密度。)

下一课:Percent Change
Percent Change可以很好的帮助人们理解随时间变化的数值。同样,学习这个不会用到比小学3年级数学更高深的知识。

用新值减去旧值,然后再除以旧值,就得到了你要的Percent Change。

例如,Springfield和Capital City去年都有50个罪犯。看起来2个城市的治安都一样,不是吗?也许是,也许不是。让我们来看看2个城市以前的犯罪记录,这样可以用Percent Change来进行比较。

5年前,Captial CIty有42个罪犯,而Springfield只有29个。

新值减去旧值,再除以旧值。好了,你算出来的吧?在5年时间里,Capital City的罪犯增长了19%,而Springfield增长了72%!

理解?

等等!在你计算Percent Change的时候,还有些东西需要考虑。让我们来看看Per Captia

Per Capita
当你在比较多组数字时,Percent change只能让你了解事实的部分真相。另一个重要的统计学概念是每组数值的Per Capita。这个概念能帮助你在不同大小的组间进行比较。

再让我们来看看Springfield和Captial City。今年有800,000人居住在spingfield,600,000居住在Capital City。但是在5年前,Springfield只有450,000人,而Capital City有550,000居民。

为什么这个很重要呢?因为这事实上说明了在过去5年里,Sprinefield市的扩张速度远远大于Captial City。这就解释为何Sprinefield会有更高的犯罪增长率。毕竟,一个城市拥有更多的人口自然也会出现更多的罪犯。

为了找到究竟哪个城市更危险一些,你需要计算一个per capita的罪犯比例(a per capita murder rate),即多少人中会出一个罪犯。

为了找到这个比例,只需要将罪犯的数量除以该市的人口数量。为了得到比较少的小数点,我们一般会在结果上乘以100,000,即每100,000人中会出现多少罪犯。

拿Sprinefield来说哦,50个罪犯除以800,000人,可以得到大约100,000人中有6.25个罪犯。Capital City则是50除以600,000,得100,000人中有8.33个罪犯。

5年前,Springfield的29个罪犯除以当时的人口450,000,大约是每100,000人中有6.44个罪犯。而Capital City是用42个罪犯除以550,000,得到每100,000人中有7.64个罪犯。

仅仅看Percent的话,我们会认为:在过去5年里,Springfield犯罪率增长了72%,而Capital City只有19%。但现在我们分析Per Capita,可以发现每100,000人中,Springfield的犯罪人数下降了近3%,而Capital City增长了近9%。。。

这才是真实的情况。。。

下一课:Standard Deviation
(未完待续)