高端设计:[转载]中位数(Median)

来源:百度文库 编辑:九乡新闻网 时间:2024/04/29 16:41:48
[转载]中位数(Median) 1、定义:一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)。 
2、中位数的优缺点:中位数是样本数据所占频率的等分线,它不受少数几个极端值得影响,有时用它代表全体数据的一般水平更合适。
3、在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。
4、直观印象描述:一半比“我”小,一半比“我”大。

中位数的算法
求中位数时,首先要先进行数据的排序(从小到大),然后计算中位数的序号,分数据为奇数个与偶数个两种来求.
中位数算出来可避免极端数据,代表着数据总体的中等情况。
如果总数个数是奇数的话,按从小到大的顺序,取中间的那个数
如果总数个数是偶数个的话,按从小到大的顺序,取中间那两个数的平均数
(例:2、3、4、5、6、7 中位数:(4+5)/2=4.5)
在物价涨幅攀升的时候,适当提高企业退休人员养老金标准以及在职职工的工资,有利于保障他们的基本生活,并逐步提高生活质量。但是,只提供一个“平均数”让人心里总是有点不大踏实。一个平均数会掩盖很多的问题,不久前网友还创作了这样的打油诗:“张村有个张千万,隔壁九个穷光蛋,平均起来算一算,人人都是张百万。”对于这样的问题,不是“平均数”的错,也不是统计学的错,统计学中有现成解决的办法,就是计算“中位数”。所谓“中位数”,以一个51人的企业为例,把所有人员年收入从大到小排列,正中间的一位,即第26位的年收入就是这家企业年收入的中位数。打油诗里的“张村”个人财产中位数就是“零”。这个时候平均数不能说明的问题,中位数就说清楚了。
注意:是从小到大,或者从大到小,不是随意乱排。中位数是一组数据的中间水平。
实例:第1组数:1、2、3、6、7的中位数是3。 原理:如果总数个数是奇数的话,按从小到大的顺序,取中间的那个数
第2组数:1、2、3、5的中位数是2.5。原理:如果总数个数是偶数的话,按从小到大的顺序,取中间那两个数的平均数.(2+3)/2=2.5
第3组数:1、100、101、10000的中位数是100.5 注意:中位数 和数值的大小没有绝对的关系
中位数、平均数、众数的相同点与不同点:
 
一、相同点
平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表。
二、不同点
它们之间的区别,主要表现在以下方面。
1、定义不同
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数 。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。

2、求法不同
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。

3、个数不同
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。在一组数据中,可能不止一个众数,也可能没有众数。

4、呈现不同
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据。

中位数:是一个不完全“虚拟”的数。当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数。

众 数:是一组数据中的原数据 ,它是真实存在的。
5、代表不同
平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”。
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。

6、特点不同
平均数:与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。

中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。

众数:与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不惟一性,一组数据中可能会有一个众数,也可能会有多个或没有。

7、作用不同
平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等。
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合。