平均数,也就是算术平均数,指的是所有数据的总和除以总数后所得的商,其代表着某一组数据的整体水平,表征的是集中量。此外,中位数、众数等也是常用的集中量。中位数即是将所有数据从小到大或从大到小依次排列后位于中间的那个数(或中间两个数的平均数)。而众数则是一组数据中出现次数最多的那个数。
每一类集中量都有其独特的性质和应用范围。算术平均数的重要性质之一是各变量与平均数的离差之和等于零,性质之二是各变量对于平均数的离差方之和最小。也就是说,算术平均数是误差最小的总体表征值。正是因为算术平均数的严谨性,同时在表达上简单、直观,更能作进一步的代数运算。因此在所有的集中量中,算数平均数的应用范围最为广泛,能有效地反映日常生活中批量数据的整体水平。
但从本质上来说,算术平均数也存在缺点。因其运算需要涉及到整组所有的数据,其中任何数据的变动都会引起平均数的变动,所以平均数极易受到极端值的影响,当出现偏大数时,平均数会较高,当出现偏小数时,平均数会降低。因此,在比赛评分采用算数平均数时,应去掉数据组中的极端数值,即最高值和最低值。
以舞蹈比赛评分为例,假设对于某位舞者的表现,10个评委分别打出了分数,一种情况是可以直接计算平均分,但如果去掉一个最高分和一个最低分,再计算得出的平均分就会有差别。去掉最高分和最低分,避免了个别评委对舞者的极端好恶,能将舞者的舞蹈水平评判得更为公正。甚至有时会去掉两个最高分和最低分,以更大程度地过滤掉评分过程中的异常情况,让比赛更为客观公平。
那为什么不采用中位数呢?在统计学里,中位数是表征数据组的“中等水平”的集中量。虽然中位数能很好地代表“中等水平”,但是却抹煞了评委个人细微的评审意见。
所以,去掉一个最高分和一个最低分再计算平均分的办法,既能免于异常值对平均分的影响,又能体现评判者的个人评审倾向,是一种比较合理的方案。
(秦 薇)