.
当前时间
 
天气信息

数据分析的八大误区及应对策略

来源:山西高考志愿填报咨询网忻州站作者:孙全亮网址:http://www.sxgkzytb.com浏览数:590 

数据分析的八大误区及应对策略

                     www.sxgkzytb.com

         山西高考志愿填报咨询网 孙全亮


高考志愿填报,是一项复杂的系统工程,无论是院校志愿、还是专业志愿的选择,都要进行数据分析,较好地预测院校投档线、专业投档线。数据分析的目标是尽量减小预测数据的误差,以期达到最优化。数据分析涉及到概率统计和时序分析等学科中很深的数学知识,本文在此不做深入讨论。要理性填报志愿,正确进行数据分析,必须注意以下八大个误区及应对策略。

误区一:简单照搬原始数据的误区

应对策略:要用“线差”的方法

   很多家长,自己处理的数据是往往是简单的、粗糙的,大都停留在手工处理数据的阶段,不会用电脑进行大数据分析,没有经过数据预处理、综合分析、修正校验的过程,可靠性低,误差大。甚至方法错误,更甚至于采集的原始数据就存在错误。

有个别家长,直接使用原始数据进行比较。要知道,原始数据不具有可比性,今年的600分与去年的600分,其含金量是不同的。要用“线差”(考生成绩与各批次线的差值)的方法,才具可比性。这一点,大部分家长是认同的,也会使用。

误区二:只用一年数据的误区

应对策略:至少用四至六年的原始录取数据

如果只用一年的数据,偶然性的因素不会排除,招生录取的“大小年”现象无法回避,至少要用四到六年的数据。

所谓大小年的现象,就是高校招生中某个或某些学校的招考人数很不稳定,起伏很大。某一年填报该校的人数比计划招生数高出许多倍,直接结果是当年的录取分被抬得很高,这一年称之为大年。由于上一年录取分高,竞争异常激烈,使下年许多考生望而却步,不再报考该校了,带来的结果是参与竞争的人少,录取分相应就降下来,我们将其称之为小年。再下一年的考生看到头一年的录取分不高,可能报考的人又多了……如此循环,报考人数和录取分起伏十分明显,就形成了所谓的大小年现象。

误区三:权重平均分配的误区

应对策略:用指数平滑的方法

我们知道,离现在越远的数据,对未来的影响越小。要使用四至六年的数据,每年数据的权重不能等同。关于权重分配,涉及很深的数学知识,我们不展开深入讨论。

误区四:使用最低分的误区

应对策略:至少要用平均分

最低分这个指标,从逻辑与数学的意义而言,是能否上一个院校(或专业)的必要条件,只能起到否定的作用(不能上),这不是我们考生和家长的目标。我们追求的目标是应该有90%以上的概率能上学!是一种肯定,而不是否定!而我们大多数人的思维定势往往是想以最低的成绩上最好的院校。从感性而言可以理解,但从理性来讲,不够明智。

而平均分是一个充分条件,能起到肯定的作用(但应注意,这种肯定是统计学意义的肯定)。同时,应该注意,平均分也有其局限性。

误区五:平均分算法错误的误区

应对策略:所有考生的实际平均值

平均分并不是最高分与最低分的几何中心(最高分与最低分的算术平均),而是低于几何中心位置。有的学者提出了3/8方法、2/5黄金线法等,有一定的合理性,最好的方法是使用所有考生的实际平均值。

另外,由于最高分与最低分(属于极端值)的不可靠性和偶然性,在数据分析的过程中,应该按极端值处理的方法进行。最简单的事例是,在各种竞赛的评比中,经常用去掉一个最高分、去掉一个最低分,就是这个道理。

误区六:排名法(位次法)的适用范围的误区

应对策略:综合运用各种方法

要注意排名法实质上是一种变相的最低分法,是最低分转化后的另一种表现形式。要特别注意其适用范围,在1A高段、最多在1A中段是有效的,但在1A后段、1B段、特别是2A段、2B段是失效的!

误区七:位次与线差等同的误区

位次与线差的地位不可等同,成绩位次是一个数量概念,而成绩线差是一个数据概念,位次的准确性大大低于成绩线差。有的人将名次进行平均计算,我不敢苟同,有待在理论上作进一步的商讨。

误区八:只用一种方法的误区

在志愿填报实践中,要尽力避免数据分析的各种误区,综合使用原始数据分析的各种方法及延伸数据的各种指标,整体考察,宏观把握!。