研究人员如何处理不完美正态分布的数据?他们是否对适用于正态分布的数据使用统计方法,然后确认结果可能不是很准确?
数据本身很少需要正常分布才能构建有用的模型。
相反,经典统计所依赖的是中心极限定理,这说明了关于分配的一些事情平均许多观察结果(以及回归模型中各种数量的分布,如系数)。
即使我们自己处理数据而不是平均值,我们仍然可以使用正态性。回想一下,回归模型告诉你意思一组数据点,而点本身是正态分布的周围这意味着。举一个非常简单的例子,这是一个双峰分布:

数据本身显然不是正常分布的。然而,这可能代表两组,一组平均值约为-2,另一组平均值约为1.5。如果我们有一个二进制变量来告诉你从哪个组中抽取数据点 - 称之为“G” - 我们可以写一个模型说:
Y = beta * G +错误
这其实很简单单因素方差分析模型,所有它的说法是错误通常是分布式的,而不是数据本身。
本站所有相关知识仅供大家参考、学习之用,部分来源于互联网,其版权均归原作者及网站所有,如无意侵犯您的权利,请与小编联系,我们将会在第一时间核实并给予反馈。



















