请教个数学问题

2014-06-27 18:45:12 +08:00
 wudikua
我有两组样本

1 1 1 10
E=3.25
方差=7.79

10 10 10 100
E=32.5
方差77.9

假如我想按照一个固定的方差数,来过滤出不均匀的数据,这个固定数的选择好像受不同样本基数的影响,怎么能消去这种误差呢。
2692 次点击
所在节点    程序员
4 条回复
blacktulip
2014-06-27 19:06:54 +08:00
方差 / E ?
kokdemo
2014-06-27 19:11:47 +08:00
……没懂你这是要消除啥误差
akfish
2014-06-27 19:20:48 +08:00
没理解错的话,lz是想要过滤掉数据里的outlier。
通过固定方差阈值的方法并不可靠,因为方差是一组数据本身固有的统计学性质,对一组数据有效的阈值,可能会过滤掉另一组数据中的有效值。
鉴别、消除outlier的方法很多,可以自己搜索类似outlier elimination的关键字。
几个参考:
http://en.wikipedia.org/wiki/Outlier
http://en.wikipedia.org/wiki/Peirce's_criterion
https://www.eol.ucar.edu/system/files/piercescriterion.pdf
http://www.seas.upenn.edu/~ese302/extra_mtls/REGRESSION_OUTLIERS.pdf
wudikua
2014-06-30 13:54:17 +08:00
@akfish 并不是outlier,我说个通俗的例子吧,两个运动员,一个是射击运动员,一个是短跑运动员,给他们10次机会,并记录他们的成绩,然后计算方差来看他们的发挥的是否稳定,稳定的就可以去参加奥运会,但是由于他们的成绩的单位不同,我就没法说方差小于X的才能去参加奥运会。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/119879

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX