皮尔森相关系数也叫皮尔森积差相关系数,是用来反应两个变量相似程度的统计量。或者说可以用来计算两个向量的相似度。皮尔森系数是最常用的判断相关性的指标之一,本次试验以它作为判断相关性的重要指标 。
正相关,是指两个变量变动方向相同,一个变量由大到小或由小到大变化时,另一个变量亦由大到小或由小到大变化。即其数据曲线的切线斜率始终大于零。如身高与体重,身高越长,体重就越重。也就是说,在正相关的情况下,一个变量随着另一个变量的变化而发生相同方向的变化。其中,引起变化的量叫做自变量,另一个变量叫做因变量。
统计学中常用相关系数 r 来表示两变量之间的相关关系。 r 的值介于-1 与 1 之间, r 为正时是正相关,反映当 x 增加时, y 随之相应增加;呈正相关的两个变量之间的相关系数一定为正值,这个正值越大说明正相关的程度越高。而不相关的概念就代表相关性较小,对应的相关系数 r 是大于零但绝对值很小的数。
负相关,是在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大)的现象。在这种情况下,表示相关程度的相关系数为负值。
计算机和石油化工,地质,采矿,钢铁等的相关性很低。如果你的择时能力很强,就可以同时在不同的资产上进行操作。同时我们也能意识到,股票行情总不能是不变的,某一种趋势不会永远持续下去,总有交替的时候,不同的行业间的股票,不同类别间的股票相互交替,这就形成了趋势间的衔接。当我们利用相关性,买入不同类别的股票,是不是说当我们在这支股票上小有亏损的时候,正好有可能在另一支上获利呢?这样是不是能够形成较好的收益曲线呢?
前两种情况的基准为大盘:
1 )按一定权重买入跟大盘(平安银行)相关的 20 支股票的走势图: (参数:深沪 300 ,调仓周期为 15 天,持股数为 20 ,收盘价天数为 60 天。)
2 )按一定权重买入跟大盘(平安银行)不相关的 20 支股票的走势图: (参数:深沪 300 ,调仓周期为 15 天,持股数为 20 ,收盘价天数为 60 天。)
这样分散开来买进,策略走势变的非常接近大盘走势
后两种情况选择以“贵人鸟”为基准:
先贴一张全仓购入贵人鸟的回溯效果:
3 )选择贵人鸟不相关的股票(皮尔森系数很低,而不是负数) 6 支,分别购入 15%,再购入贵人鸟 10%,效果如下:
波动和回撤有所降低
4 )买入与贵人鸟近似负相关的 6 支股票,各同时买入 15%,贵人鸟购入 10%的走势图:
波动和回撤变的更低
通过实验得出,分别持仓相关性低的股票有个好处就是虽然不能有太高的收益率,却十分稳定,策略走势与大盘更加贴合,曲线的走势更平稳,波动更小。从分散投资、降低风险的目的考虑,应避免把所有股票投在同一种类别。而分散股票的方法就是利用相关性,购入相互之间相关性很低的股票,就可以有效降低风险。
如果你真的是程序员,进入镭矿 raquant量化平台亲自试试吧。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.