【飞狐交易师】新增函数简介其三
[ 来源: ] [ 作者: ][ 时间:2007-03-10 ]
飞狐函数简介(新增)之三
三、相关系数,扩展数据和横向变量简单介绍
相关系数用于比较两个形态的相似程度,是统计学应用于技术分析的又一尝试。
扩展数据和横向变量,应用广泛,也很重要。这里只介绍最简单方面的。如果你一点不会,可以看看,如果会一点,也就不用化时间看了。
1、
函数: CORR(X1,X2,N)
参数: X为数组,N为统计周期
返回: 返回数组
说明: 求X1与X2的N周期的相关系数
示例: CORR(CLOSE,HIGH,10)
表示求10周期VAR1与VAR2的相关系数
摘录几句统计学书中的话,以便对“相关系数”有个大致印象。
变量之间的关系可以是确定性的关系,也可以是非确定性的关系。如圆的半径确定之后,圆的面积和周长就确定了。这种变量间有确定性的关系,在数学上称为函数关系。变量之间,既存在密切的关系,又不能由一个(或几个)变量的值完全确定另一个变量的值,这种变量之间的非确定性关系,称为相关关系。
回归分析与相关分析都是研究及度量相关变量之间关系的统计方法。讨论变量之间是否相关,相关的程度,寻求其规律,就是相关分析与回归分析的任务。对回归和相关问题的研究最初起源于生物学界。“回归”一词,首先由英国生物学家兼统计学家高尔登(Galton)用于研究身高的遗传问题而提出的。
描述两个变量线性相关关系密切程度的量叫相关系数,一般用r表示。r的绝对值,不会大于1。
如果变量Y随着变量X的增大而总体趋势变大,称X与Y正相关,相关系数r>0。
如果变量Y随着变量X的增大而总体趋势变小,称X与Y负相关,相关系数r<0。
如果变量Y随着变量X的增大而上下乱跳,毫无趋势性,称X与Y不相关,相关系数r=0。
如果变量Y与变量X有确定的线性函数关系,称X与Y完全相关,相关系数r为1或者-1。
|r|越大,越接近1,说明变量X和变量Y的相关程度越高。
|r|越小,越接近0,说明变量X和变量Y的相关程度越低。
好了,现在把变量X,替换成指标线X1,变量Y替换成指标线X2。用CORR(X1,X2,N)求出两指标线在N个周期内的相关系数之后,我们就可以知道两指标线之间,是正相关的,还是负相关的。而且也可以知道相关的程度是多少了。
如果是正相关,而且r的值接近于1,两条指标线在形态上就很相似。如果r的值接近于0,两条指标线在形态上就不太相似。
相似与否,就象判断张三和李四长得象不象一样,是个主观性相当强的问题。有了相关系数之后,这个模糊问题就量化了。形态在技术分析中,占了非常重要的位置,可是从来没有人,来量化形态,验证形态的胜率,是因为形态太主观了。飞狐可以说在这方面,迈出了探索性的一步。
那么用相关系数来找相似形态,效果到底好不好?我不知道,因为每个人,对“相似”的看法,并不是完全一样的。
用指标排序,来看看“相似”到底是什么。同时,也提出我对判断“相似”的一种方法。
上证指数,从5月21,到今天(6月20),收盘价线大致上走出了双头形态。我们就从所有上海A股中,各找三个与上指收盘价线在这段时间内形态最“相似”的个股。
公式:
A:=BACKSET(ISLASTBAR,N+1); B:=BARSLAST(A>REF(A,1));
D:=REF(C,B); E:=REF(INDEXC,B);
个股:C/D,COLORRED,LINETHICK2;
大盘:INDEXC/E,COLORGREEN;{都从1开始,形状均不变}
F:SUM(ABS(个股-大盘),N+1),LINETHICK0;{累计每天两线之间的距离}
G:CORR(个股,大盘,N+1),LINETHICK0;{求两线之间的相关系数}
{参数N:22.0.999}
我的意思是,把两条线放到同一起点之后,后面每天两线之间的距离之和越小,形态越相似。
CORR的意思是,两线之间的相关系数越大,越接近1,形态越相似。
分别用指标F、G在上海A股板块中,进行指标排序。
2、
函数: CORRTPL(TPLNAME,X,D,N)
参数: X为数组,N为统计周期
返回: 返回数组
说明: 与模板相关系数
D为常数,表示0:开盘价,1:最高价,2:最低价,3:收盘价,4:成交量,5:成交额
N表示计算最后多少组,为0表示计算所有,用于当前选股时设为1可大大减小计算量
示例: CORRTPL('一马平川',CLOSE,3,1)
表示求收盘价线与一马平川收盘价线的最后一组的相关系数
上例中,叠加的是大盘指数。这里,叠加的是形态模板在最后一组的收盘价线。
3、扩展数据
在简单介绍扩展数据和横向变量之前,有必要介绍一下两个概念:
A、纵向和横向
在不同的时间,对特定的统计个体,取得不同的数据,谓纵向对比。比如,我国人民的平均年收入,在1980年是X元,在今年是Y元,增长了百分之(Y-X)/X*100。
在相同的时间,对不同的统计个体,取得不同的数据,谓横向对比。比如,我国人民今年的平均年收入为X元,美国人民今年的平均年收入为Y美元。人民币和美元,经过适当换算,就可以对比出来了。
只有对纵向和横向都进行对比,我们才能获得比较完整全面的统计数据,否则容易产生统计陷阱。
同样,某个股,在不同的时间,有不同的收盘价等等数据,就形成我们最经常看的K线图和成交量图,还有一些指标线等。这些数据,是纵向安排的。打开行情列表,可以看到不同的个股,有不同的收盘价和涨幅等等数据,这些数据,是横向安排的,即在相同的时间,不同的个股,有不同的数据。
B、数据的组织
飞狐里,一共有几种数据形式?看看STKINDI函数的说明就知道了:
PERIOD为周期类型,有效值范围为(-1-11),依次表示:
当前周期、分笔成交、1分钟、5分钟、15分钟、30分钟、60分钟、日、周、月、年、多日、多分钟
一共有十二种。这十二种数据是怎么组织起来的?来自四种数据(文件):
日线数据、分笔成交数据、五分钟数据、一分钟数据。
除了各数据本身,15分钟、30分钟、60分钟数据,取自五分钟数据。周、月、年、多日数据,取自日线数据。多分钟数据,如果是五分钟数据的整数倍,取自五分钟数据,否则取自一分钟数据。
目前日线数据,和五分钟数据,最多可以保存10560组。分笔成交数据,由于不连续显示的,可以保存很多。一分钟数据,原来最多可以保存20天,现在改为40天。以一天240组计算,40天为9600组。
共2页: 上一页 1 [2] 下一页
发布者:
注意:
· 遵守《全国人大常委会关于维护互联网安全的决定》,遵守中华人民共和国的各项有关法律法规。· 尊重网上道德,承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
评论列表
用户名: (新注册) 密码: 匿名评论