选用周期的方法

 

    按照《质周期分析》的数学理论,把时间序列分解为各个质周期因子之和。对于总周期已知的序列,这是绝对正确的。对于总周期未知,长度为L 的时间序列可把它表示为所有周期长度丛2到2L的平方根的质周期因子之和。这个和作为有资料时段的模拟倒也可以,但用它来做外推预报都却不会很好。原因只能是:这些周期因子不完全是系统固有的规律性的因子,其中含有随机误差或噪声。所以,如何,即凭什么特征去寻找并找准系统固有的所有周期,是我们目前尚未解决的关键性问题。

我现在用来寻找的特征值有以下几种。

           序列的自相关系数R。这是我最早使用的,因为当时是手工计算。计算每一个周期的统计因子的振幅,计算量是很大的,计算自相关系数较容易。尤其当时使用的资料是我自己记录的晴雨序列,即0,1序列时。我只要准备两条同样的0,1序列纸条,把它们叠在一起,在计算R(t)的时候,只要把两纸条错开t个时间单位,再数一数1和1 重合的个数就可以了。R(t)高的,周期为t的统计因子的振幅也大,在R(t)的时间曲线上选取锋值作为因子周期。

           平均振幅A。就是统计因子的均方差开方,实际上也就是谱分析中的谱。不同的是,谱是单一的正弦函数的振幅,而我们的质因子含有很多正弦函数,A是所有这些函数的振幅之和。但由于我们分析的并不是总周期已确定的序列,统计因子的周期是自然数序列,而不是某确定的基频的倍频之倒数,所以也必须与自相关函数R(t)一样,只取A(t)曲线中有锋值之T。因为我们的统计因子是质因子,周期为质数的周期因子,本质化时只减去平均值,不减小其均方差,所以质数周期的质因子振幅常偏大,容易被入选。

           有效振幅Af 。如果某一周期真正是系统的固有周期,那么用不同时段资料统计得到的统计因子应该是差不多一样的,它们之差的标准差应该是很小的,如果取平均振幅除这个标准差,那么这个振幅就会被大大的放大。相反,不是固有周期,相互间标准差大,振奋则会被缩小。我们称这个值为有效振幅,以它为标准选因子,可抑制模拟而提高外推预报的准确性。

           有效相关Rf 。像求有效振幅一样,把所有资料分成几个时段,分别统计得到各自的质因子,然后计算它们之间的相关性。计算是交错进行的,即任两时段的统计结果都计算,所以第一个时段的数据和最末时段间的数据也要直接求协方和。而计算普通的相关系数R(t)时,第一个数据只与其后第t+1个数据相乘,与其后的数据就不直接交错相乘了。这样的相关系数比起普通相关系数来,在鉴别选取真正的周期因子中,应更可靠,故命为有效相关。

③④中的分时段(或叫批次)统计时,究竟分几个批次p=?当然,至少是p>=2,只要保证时段长度L除批次L/p大于被统计的周期t就可以了。但批次越多,计算越费时。究竟应取多少批次为好,我目前尚未设计并进行对p值的专门实验,还没有任何结论。

以上诸特征值,都要画成曲线,然后寻找锋值的位置。但是要满足怎样的条件才是我们的锋值?极端的情况是只要该点的值大于其左右两点的值,就算锋值 。一般情况下我要计算从该点值到其左右的谷底的距离,并计算这个距离与锋值的比值。于是选周期的标准可描述为:两侧的比值或只要一侧的比值大于某个小数(<1)。在试验时,有时此值为0.01即足,有时要大一些,达到0.5才有较高的预报评分。因为评分标准本身还不很正确,至以也未得出确切的结论。

如果对一个确定的正弦函数生成的序列,计算其平均振幅的话,那么除了在该周期位置有一个锋值外,在其两侧还有一系列依次减小的小锋值(谱线中的侧瓣)。所以,上述的取锋值方法有可能不合理。例如对于年周期很明显的日平均温序列,很容易在365左右取得多个质周期因子。它们重覆了年周期的变化,反而使预报不正确。为此,要对这些特征值先进行平滑化运算,以便除去这些侧瓣的干扰。这种平滑化的平滑长度应为多少(3,5,7?),应平滑化几次才行,也还没有专门的试验。

对实际序列,采用上面的千万种不同组合的情况,都进行试验,确定怎样才能使预报评分最高。这里除了大量的计算外,成败关键还在于正确合理的评分,因为我们不能由人来比较所有预报结果的优劣,只能由计算机去比较评分的高低。另一个方法是有目的地生成各种已知周期规律的序列,再对它进行试验,这里的工作量更是无底的。

                                                                                    

                                                  2000.8.14