我有一个回归我正在研究预测某个股票未来收盘价变化的问题外汇配对,主要是USDJPY
,所以我做了以下事情:
- 获取外汇历史数据
USDJPY
对之间2001 年和 2017 年,它具有以下属性Open, High, Low, Close, Volume
(每15分钟)。 - 抓取每 50 条记录并按顺序将它们放入一条记录中
X1Open, X1High, X1Low, X1Close, X1Volume .... X50Open, X50High, X50Low, X50Close, X50Volume
。(注:前 50 名从 1 至 50,第二名从 2 至 51...等) - 添加了一个名为的新属性'坡'代表角度的新数据(归一化为某个值) 未来收盘价向前 25 点的回归线。
(Don't mind for details it simply represents the Label)
- 计算双变量皮尔逊相关在我的新数据集中的所有变量之间使用
IBM SPSS
来搜索multi-collinearity
问题。
问题是,我发现任何独立变量与另一个变量之间的相关性等于+1,任何独立变量与因变量“斜率”之间的相关性被称为-0.12。
这根本说不通,X1Open
例如,变量怎么可能与 高度正相关(+1)X37High
!!而且,所有独立变量怎么可能与因变量具有相同的相关值(-0.12)?!
提前致谢。