> 配资网 > 证券配资 >

如何在量化投资中获取相关数据?

2020-01-17 16:16

配资平台哪个好?

赢响配资网,打造在线股票配资理财领域的第一品牌。精选股票配资、配资公司排名、配资炒股平台等资讯动态,及股票投资等相关股票入门基础知识介绍。

  

  下一步是购买或生成测试理论的数据。当然,我们总能买到几千个时间序列,也可以做实验、做调查来生成数据。不幸的是,可用的数据看上去从不是我们想测量的量,也不是我们想用它来测量的量。那些数据总是存在污染、噪声和错误,至少没有大量数据是完全合乎要求的。

  数据质最涉及许多数量级。可用的证据显示,最熟知的价格序列几乎总是正确的,当它们不正确时,误差也很微小,例如只有小麦价格的1美分或者2美分。另一方面,对国民生产总值(GDP)的估算总是有错误,而误差值可能有几千万甚至几亿美元。

  误差的范围很多是按百分比计算的,许多价格序列的误差可能在1%或者2%。另一方面,许多企业的业绩报表有约50%的误差。如果某公司的年度报告宣称每股收益是2.53美元,这意味着公司经营者根据可用数据、某些会计评审和假设,估计每股收益为2.53美元。不同的假设和判断会产生不同水平的每股收益估计值,例如,每股收益从1.25美元至3.75美元不等。

  上文给出的例子给人这样一种不好的印象,即问题更客观。某一数据序列的误差大小在很大程度上取决于误差到底是什么意思。例如,如果国民生产总值没有计算地下经济、家计部门、休闲和经济总体中许多其他的部门,而同时它们又非常重要的话,那么报告的GDP可能会低估实际GDP水平约20%至40%。更糟糕的是,报告的GDP低估实际GDP的程度在时间和地点上几乎是不变的。例如,休闲越来越多地占据了我们的时间。如果这是真的,没有其他重要的抵消因素,那么报告的GDP就会越来越低估实际的GDP。另一方面,如果可以忽略上述的技术细节和许多其他技术细节,且关注GDP每季度的变化,那么我们可以假设误差率为1%,或者1%的一部分。

  误差问题有的严重程度,取决于如何使用数据。一些预测一两年内商业票据的利率变化的人不用担心GDP中几十亿美元的误差。相反,许多基于统计技巧的短线追踪系统可能会因为每日价格序列中的微小误差而受到极大影响。

  如果我们想要预测通用电气的价格,而不是《华尔街日报》中记录的价格,那么了解感兴趣的数据所包含的误差的程度和类型是很有用的。根据定义,只有两种类型的误差:系统误差和随机误差。系统误差包括数据中的偏向。换句话说,应该被取样的人口并未被取样。例如,由于许多投资方面的原因,有关个人或者家庭的收人分布的信息会有用处。但这类数据最明显的一个来源——税收记录的价值却不确定。这些记录可能是有偏向性的。至少,只要纳税人说谎会有好处的,记录就是有偏向性。美国税务局尽一切所能来保证记录的准确性。但是只要是在一个敌对环境下,它能做的事情都会受到严格的限制。

  随机误差是非系统误差以外的误差。例如,当输入数据时,存在按错键的可能性。5.01美元可能被输入为5.04美元或者5.02美元。如果误差的概率无法确定,那么误差就是随机的。如果数据误差很小而且是随机的,那么它们就不重要。更准确的说,我们很容易通过标准统计技巧米控制微小的随机误差。

  当然,数据包含的系统误差的类型取决于数据的类型。误差的类型如此之多,以至于无法在此一一列出。尽管如此,大多数投资者只对定量时间序列感兴趣,而它们至少包括四种重要的系统误差。第一,数据源本身可能因许多原因而有误差。例如,数据可以完全是谎言,就像一些收入和经理人绩效数据。或者就像国民生产力数据那样,概念被错定了。生产力是指每工时的产出,只有我们知道如何测量它时,它才能引起我们足够的兴趣。我们可以测量一个钢铁厂或者发电厂的生产力,但是我们如何测量吗家银行或者一个经纪公司的生产力呢?考虑到每四个美国人中就有三个从事服务业,这明显是一个重要的技术问题。

本文地址:http://www.winxw.com/wen/3169.html

股票配资公司
原油配资
股票配资平台 更多>>
安全股票配资均线二次握手的买入时机和均线二
如何在股票投资中消除灾难性风险?
程序化交易有哪些优缺点?
如何看待潜意识的选择?
进行投资时如何看待潜意识的选择?