马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
中心思想:数据的完整性和真实性是龙虎榜的灵魂,软件是上层建筑
笨笨鱼 序言
真正接触龙虎榜是今年年初的时候,立刻被他的神奇所吸引。你能看到庄家的买卖情况,一切原来在背面的东西一刻间都真相大白。刚接触的是来源于创鑫阿健的20强席位持仓明细,你可以看到每只股票的前20强的席位。一时间很多的证券网站都转载。后来陆陆续续出现了龙虎榜的软件和数据。从开始的DOS版龙虎榜数据到EXCEL版的5万股成交,到现在网上到处出现的号称是最大最全的龙虎榜数据。软件的版本也是不断的升级,从以前的DOS版发展到win版,出现了超级龙虎榜,还有以后的个人编写的软件,如创鑫龙虎榜,麻子龙虎榜,道破天机,大席位持仓查询等等。
龙虎榜是什么?怎么使用?这是每一位使用龙虎榜的人所思索的问题。谈谈我个人的理解。龙虎榜就是数据,是一种特别的数据,一种需要分析处理的特别的数据。这种数据基于不同的来源就应该有不同的分析方法。
数据的真实性
数据的真实性是我们可以谈论其他的基础。如果数据是臆造的,那么所有的其他都可以免谈。幸运的是,就我个人的看法来说,这是不可能的。首先这是一个很大的系统工程,每天几万,几十万条的纪录几乎是不可能的。最简单的判断方法是和公开的席位对比,每日涨跌7%以上的前5个席位要公告。拿龙虎榜对比一下,真实性的问题就可以解决了。需要说明的是,有不少的网站卖出的数据由于不是一手数据,或者处于其他的目的,会在数据里作一些手脚,有时由于数据不能及时拿到,甚至任意抽取前一段时间的数据拼凑成新的数据,都会造成数据的失真,。还有一种可能是来源于卫星传输解码的时候的失误造成的,这种可能性很小。
数据的完整性
数据的完整性则是龙虎榜的一个很大的问题。到处都是宣传自己的数据是最全的,最好的,笨人很反感这样说。出于商业目的的宣传和实际是有很大的差距的。数据本身最能说明问题。自从研究龙虎榜以后,前前后后接触过的数据有20几种。研究的文章也有好几篇。从大的方面讲,目前的情况是,我所见过的最好龙虎榜数据也就能覆盖所有成交的50%左右。那些自称能覆盖75%左右的是不切合实际的,至少目前在我没有亲眼看到前是不承认的。关于数据分析的方法,附上笨人5月份写的龙虎榜数据解密系列文章中的部分。这三部分的数据是龙虎榜数据的典型的三个代表。(出于其他的原因,还有部分暂时不能公布出来)。
之一的数据是大家最常能看到的,也是当时最流行的数据。此种数据由于覆盖的范围太小,实际用于研究的意义不大。有一种变种数据,就是加上了股东的姓名。席位只是数字打头的席位。从另一个角度说,该数据也是完整的,每个席位的成交都被记录下来。
之二的数据质量不错,从数据分析来看,数据供应商还能提供更为详细的股东的数据成交明细。该数据也是完整的,每个席位的成交都被记录下来。
之三的数据质量无疑是最好的(这种数据依然不是最好的数据),根据大盘成交的多少,每天的数据大概大小在20-60兆左右,能够覆盖的席位大概在1500-2000左右,覆盖率大概能够达到35-45%,扣除B股的成交。此种数据也就是目前网上很多地方宣传的最全最好的数据,在当时五月份没有哪家网站能够提供和分析。此类数据也有四五种变形,包括增加字段股东姓名,席位名称等等。也有一种简化版,就是将散户的数据滤除,得到的K版数据。优点是只有大的成交,数据比较小,好处理。
数据来源不同,其所能解开的席位也不同。单第三种数据而言,不同的变种之间也由微小的差别,此类席位差别大概也就在100个左右。 |