sa8zhl 发表于 2011-4-2 00:20

11年3月31日、4月1日上海分笔原始数据txt格式

全部上交所的股票、权证分笔数据,有几个要点介绍如下:
       1):有一个excel文件作为例子,其他是txt,分隔符为“;”。
       2):所谓”委买价1 与成交价的差“是指小数后的差,股票是小数后两位,权证是三位。
       3):时间戳,1970/01/01 零点零分零秒至当时的秒数,我在excel里给了个公式可以还原出时间。
       4):建议用小型的数据库来分析全部的数据,access之类的,如果只对一两个股票分析可以用excel。
       5):中间还有一列是累计成交金额的溢出标识符,因我已经修复了可能的溢出,所以不用理会。
       6):sh.txt是纠错记录文件,第一列是股票id,采用大智慧方式。第二列是正确的数据行数,最后一列是0代表数据完整,负数代表多出的行数,正数代表少的行数,(这次数据是全部完整的)。

此类数据之前在坛内貌似没有人发布过,这类原始数据用处还是很大的,但是需要一点数据处理能力,比如很简单的“透视表”之类的,用好了可以方便的了解全盘的大资金动向而不会受制于股票软件。深圳的也有,以后也可以发。另外:我还注意到坛里有逐笔L2D文件,但是我不是l2用户,没法看,在十六进制的格式里我大致研究了一下,170字节分一块,其中有时间戳,分钟单位的,其他的数据看不到也不好猜。以后有机会看到的话,还可以研究一下逐笔数据。
分笔格式如下:

时间戳
最新价
累计成交量
累计成交金额
买入,卖出标识
委买量1
委买量2
委买量3
委买量4
委买量5
委卖量1
委卖量2
委卖量3
委卖量4
委卖量5
委买价1 与成交价的差
买差2
买差3
买差4
买差5
委卖价1 与成交价的差
卖差2
卖差3
卖差4
卖差5
成交量
成交金额
成交笔数

20110331上海分笔数据.zip
20110401sh.zip

[ 本帖最后由 sa8zhl 于 2011-4-2 00:29 编辑 ]
页: [1]
查看完整版本: 11年3月31日、4月1日上海分笔原始数据txt格式