三、操纵识别模型判定原理 (一)非线性映射 非线性映射是一种几何降维的数学方法,将高维度变量有效地综合为低维变量,并最大限度的保证了原变量信息。非线性映射方法应用于操纵识别具有两项优势,首先非映射方法能将高维度信息转换成为低纬度图像,使结果更加形象、直观,便于监管者判断、分析;其次,非线性映射方法只针对数据而不考虑类别,极大地保证了结果的有效性。 假设有n个样本,每个样本包含p个观测指标,则每个样本点就相当于空间中的点,(i=1,2,…,n)。将空间中的n个样本点映射到低维空间中,即。映射原理如下式所示 为达到上述目的,需引入非线性映射由高维变换到低维的约束条件: 其中,nf是标准化因子,称为权重系数,为原来空间中n个样本点之间的距离,为新空间中n个样本点之间的距离,K的含义是使原空间距离与新空间距离之差平方和达到最小时来求得新空间点的几何构形。 (二)映射精度 为说明经过非线性映射的二维数据是否能够很好的表现原多维数据结构,本研究还引入了压力方程以判别映射精度。 其中,是原高维空间中点i到点j的距离,是映射后二维空间中点i到点j的距离,是映射是数据变形因子。S的取值范围是0到1,二维空间还原程度越高,压力方程数值越小,最理想状态下,S=0。压力方程可以很好的反映映射后二维空间能在多大程度上还原原高维空间的数据结构,其本质就是比较i点到j点原始值间距离与i点到j点映射值间距离。在后文的实证研究中以百分数形式表示。当S≥20%,表示映射精度较差;10%≤S﹤20%,表示映射精度一般S﹤10%;,表示映射精度很好。 (三)阀值选定 将品种历史交易日操纵指标映射到二维空间之后,找出其中到其他各点距离之和均值最小点作为中心点,权且称之为距离极小值点,以距离和的均值来确定操纵风险判定阀值。 假设品种历史交易日操纵指标的点群中有m个样本 ,其中,通过式(1)~式(4)映射为新空间下的交易日,其中 ,则距离极小值Ymin=(y1min,y2min),满足条件: 其中,是二维空间中Yi到Yi的欧式距离。即: 在历史交易的离差极小点确定后,计算极小点到所有其他点距离的均值: 则设定判定阀值为,是置信区间半径,比如,取置信度为95%,,取置信度99%,。本文的实证分析中选择置信区间95%,即。 (四)操纵识别流程 操纵识别流程如图1所示。为保证模型能够实时监控市场操纵情况,要求模型能够自学习并不断调整判定阀值。首先,整理出待检验合约同品种、同月合约最近两年的历史操纵指标数据,如本文以郑棉2010年9月合约为检验对象,因此需要2009年和2008年9月合约的历史操纵识别指标数据。 图1操纵风险判定模型原理示意图 整理待判合约同品种同月份合约前两年历史数据的操纵指标,并进行非线性映射。在此基础上,根据映射值找出距离极小值点,此点到其他各交易日数据点的平均距离,确定阀值为,是置信区间半径。由于本文的阀值计算中的交易数据是不断推进的,因此在实际监管应用中,阀值是具有自学习能力而且时变的。 对欲判定合约所有交易日进行同样处理,找到距离极小值点Ymin。此点到合约中K交易日数据点的距离为。通过与的比较,依照图2判断K日是否发生操纵。 具体步骤如下: (1)根据式(2)~(5)对品种各交易日数据进行映射变换,交易日u在新空间下的坐标为。 (2)根据式(2)~(5)对待判合约各交易日数据进行映射变换,交易日s在新空间下的坐标为。 (3)根据式(8)、(9),找出品种距离极小值点,并根据式(10)确定品种的距离极小值点到其他点的距离均值,阀值即为。是置信区间半径,本文取置信度为95%,。 (4)根据式(8)、(9)确定待判合约的距离极小值点。 (5)根据式(10)确定待判合约中某交易日k数据到此合约距离极小值点的距离,有。 (6)将与进行比较,判定其在当前置信水平下是否有可能存在操纵行为,如图2所示。 图2操纵判别标准 四、数据 中国棉花消费量占世界棉花产量45%左右,郑州商品交易所也是世界最重要的棉花期货交易所之一。受我国棉花生产周期影响,一般新年度棉花会在10月份左右上市,而上一年度的棉花到9月时库存已经不多。这就使每年的9月合约市场投机氛围浓厚,发生市场操纵的可能性增大。棉花9月合约近年来被传发生了多起操纵事件,典型如被《证券时报》等多家媒体报道的合约CF1009操纵事件。一般情况下,由于套期保值用户向远期合约移仓,棉花9月合约持仓量在交割期四月下旬开始逐渐减少。但是,CF1009合约七月持仓量仍然处于较高水平,多头操纵逐渐形成。针对这种情况,郑州商品交易所于2010年7月21日发布了交易风险提示函以避免操纵的发生,但操纵仍然给很多投资者带来了巨大损失。因此,本研究选取棉花九月合约作为检验样本。九月合约数据共729个,包括2010年CF1009合约、2009年CF0909合约和2008年CF0809合约各243个。数据来源于郑州商品交易所。使用的统计软件为Matlab2007a。 来源:上海期货交易所
|