郑州股票分析联盟

大数据技术在股票市场非规范行为规制中的运用/《南方金融》2017年第11期

广东金融学会2021-09-10 06:35:01

大数据技术在股票市场非规范行为规制中的运用


文/刘海二


内容摘选自《南方金融》2017年第11期《大数据与股票市场非规范行为规制:一个分析框架》

作者简介:刘海二男,博士,供职于广东省农村信用社联合社。


股票市场非规范行为虽然表现形式多种多样,但万变不离其宗,最终都会反映到股票交易的数量、时间和价格三个变量及其组合上,具体表现为某种异常交易。因此,可以运用大数据技术“顺藤摸瓜”,找到引起异常交易的源头,提前进行预警。此外,运用大数据技术“抓”非规范行为还具有警示和信号显示作用,一旦行为主体预期非规范行为被发现的概率增加,其从事非规范行为的动机和可能性将下降。股票市场非规范行为识别和追踪的分析逻辑见下图。

大数据分析与股票市场非规范行为的识别

运用大数据技术来识别非规范行为,即进行异常检测与诊断,主要有以下几种方法:基于统计学的方法、基于密度的方法、基于距离和邻近度的方法、基于关联的方法、基于聚类的方法、基于模糊集的方法、基于人工神经网络的方法、基于遗传算法或者克隆选择的方法等。各种方法的核心都是运用大数据技术来发现离群点,即不符合一般数据模型的异常点。

异常交易行为主要反映在股票的交易量、交易时间和交易价格三个变量上,这三个变量可能是相互联系的。通常运用大数据技术来分析这三个变量上的离群点。在交易时间方面,异常交易行为的例子包括:某市场主体频繁在利好消息发布前买入,或者在基金公司等机构投资者买入前买入,在机构投资者卖出前卖出,或者在收市或开盘时买入,影响收盘价格或者开盘价格。在交易价格方面,异常交易行为的例子包括:以明显高于或低于市场价格的价格买入或卖出、交易价格偏离历史轨迹、交易价格在很短的时间内快速上升或者下降(价格的“加速度”大)。在交易量方面,异常交易行为的例子包括:交易量突然放大(成交量的“加速度”大),或者在一段时间内连续买入或卖出某只股票等。上述异常交易行为,都可以通过大数据技术加以监测和识别。

大数据分析与股票市场非规范行为的追踪

识别非规范行为相对比较简单,但要对非规范行为进行追踪、发现其来源于哪个具体的机构或个体,难度是比较大的。

通过大数据分析发现某只股票存在异常波动后,需要进一步深入分析,找出异常波动的原因及相关主体,即找到引起股票异常波动的人格化属性。各类账户(如银行账户、证券账户、电话号码、虚拟账户)和网络IP地址具有人格化属性,据此可以找到具体的市场主体。然而股票市场中的许多交易行为都具有一定的隐蔽性,比如化整为零、分散交易、利用他人账户进行交易等,增加了追踪的难度。

账户的核心功能是记账,目前大多的记账方式属于集中式记账(即存在一个中心主体)。账户在一定程度上能够集成个人的所有业务和所有资产、负债,并且是个人金融活动乃至日常生活的出发点和归属,因而账户具有身份认证功能,能够归拢信息。通过对账户的分析,可以发现非规范行为的“蛛丝马迹”,具体分析如下:第一,根据现行有关规定,银行账户必须进行现场开户,证券账户虽然实现了远程开户,但可以通过生物识别技术、云脉身份证识别技术以及交叉验证等方式来确定客户身份。银行账户和证券账户都是实行强制实名制的,并且银行账户、证券账号与某个具象的个人具有一一映射的关系。银行账户包含的主要是资金流,证券账户包含的主要是信息流,可以对银行账号的资金流和证券账号的信息流进行深度挖掘,找到股票市场非规范行为的有关线索。第二,手机号码具有唯一性。从2013年开始,我国已在法律制度和技术层面保证了手机号码实名制的实施。手机号码实现实名制后,可以对用户的通讯记录和通讯信息进行数据挖掘,进而为追踪股票市场的非规范行为提供线索。第三,虚拟账户的实质是账户提供者分配给客户的一个有效代码,而客户所持有的号码可能是手机号、QQ号码、邮箱等这些易记的账号,客户号码与提供者分配的代码相关联。虚拟账户具有两个显著特征:一是客户身份的虚拟性。虚拟账户采取弱实名制,但能够通过分析IP地址、客户行为等方法来强化其人格化属性。二是资金的虚拟性。虚拟资金表现为登记在中介机构的数字,但这些数字只是一种记账符号,不是真实的货币。虚拟资金主要以中介机构的信用作为担保。

在对行为主体的证券账户、银行账户信息进行分析的基础上,通过对行为主体的手机号码、虚拟账户信息进行数据挖掘,可以形成交叉验证,对原有证据进行加强或者提供补充。

行为主体进行股票交易时,一般通过互联网进行。因此,可以追踪发出交易指令的IP地址,找到具象化的行为主体。此外,借助IP地址分析也可以在一定程度上发现行为主体运用他人账户、化整为零进行交易的情况,这是因为行为主体通常会通过同一个IP地址来完成多个账户的不同交易。

大数据技术在市场主体行为分析中的运用

从事股票市场非规范行为的市场主体通常会采用各种手段隐蔽自己的行为和身份,因此,需要在账户分析的基础上,运用大数据技术对交易行为进行复盘,对市场主体进行“画像”。在对非规范行为进行分析时,首先要对市场主体进行聚类,由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象相似度很高。聚类分析方法主要有K-均值、层次聚类、神经网络聚类、模糊C-均值、高斯混合聚类等。市场主体的聚类属性主要是社交关系,比如同学圈、同事圈、朋友圈及其衍生关系。市场主体的关联交易、隐蔽行为主要通过上述社交关系来完成。

在聚类分析的基础上,需要透过市场主体的行动轨迹,对市场主体进行“画像”。行动轨迹包含的动点信息主要包括:市场主体的股票交易行为信息,手机通讯信息,自行车、汽车、火车、飞机等交通工具使用信息,酒店住宿信息,与个人及机构往来密切的人员信息等。通过分析市场主体的人格化属性特征以及诸多动点的信息,可以初步勾画出市场主体的基本轮廓,还原交易过程及其细节,进而找到股票市场非规范行为的源头,并采取相应监管措施。

(编辑:李锋森)

转载、引用请注明来源于《南方金融》和广东金融学会微信公众号

注:内容来自广东金融学会,版权归原创所有。

广东金融学会


点击【阅读原文】,从中国知网下载全文