炒股的人都爱打探消息。收到“情报”后,如何挖掘消息,可谓各人有各法。新股民热衷人际传播的消息:隔壁老王又神秘地把某只股票看高一倍,同事小李又带来某操盘手亲戚的“绝密”信息。但过不了多久他们都会深知,所谓的内幕消息、可靠消息,其实已几经转手威力有限,且背后或还另有深意。
其实,靠消息炒股并不那么神秘。一种基于大数据技术、取材于文本内容的量化投资策略正日渐兴起。
跟着新闻预测指数
同样是看新闻联播寻找投资机会,老股民和金融工程分析师的策略完全不同。
每周,招商证券金融工程分析师夏潇阳都需要出具新闻联播情绪指标的报告:跟进指标30日均线的走势,并对大盘指数多空走势及变化做出预测判断。
通过从新闻联播数据源中抓取相应的热词,并对其进行统计和排行完成初步的数据采样。随后,通过对数据和对应历史时间的股市走势进行长期对比、跟踪,以及对数据的不断扩展和完善,指标加工和模型架构进一步完善。
在招商证券新闻联播情绪指标的运用上,其与大盘指数的关联性更高。而在大盘指数中,沪深300因为拥有对应的股指期货,成为了新闻联播情绪指标择时判断的首选。从2012年10月至今年5月底,情绪指标共发出11次看空信号、11次看多信号。指标同时监控,在信号发出后下个交易日开盘时开仓、至信号再转变期间的收益情况。从战绩上来看,大赚(浮盈5%以上)5次、小赚4次、基本持平5次、小亏4次、大亏(亏损5%以上并已止损)4次。
值得注意的是,情绪指标在今年的盈亏表现更为波动。在3月30日发出看多信号至5月5日信号翻空期间,沪深300指数上涨超过12%,情绪指标择时被记为“大赚”。但随后5月5日发出看空信号、5月28日再次翻多以来,情绪指标择时均为“大亏”,并已止损。而在今年2月,情绪指标发出看空信号后,亦出现“大亏”。
近期两次看空但均大亏,夏潇阳表示,主要是牛市在震荡一段时间后突然急拉,导致新闻联播没能迅速反应,进而使情绪指标出现滞后。
“胜率没有太大意义。如果每次胜但都是小胜,效果就不是特别好。情绪指标的关键,是看能不能赚到大钱。”夏潇阳指出,情绪指标在大涨大跌下表现或不是最佳,但在最近几年的震荡走低时表现稳定。其还强调,情绪指标距离真正择时交易仍有一定差距,投资者可根据自身方式对指标进行再加工。
文中自有黄金屋
金融工程的文本挖掘系统,不仅使用于指数预测、情绪择时,还涉及热门概念题材挖掘、个股走势预测以及事件驱动套利等多方面。
长江证券金融工程部门此前曾推出新闻选股策略。该策略模型先从互联网上进行个股所有信息的归纳整理,利用大数据的处理方法进行文本分析,进而做出利好或利空的判断。下一步,根据新闻在互联网上热度的变化,来判断对应投资主题或标的的市场关注度变化,进而对行情做出预测。
银河证券则借力分析师研报、财经新闻等多种文本载体,开发有基于文本挖掘的量化选股模型。
“炒股投资看重的都是消息,但之前人们只关心数字,忽略了文本的意义。举个很简单的例子,一份研报里文字的占比要远远超过数字的比重。忽略文本内容,很容易遗漏重要的信息。”光大证券原中文云团队核心成员冯剑在接受采访时强调,设计任何系统的最终目标是要部分代替人们做炒股决策过程,关注文本挖掘的投资策略具有独特的竞争力。
模型有效性考验,是文本挖掘需要跨越的另一难点。冯剑指出,从专业观点预计模型的有效性至少要经过牛市、熊市、震荡市的验证,国内文本挖掘研究模型仍待更长时间的验证。
牛人牛股:每日精选,天天赢家