前言:投资之道是一种魔术吗?这种魔术是怎么变的?找寻可投资的标的是不是一种特征模式识别问题?我们希望通过标签系统来尝试解决这种魔术问题。这是文因互联投研系统连载文章系列之三,欢迎大家阅读!
过往系列文章请查看:
(一)《知识的共同体|重新定义投研系统》
(二)《自动化报告| 信息过载时代的效率助手》
投资人的魔术
作为想要服务于新三板人士投资研究的创业者,文因互联一直在积极和一线投资从业人士进行对话。从他们口中,我们初窥投研人士的一些日常,还有一些他们对研究和投资的看法。从反馈中,我们发现大部分人对现有的金融终端和券商研报都有着或多或少的抱怨:数据or研报同质、浅薄,质量参差不齐....那么,他们的诉求在哪儿呢?——想要更多、更好、更深层的数据和内容,于是他们提出来很多在我们看来是“魔术”才能做到的对于投研终端的功能需求:市场空间、市场竞争结构、行业趋势、商业模式和核心竞争力...
注:在文因互联的内部,我们把人们对机器短期难以实现的过高期望需求称之为“魔术”,如前文提到的这些一个个的词汇。这些指望机器完成的“魔术”是连人们自身都不一定能够做好的判断。
我们的一名典型用户曾经说过:数据只是一方面,具体的投资还是得仰仗自己的逻辑和判断。这句话的弦外之音就是:浅层次的数据价值有限,影响我的做投资决策的还是我的经验和模式。而这些经验和模式就是上文中他们说的那一个个词汇所代表的含义和好坏,同时又折射出基于他个人或机构组织的价值观。作为想要服务于这些投资人的创业者,我们就这样陷入了两难的境地。如果按照市面上传统的金融终端——数据工具思路做下去,很难再做的更加出色。但是前面我们已经得出了浅层次的数据整合本身价值不高的结论,我们到底怎样才能更好的服务于投资人呢?破局点究竟在哪,作为一个技术基因深厚的geek团队,看来只能试试挑战去变魔术了。那么,存在于投资人脑海里的逻辑和判断究竟是怎样的魔术呢?
魔术是怎么变的
经过我们的投资人用户的不吝赐教,我们终于对投资的魔术有了初步的认识,我们了解了投资人如何从行业研究到最后锁定具体几家公司的过程和阶段:
投前研究以项目任务(主题)驱动,在进入陌生领域之后,首先要经历一个自我科普阶段,这个阶段是最大的一个特征就是,信息越多越好,所有的信息都是可贵的,分析师大量输入研报、资讯等信息,形成行业认知框架。
进入研究分析阶段,开始以数据梳理和用财务信息验正为主,并辅助以人为主的经验借鉴产生行业更深思考。
在交易决定阶段是以投资经理为主的,这是另外一套交易思维模式,但是不管是否要投都要进行追踪。
在后续跟踪阶段投入精力变少浏览下研报以及新闻即可,以风险管理为主,要关注到任何能引起质变的蛛丝马迹。
通过自我科普和研究分析这两个阶段,投资人/分析师基于这些知识得出可投资的标的符合的一系列特征标签,而这些特征标签在漏斗模型中就是条件控制,最终通过层层的筛滤从一大堆公司中得到了少量符合他投资模型的公司,随后再进行实地访谈等之类的数据之外调研工作。
那么问题来了,说了那么多投资的方法论,作为技术公司的我们该如何在这些投研过程为用户创造价值呢?
魔术的工程性问题——聪明人总在寻找结构、模式、规律
对于大自然来说,星辰运转、潮汐涌动,花开花落都会遵从某种结构、模式、规律,而人类世界亦是如此。我们寻找和证明各种公式、定理,而无序无规律可循对我们来说则是复杂和混沌。金融是个典型的甚为喧嚣的市场,政策利好、内幕消息、基本面变动、交易行情诸如此类的信息让大部分投资者晕头转向,这种充满噪声的运作方式使金融从业者人深陷在在繁复的信息涡流中不能自拔。如股票市场中仅仅两种变量——成交量和价格形成的K线图,就成为了各种各样技术分析流派的判断基础。且放下对股票技术分析的褒贬不说,类似这样的对复杂事物所总结的结构、模式、规律,既掌握这种对世界纷复万象的抽象能力则是理解复杂市场探寻投资真相的秘密武器。
拿创新发明来说,一种使大部分人的观念受到束缚的看法是发明创造性是天生的,依赖于天才们的惊才绝艳。而前苏联发明家协会主席根里奇·阿奇舒勒却反对这个观点,他坚信发明问题的原理一定是客观存在的,如果掌握了这些原理,不仅可以提高发明的效率缩短发明的周期,也能使发明问题的解决更具有可预见性。阿奇舒勒在14岁时就获得了他一个专利证书,在他为苏联海军效力的时候,因他的发明才能而成为专利评审官。于是他从1946年开始,花费1500人/年,在研究了世界各网250万份高水平专利的基础上,提出的一套具有完整体系的发明问题解决理论和方法,而这套理论就是一直盛行不衰的“TRIZ”理论(俄文“发明问题解决理论”首字母缩写)。
回到我们的投资上来,我们把在上个环节中了解到研究与交易通过抽象总结归纳成以下工作流。通过搜索和百科进行的大量信息输入形成认知框架,总结这其间的结构、模式和规律进行特征提取,将提取的特征标签化,利用条件筛选进行结果输出和目标锁定,最后用输出的结果进行数据的回测,回到第一步中的认知框和模型的修正,从而进行再一次的循环。将这些工作流的上的信息源替换为金融属性,那么我们就可以得到关于的投资的洞察,那么能承载这一使命的魔术产品究竟是什么样子的呢?
未来的魔术产品形态
北大的经济学教授汪丁丁说过:现代数学的定义是“pattern recognition”,学的是模式识别的学问。如果把我们的对世界万物的认知也像数学这样都进行高度抽象的话,那么投资问题也可以称之为一个模式识别问题。其实现实中很多问题都是模式识别问题,摆出任意物体让你猜测它到底是什么,而通用的做法就是用穷举的方式描述这个东西的特征信息直到行为主体识别出为止。比如股票市场里的技术分析,就是识别出各种可以成为买入信号的股票K线图技术形态。
那么判断一个公司或者项目究竟是否值得投资,也是一个穷举特征信息并加以识别判断的问题。比如我们在描述苹果的时候,“红色的”、“圆形的”这种是特征信息标签是有价值的,而“我今天刚吃了的”就不是价值信息,因为这种特征信息对于苹果来说不是独一无二的,对苹果的识别毫无用处。
在文因互联的投研系统中,我们给机器准备的企业实体、人物图谱、基金实体、财务模型、产品模型、物流,地域,政策模型、生产模型、海量的信息数据,我们基于过往的投资模型和策略,把这些价值特征信息转换一个个特征标签。通过为这些企业打标签,那么就完成了过滤无效信息,提取关键价值特征信息的工作。比如对于“重资产”这种基于财务信息可以计算的简单标签,那么你可以先定义这个标签的算法,再让机器自动去覆盖符合这一特征所有公司,而不是通过查看财务报表根据财务公式去一家家计算找寻重资产的公司,我们相信通过这样的方式可以减少投资的认知负荷,提高他们的工作效率。
此外我们还认为投资也要借助互联网的思维,遵循一种可复现、可追溯、可迭代的方式,如互联网在产品运营上越来越重视数据化运营的思路。传统的运营方式太依赖经验灵感和个人才能,而数据化运营,则是可以高效的量产可控的,更明确更直观,可能未必有部分天才的惊鸿一瞥的奇迹爆发,但总体可以维持在一个稳定较高的水准,而且模式可以复制可以再现。无法用标准化去描述和总结的客观规律,总隐藏在行业大牛的脑海里,一些成功的案例虽然我们可以事后复盘,但是很难在同等条件下重现,而通过少数案例总结出来的规律一方面有事后性偏见,另一方面也容易这些经验知识流于“玄学”,成为知识不对称领域少数人对多数人收取的智商税。
在文因互联的投研系统中,我们借助机器学习和自然语言处理等人工智能技术,我们将海量数据生成的有价值的特征信息打成一个个标签,那么对于可投资公司的一个模式识别,就是寻找符合适合投资理想中的完美公司所具有的特征集合(也就是标签组),就如阿奇舒勒通过花费巨大人力学习250万份高质量发明专利总结出来的"triz"理论,而现在我们有了人工智能可以辅助我们做这些海量信息的模式总结工作。虽然理想的可投资公司也许并不存在,我们要做的就是通过不断回测和修正去找寻我们在现有信息下的最大胜率的投资模式,而这整个过程则是有迹可循的,可复用可修正迭代的。这是传统金融终端无法帮你做到而文因互联希望帮助你做到的事。
PS:这是基于本人的工作单位发表的文章,知识产权属于文因互联。