机器学习用于金融市场预测难在哪?-博客-云栖社区

ml_class_sketch.jpg

· 材料散布

· 小范本

· 难以计算的材料

· 十分复杂

· Markoff方针决策处置使分裂可见

· 推荐信零碎的相像性

· 完毕思惟

朗伯德街已适合机具学会的最早在市场上出售某物经过。。20世纪80年头以后,种族一向在运用ML来获得知识在市场上出售某物控制。。还ML在预测在市场上出售某物产物支持取慢着巨万的成。,但近日的吃水学会对预测金融危机缺勤多大扶助。。还吃水学会和安宁ML技术终极培养了Alexa,Google AssistantGoogle Photos适合可能性,但证券在市场上出售某物缺勤等于使前进。。

, 我将机具学会消耗于现状全球的的金融预测成绩。只管很多的论文拿出吃水学会文字曾经成。,但我依然对产物持疑问姿态。。有些以图案装饰具有上进的精确。。尽管如许,不符合的上涂料频繁地不敷大。。

NLP的改良有助于繁殖定量ST的有效性。这是朗伯德街深远的学会文字的珍贵优势。。

尽量的这些都证明了朗伯德街本质上是不行预测的实际。。有很多事业难以预测。。据我看来加强语气一下形成使烦恼的相当次要事业。:

材料散布:

材料散布成绩至关重要——近乎尽量的的做金融预测的调查论文都疏忽了这点。

我们的可以绝对地金融材料集与图像归类材料集。,为了上进地理解这点。让我们的考虑一下。CIFAR-10材料集.它计入10个开除。每个班的锻炼都有5000个图像。,每个类的试验集有1000个图像。

cifar10.jpg 

我们的怀胎犬类锻炼集合,像素使负担或压迫的散布与犬归类相像。。换就之,狗的抽象将计入在锻炼集和狗在试验中。。这是独身愚昧的解说。:狗的抽象必然有狗。。

因堆积起来金融材料集,这人清楚的的属性缺勤产生。。贴近的你可能性关照的与你所关照的材料使完整多种多样的。。实际上,将机具学会消耗于现状全球的是独身遍及的成绩。。以及确保试验和锻炼材料集具有相像的散布,还一定确保结果却当未来的材料遵照锻炼/证明的散布才在乘积里运用锻炼过的以图案装饰。

只管堆积起来调查人员都谨慎小心的地不引入预测平版印刷INT。,但近乎全世界都不确认材料发行物的成绩。。

正向优化结成是处置这一成绩的可能性选择。。这在雇员中是人所共知的。,但调查人员常常遗忘参考这点。。尽管如许,偶数的是进步的促进优化结成也找错误处置潜在成绩的酏剂——它授给物贴近的材料散布将是何许的。这执意为什么正向优化结成不克不及真正给你诡计高精确度的事业。。

小范本上涂料(Small Sample Sizes

机具学会通常必要一小儿材料集举行预测。。事业人口普查的独身举例,比如,无益和非农进项。每个月获取独身材料点,缺勤十足的历史材料。独身顶点的举例是金融危机——结果却独身材料点。

这使得消耗自动化学会方法奇异的使烦恼。。很多的人终极采取的一种道路是将不太频繁的人口普查材料与绝对频繁的材料兼备起来。比如,你可以把非耕作进项和日常证券进项兼备起来。,而且将材料集的结成提供给以图案装饰。。尽管如许,常常必要举行宽宏大量的的接管。,放晴对以图案装饰优点的害怕。

难以计算的材料Unquantifiable Data

重要的人物可能性会说,我们的的金融史与人类历史亲自迷住相等的的进度。。三灾八难的是,将材料转变为定量材料是使烦恼的。比如,偶数的我们的对GR中产生的事实受胎片面的理解,也很难把它使成为一种可以用于学会的使格式化。。

十分复杂(It’s Quite Complex

杂多的等式迫使价钱在多种多样的的级别上。:

· 高频市和算法市是过了一阵子价钱的次要迫使力(不到1天)

· 以开盘价和金钱或财产的转让都有本身的文字。计入证券和前途我运用的两个资产类别;

当屈尊做某事多日线时,印刷机和谰言是强烈要求。明细的的公司印刷机可总是流出,恕不另行通知。。尽管如许,相当事情的进度是事前晓得的。,比如,公司的工程日记和理财材料;

· 牺牲投入理财周期历年最重要的是制作价钱。。

专家组可以用来仿照多种多样的的级别。,但这异样独身装腔作势的人。。(请在意,专家群是把相等的特点的以图案装饰举行结成的独身很平民的技术—近乎尽量的定量资产设法对付公司都采取。)

Markoff方针决策处置使分裂可见Partially Observable Markov Decision Process

据我看来考虑一下价钱的时期序列。Markoff方针决策处置使分裂可见(POMDP).缺勤人在随便哪一个时分都有使完整的戏剧性的场面。。我不晓得明天会产生是什么,但你仍然要决议。。你获得的知识奇异的少。同时,材料的散布也在变奏。。

我曾尝试将激化学会消耗于财务成绩。。偶数的我理想化了成绩(即遗产和行动圈占),我学不到什么有帮助的的东西。。我花了各自的星期因为什么不任务而举行调试—产物是RL算法必要十足的可预测性。

推荐信零碎的相像性Similarities to Recommender Systems

ML可以消耗于广大的的置于球面内部。。在尽量的这些中,我获得知识推荐信零碎是最贴近金融预测成绩的。相形之下,提议了潜在成绩的财政困难。。带文娱Recsys零碎绝对地,辨析提议了潜在成绩的异议。。

· 两者都都具有绝对较低的精确。.让我们的考虑一下。一下Netflix的举例。Netflix在主枝上显示了反正20个影片调动球员。。因而,因每独身提议,选择影片用户的平均率可能性性以内1/20。。有不到的迹象。,因用户可能性不见随便哪一个东西就距。。异样地,金融时期序列中二元归类成绩的精确性。

· 这两种材料都有很大的噪声。noise.在这两种使适应下,信噪相对高度。金融时期序列从不变的高级的。,因很多的多种多样的的等式侵袭价钱。Recsys材料集计入不变的(PDF)。,因用户阅读通常受到侵袭-用户可以拜访特定的的Amazon,从这种乘积中够支付随便哪一个东西都是缺勤实体的的。noise)了。

· 两个材料集都是季节性的。.亚马逊购置物文字(即乘积分配和分配)。异样一致的安宁Recsys成绩,比如,影片的兴味和YouTube影像的的选择异样DEP。。财务材料异样季节性的,最平民的季节性成绩是理财周期。。

· 两者都都一定处置有形的事情/商品。.亚马逊将新乘积添加到其记入名单内中,扩大某人的权力Netflix赋予头衔的商品清单,每分钟新影像的上传票YouTube。推荐信零碎一定处置这人成绩——怎样推荐信乘积THA。如材料发行物使分裂中提到的,财务材料可以计入使完整多种多样的的DU事情。。

· 两种以图案装饰都一定用多种多样的类型的材料举行锻炼。. YouTube上有相当孤独的功用,比如,末尾N个影像的列表,它还具有陆续的功用。,比如,末尾独身影像的是看长的。。异样,金融材料集可以由高级的频率的价钱和更低的FRE结合。。

完毕意见:

万一你要距一件事,葡萄汁如许:金融时期序列是一种使分裂知识博弈(POMDP),这对人类来说甚至很难。,我们的不葡萄汁希望的事机具和算法勃逾越人类的ABI。。

这些算法罚款地找到了硬编码文字并加以消耗。,这是一把轻剑。,但间或我间或做不到。。它扶助堆积起来复杂文字歧视榜样。。经过无监视学会在金融时期序列中歧视文字的下一阶段依然是独身难以实现预期的结果的梦想。

冠词是人北境邮报爱深褐色-情爱继续存在教员推荐信,Ali Yun Yun社区机构作口译。

原赋予头衔为什么 is machine learning in finance so hard? | Hardik Patel》

作者:Hardik Patel

译者:奥特曼,校核:袁虎。

文字的短文作口译,更明细的的情节,请检查原文

发表评论

电子邮件地址不会被公开。 必填项已用*标注