ec官网产生原因是模型超参数选择不当或模型过度训练说到量化投资,咱们常常会听到“模子”这个词,量化投资中的模子是什么观点?又该怎样明白模子演练中的“过拟合”题目?本期专栏将环绕闭联专业线:何为模子?怎样划分模子与算法?
平常而言,模子(Model)由数据及怎样行使史册数据对他日数据举行预测的流程构成。而算法(Algorithm)指推广一种优化流程,即正在演练数据集上让模子的偏差最小化。
正在模子开采/模子预测、模子演练/预测值兼并等闭键中会将提取到的特质或Alpha因子进一步加工,获得“更优Alpha”。早期量化私募的模子开采以线性模子为主,跟着非线性模子(如机械研习、深度研习模子)占比慢慢晋升,其模子繁杂度、参数比拟传所有计研习模子有了很大晋升,预测后果也更好,量化机构整个投资本领取得较大先进——完全到怎样精美化管理树模子、神经收集模子等也从侧面呈现出各家筹议深度和广度的区别。
量化投资的闭键中所采用的模子大致能够分为三类:因子发掘模子、预测模子和组合优化及营业算法模子。个中预测模子的开展总体而言是从单纯到繁杂、他日还要更繁杂的迭代流程。目前,业内较量通用的预测模子网罗:
一、演练过拟合是机械研习语境下偏狭义颜色的过拟合,指“机械研习模子正在演练集上再现精良,但正在测试集或新数据上再现较差”。爆发情由是模子超参数采用失当或模子过分演练,处分计划凡是是采用合理的交叉验证要领采用模子超参数。
因为大众半机械研习模子并不是特意为金融时期序列开采的,这些模子正在量化修模中的使用须要合时安排。以是将机械研习使用到量化投资界限时,正在模子演练中怎样防范和避免过拟合显得尤为首要,须要归纳斟酌预测精度、模子可解说性、模子鲁棒性和谋划繁杂性等要素。个中金融时期序列预测务必避免行使他日消息,有时更方向于跟着时期的推移将时期序列分成演练、验证和测试块,即举行前向验证,而非模子超参数优化中的交叉验证。
声明:证券时报尽力消息可靠、切实,作品提及实质仅供参考,不组成实际性投资倡议,据此操作危机自担
转载请注明出处:MT4平台下载
本文标题网址:ec官网产生原因是模型超参数选择不当或模型过度训练