★主要内容我们在今年10月份发布的《衍生品量化择时系列专题之二:螺纹钢指标筛选与大类因子合成研究》报告中,我们分别基于IVX的预测回归方法进行螺纹单因子筛选与基于3PRF降维模型进行因子动态赋权合成两套方法论体系采用基本面与宏观数据信息对螺纹期价进行预测建模。从年至年12月30日的回测结果来看,单因子等权模型年化收益率53%,年化波动率18%,最大回撤-18%,日胜率57%,夏普比率2.82,月度换手率0.79;基于3PRF模型年化收益率37%,年化波动率20%,最大回撤-22%,日胜率54%,夏普比率1.73,月度换手率1.15。今年四季度螺纹钢基本面量化模型在样本外继续走出较佳表现,单因子等权模型最早与年11月5日给出看涨信号,此后一直坚定看涨不变,使得模型基本拿到了本轮上涨的绝大部分收益,净值再创新高,其中10-12月收益率分别为-1%,7%、4%。等权信号构成占比方面,看多因子占比在11月以来显著提升,位于50%-70%左右,而看空因子占比最高也在30%以下,尽管单因子等权结果较为粗糙,但本轮上行短周期中从信号数目的角度可以看出模型多头信号是较为坚定的,相对9-10月份震荡行情中偶尔得到的多头信号一致性更高。3PRF模型下,11月15日开始稳定看涨信号,近期四季度的表现相对单因子等权模型有一定劣势,主要因为10月份震荡行情下换手更高,净值波动较大,而后趋势看多信号较为滞后,10-12月的月度收益率分别为-3%、2%、4%。市场逻辑切换造成回撤、模型失效。1衍生品量化择时之螺纹策略跟踪在今年10月份发布的《衍生品量化择时系列专题之二:螺纹钢指标筛选与大类因子合成研究》报告中,我们分别基于IVX的预测回归方法进行螺纹单因子筛选与基于3PRF降维模型进行因子动态赋权合成两套方法论体系采用基本面与宏观数据信息对螺纹期价进行预测建模。从年至年12月30日的回测结果来看,单因子等权模型年化收益率53%,年化波动率18%,最大回撤-18%,日胜率57%,夏普比率2.82,月度换手率0.79;基于3PRF模型年化收益率37%,年化波动率20%,最大回撤-22%,日胜率54%,夏普比率1.73,月度换手率1.15。今年四季度螺纹钢基本面量化模型在样本外继续走出较佳表现,单因子等权模型最早与年11月5日给出螺纹看涨信号,此后一直坚定看涨不变,使得单因子模型基本拿到了本轮上涨的绝大部分收益,策略净值不断再创新高。3PRF模型下,11月15日开始稳定看涨信号,趋势看多信号相对较为滞后。单因子等权模型表现优于3PRF模型,与我们长期回测结果保持一致,单因子等权模型是基于对螺纹基本面框架中较为重要的个指标(分别具有四种变化形式)中通过IVX预测回归方法筛选得到的20个预测能力最强的指标(或变化形式),单因子等权模型基于固定窗口的筛选得到长期有效的指标,其结果弹性较大,缺点在于可能面临指标失效的风险。3PRF模型基于样本外滚动窗口对螺纹五大类基本面指标分别进行动态筛选与赋权,得到供给、需求、库存、宏观、价格价差共五大综合指标,进行合成预测,该方法不事先对指标加以筛选,完全由模型基于与收益率相关性最大的原则进行滚动窗口的动态降维,其净值结果较为平稳,相对弹性较小,但可能对市场主要逻辑转换的适应性更强。2螺纹期价走势主要影响因子我们在原专题报告中基于螺纹产业链与宏观面,将影响螺纹期价的因子归为供应类(共49个),需求(共25个),库存(共11个),宏观(共62个),价格类(共23个)。经单因子测算,我们选出供给类中高炉开工率、铁矿石日均疏港量、钢坯库存等单因子;需求类中测算具有显著线性预测效果的指标主要是钢材出口这一相对比较冷门的指标;宏观类因子主要是社融、M1等资金面因子以及钢铁行业景气度(PMI)指标;此外则是钢坯库存指标以及基差指标。通过四季度的样本外表现来看,供给类指标中年粗钢产量≤万吨钢厂开工率(历史均值比)指标表现最佳,10月至12月月度收益率分别为3%、7%、3%,年月度胜率%,小钢厂开工率指标表现较好主要因为其更能代表边际供应、对盈利和政策更为敏感。需求指标中我们选出的钢铁出口指标尽管不算是钢材行业最核心指标,但其预测月度胜率较高,其中,中国钢材出口数量(历史均值比)10月至12月月度收益率分别为6%、7%、3%,年全年月度胜率10/12,其背后的逻辑我们在此前的专题报告中也曾给予说明,我们认为背后的原因可能在于相较于大体量的房地产、基建需求,钢材出口更加敏锐的捕捉到需求的边际变化,线性预测模型很难把握地产景气度预期的变化,市场对需求端的预期也往往超越了数据本身而基于一定的推理演绎,因而地产数据本身暂时测算下来并不显著,简单的线性模型对于需求的边际变量效果更好也可以理解,但我们不可否认地产开工等指标的重要性,这也是我们后续模型完善的方向之一。社融指标四季度表现有一定分化,不同分项以及不同变化形式月度收益率涨跌不一,社融企业债券融资(历史均值比变化率)指标相对较优,10月至12月月度收益率分别为-3%、7%、3%,年全年月度胜率9/12。此外活跃合约基差(历史均值比变化率)对四季度行情预测胜率也相对较好,主要由于11月开始的螺纹上涨行情主要是由于在地产开工韧性超预期加暖冬需求旺盛影响下现货供应偏紧库存再创新低,11月底基差最高超元/吨,对期价上行也起到了一定的解释作用。铁矿石港口疏港量指标在历史测算中表现较优,铁矿石疏港量指标可体现刚才补库需求,可更为准确的体现钢厂的实际产出水平,但近期预测效果相对较为一般,其原因可能主要是冬储时期补库目的或更为复杂,对短期期价解释程度不足。3基于IVX回归法的单因子等权模型单因子等权模型最早与年11月5日给出看涨信号,此后一直坚定看涨不变,使得模型基本拿到了本轮上涨的绝大部分收益净值再创新高,其中10-12月收益率分别为-1%,7%、4%。等权信号构成占比方面,看多因子占比在11月以来显著提升,位于50%-70%左右,而看空因子占比最高也在30%以下,尽管单因子等权结果较为粗糙,但本轮上行短周期中从信号数目的角度可以看出模型多头信号是较为坚定的,相对9-10月份震荡行情中偶尔得到的多头信号一致性更高。4基于3PRF的大类因子综合信号3PRF模型下,11月15日开始稳定看涨信号,近期四季度的表现相对单因子等权模型有一定劣势,主要因为10月份震荡行情下换手更高,净值波动较大,而后趋势看多信号较为滞后,10-12月的月度收益率分别为-3%、2%、4%。5附录:量化模型介绍5.1、基于时间序列的预测回归:IVX方法介绍我们基于时间序列上的预测回归来检验单因子有效性,但时间序列回归易面临指标内生性与持续性的问题,使得传统OLS估计有偏。首先,OLS回归假设自变量的外生性,即X与误差项无关,这一假设通常在时间序列回归上不成立;其次,OLS回归的另一个重要假设是X是平稳时间序列,而实际上宏观或其他基本面指标往往具有较强的自相关性,其自回归系数越高说明持续性越强,OLS估计偏差增加。Kostakis()的IVX方法适用于金融时间序列回归中常遇到的平稳序列、协整序列、近似协整序列、近似平稳序列四类,且无需加以区分,基本可以涵盖基本面预测回归中需要的变量特征。首先,基于预测因子的一阶差分得到近似平稳变量,并定义自回归矩阵:最后采用两阶段最小二乘估计法(2SLS)得到工具变量法对的无偏估计,且参数估计渐近地服从混合正态分布,可基于Wald统计量便捷进行参数估计与假设检验,方法运算效率较高。5.2、基于3PRF模型的数据降维与大类因子合成预测问题接下来面临降维方法的选择,降维最常用的方法之一是主成分分析(PCA),其通过找到与原变量方差较大的线性组合进行数据降维,但方差最大的变量组合并不一定是预测能力最强的变量组合。我们本文将基于Kelly()提出的三阶段回归(3PRF,Three-passRegressionFilter)模型进行指标降维,其降维目标是和预测目标变量的协方差最大,有助于在时间序列滚动窗口上动态捕捉对收益率贡献较大的因子及时应对预测过程中常面临的驱动因子失效与逻辑切换,更适用于我们面临的预测问题。模型引入了代理变量(proxyvariable),代理变量可通过经济理论设置或算法迭代生成。共包含三步回归:第一步运行N个独立的时间序列回归,在第一步回归中,预测因子是因变量,代理变量是自变量,估计系数描述了预测因子对代理变量(代理变量与Y相关)的敏感性;第二步回归基于第一步回归得到的系数进行T次独立的截面回归,此回归中预测因子仍然是因变量,第一阶段回归系数为自变量。第一阶段回归将预测因子的横截面分布映射到潜在因子得到各预测因子对预测目标的敏感度系数,进而在每个时点上该系数与预测因子截面回归的斜率()即为我们需要的隐变量,即降维因子值。最后基于第二步所得降维后的预测因子对目标收益率进行时间序列上的预测回归,第三步回归拟合得到最终的预测结果。6市场逻辑切换造成回撤、模型失效。从业资格号:F投资ZEmail:xiaohui.liorientfutures.
转载请注明:http://www.aierlanlan.com/rzfs/9567.html