> 娱乐
产品销售时间序列(品销售的时间序列可以分为几个组成部分)
导语:使用深度Q-学习的销售时间序列分析
文章描述了深度Q-learning模型在销售时间序列分析问题上的应用。与监督机器学习相比,Q-learning是一种使用历史数据的被动学习,它的目标是通过最优的行动序列实现奖励的最大化,工作中考虑了无模型的Q-learning方法,用于优化定价策略和供需问题。该研究的主要思想是表明,在时间序列分析中使用深度Q-learning方法,当学习代理互动的环境可以使用参数模型建模时,以及在使用基于历史数据的模型时,可以通过最大化奖励函数来优化行动序列。在定价优化案例研究中,环境是用销售对额外价格的依赖性和随机模拟的需求来建模的。在定价优化案例研究中,环境是用销售对额外价格的依赖性和随机模拟的需求来建模的。在供需案例研究中,建议使用历史需求时间序列进行环境建模,代理状态由促销活动、以前的需求值和每周的季节性特征表示。获得的结果表明,使用深度Q-learning,我们可以优化价格优化和供需问题的决策过程。使用参数化模型和历史数据的环境建模可以用于学习代理的冷启动。在接下来的步骤中,在冷启动之后,经过训练的代理可以在真实的商业环境中使用。
《Sales Time Series Analytics Using Deep Q-Learning》
论文地址:http://arxiv.org/abs/2201.02058v1
本文内容由小滢整理编辑!