首页 国际新闻正文
点击上方重视,All in AI我国

猜想商铺晅怎样读出售

咱们都曾与像ARIMA、指数滑润等传统的时刻序列模型做过奋斗,这些模型不是那么直观,而且很难用朴实的核算术语来解说。

鉴于依据时刻的出售数据,直觉上咱们想到的是找出月度趋势、逐年趋势、日趋势、每周峰值等方式。因而,这促进我规划出一种办法,该办法能够分化时刻序列以轻松地找到一切这些参数,而且还施组词使咱们能够甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐以更简略和直观的办法对未来进行猜想。

在这篇文章中,咱们将运用Roseman Store Sales Kaggle Challenge从2013年1月到2015年6月的商铺出售数据,时刻跨度约为2.5年。

表1:商铺XYZ的出售数据

创立流程

咱们的方针是承认(分化)时刻序列的不同组成部分,并将咱们学到的常识转化为一个更简略、更直观的模型。

  1. 数据剖析(EDA)
  2. 功用创立和均匀出售核算
  3. 推导出模型的方程式
  4. 练习模型
  5. 分化时刻序列的不同组成部分
  6. 运用分化的组件创立更简略直观的模型
  7. 模型的权重剖析并运用它来获取其他有用的信息
  8. 定论

1.数据剖析

让咱们开端咱们的旅程吧。咱们有特定日期美邦快递的商铺出售,字段Open表明商铺当天是否正常运作。商铺XYZ周日依然封闭。因而,只要当商铺敞开时,咱们会考虑到这些日子。

商铺出售在该时刻段内的图形可视化。

用于可视化出售的代码

咱们看到每年12月份都有显着的顶峰。除此之外,多年来的下降趋势也是清楚明了的。 2014年和2015年显现出相似的趋势,但与2013年比较有显着下降,一个好的办法甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐应该能够捕捉这些改变。

接下来,咱们将履行EDA以了解一周内的销甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐售改变。

在一周内可视化出售的代码

在一周内的几天内存储的出售额

因为商铺封闭,所以周日没有出售。咱们能够在周六和周一看到显着的顶峰。或许是因为周末的原因,周风雨天地全集免费观看六增大竹爱子加了出售。相同,周日商铺的非功用性或许导致周一出售添加。一个好的办法应该能够捕捉这些改变。

咱们甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐现已看到了12月份的出售顶峰,但让咱们用几个月的相似EDA从头承认咱们的假定,就像咱们对一周内几天的出售所做的那样。

代码能够在几个甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐月内显现出售状况

门店月内出售额

另一件事,咱们能够查询的是一个月内的出售方式。我有一种直觉,这不会是一个强有力的方式,一个月内几个星期的出售应该体现得相似。可是,为什么意外试一下呢?国际充满了惊喜,不是吗?咱们将剖析一周中每天的均匀出售额。

在一个月内显现出售额的代码

一个月内出售数周

在赵得三一个月的第一周和终究一周,出售额继续数天。一个随机的猜想或许是月底的薪酬和更多的人购物。

2.特征创立和均匀出售额

每个日期能够按年、月、周和日仅有标识。以这种办法表明日期的首要原因是找到每月、逐年、每日和每周趋势。

坚持周数的原因一般是承认出售是否跟着月份的发展而黑道悲情3在线阅览添加、削减或许底子不会影响许多,咱们将其称为每周趋势。

此外,咱们将删去商铺坚持封闭的数据点。周日,商铺依然会封闭。

履行功用创立和整理过程后,数据看起来像

表2:数据概述

接下来,咱们将履行年、月、日和周字段的单热编码。一种热编码是分类数据的二进制表明。作为此过程的成果,咱们将得到以下字段。

均匀出售额

咱们将从核算均匀出售额开端。咱们将用均匀出售额表明它,有2.5年的数据,即2013年、2014年和2015年中期。因为2015年全年数据不可用,假如用于均匀出售核算,则或许会添加噪嘉年华思晴大王相片音。咱们仅运用2013年和2014年的出售数据来核算均匀出售额。

avgSales 输出 4825.98

3.推导出模型的方程式

首要主意是找到每月、逐年、每日和每周的趋势。咱们期望附加一个值,称为索引。因而,咱们期望得出每月、逐年、每日和每周趋势指数。咱们假定这些趋势对一天内的出售额负悉数职责,超越咱们上面核算的均匀出售额(avgSales)。

模型方程(1)

咱们有一个抢手编码输入功用。一次只要一个月高或设置为1,一天、一周和一年。输入将处理它。因而,咱们的输入方程被修改为:

模型方程(2)

让咱们看看2014年5月17日模型方程的方式。在这种状况下,年份将是2014年,月份将是5月,周数将是3日,日期将是星期六,其他一切输入都是0,幂为0的系数为1。

模型的方程方式为2014年5月17日

咱们将在两边进行记载,以简化等式,并将其转换为易于运用线性回归的方式。咱们将运用无阻拦回归并选用模型系数的对立数来取得月度、年度、每日和每周趋势指古筝简笔画数。

运用回归的模型方程

4.练习模型

这儿的因变量是ln(Sales)-ln(avgSales),咱们将运用基数2来记载。咱们有一个商铺的出售数据,从2013年1甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐月到2015年6月约为2.5年。咱们不会运用上个月的数据以验证模型的功能。

练习模型

接下来,咱们将选用模型系数的对立数来取得相应的指数。

选用模型系数的对立数

年度指数

每月指数

日间指数

每周指数

5.从回归模型中学习以分化时刻序列

年度趋势

时刻序列的一个重要组成部分是逐年趋势。咱们的模型所取得的年度指数在2013年显着高于2014年和2015年。捕获的年度指数将协助咱们从时刻序列数据中分化年度趋势。让咱们幻想一下成果。

年窥探者2度指数

年度趋势

多年来咱们能够清楚地看到削减的趋势。下降趋势或许有许多原因,如商铺质量下降或竞争对手商铺敞开等。需求进行更深化的剖析才干找到,这将是一个风趣的发现。

每月趋势

时刻序列的另一个重要组成部分是月度趋势,咱们的模型所学的月度指数显然在12月份呈现出更高的趋势。它将协助咱们从时刻序列数据中分化月度趋势。让咱们幻想一下成果。

每月指数

可视化月度趋势

每月趋势

日趋势

在EDA部分,咱们剖析了一周内的出售天刘之冰前妻冯丽萍数。咱们看到周六和周一的出售额较高。模型学习的日期索引能够捕获这些方式。让咱们幻想一下成果。

可视化日常趋佛山三水天气预报势

日趋势

每周趋势

在EDA部分,咱们在一个月的第一周和终究一周看到了一个小峰值。模型学习的每周索引能够捕获这种方式。让咱们幻想一下成果。

每周指数

可视化每周趋势

每周趋势

6.运用分化组件的简略直观模型

咱们将运用上述学习规划一个新的、简略直观的模型,咱们称之为乘法模型。终究的模型方程将是:

模型方程(1)

将依据日期从核算表中运用annual_index,monthly_index,day_index和weekNbr_index。

系数表

运用上述模型对2015年9月21日进行猜想。它将在2015年9月份的第3周进行

Sales = avgSales * Sep_高严便是高岗的儿子index * 3rdWeek_index * 2015_index

= 4825.98 * 0.880 * 0.98 * 0.9425 = 3922.54

Prediction for Dec 31st, 2015接吻揉胸? It falls on Decembe火影之苍天修罗r month, 5th week and year 2015

Sales = avgSales * Dec_coefficient * 5thWeek_coefficient * 2015_index

= 4825.98 * 1.244 * 1.069 * 0.9425 = 6048.74

7.模型的质量剖析,并运用它来获取其他有用的信息

一起,还练习了线性回归模型,其对特征的截距或对数没有任何束缚。咱们称之为Model-1和咱们的乘法模型Model-2。咱们针对50多家商铺的3个月的未见数据测试了这两种模型。

大多数状况下,这两个模型在均方根差错方面体现相同好,具有相似的RMSE值。然而在某些状况下,Model-2是一个显着的赢家,与Model1比较,RMSE较低。一个3u8773或许的原因或许是域常识的供给,avgSales,不允许它过度拟合而且在看不见的数据上体现杰出。

代码比较两个模型的功能

关于大多数状况,两种模型都体现相似

乘法模型(模型-2),商铺39,85和88的显着赢家

乘法模型是胜利者

从Multipplicative模型中获取其他有用信息

一些要害信息和乐趣现实能够从乘法模型中轻松推导出来。比方,假如企业问咱们能说什么,或许咱们怎么比较2014年5月和2014年11月的出售额。咱们需求运用每月、每年、每天和每周索引的价值来答复这些问题。

2014年5月= may_index * 2014_index = 1.俏厨娘不嫁闷将军02 * 0.陈尔敏9879 = 1.007

2014年11月= nov_index * 2014_index = 1.051 * 0.9879 = 1.038

与萨科齐老婆2014年5月比较,2014年11月的出售额添加了多少

(1.038-1.007)/1.007 = 0.0307

因而,2014年11月的季节性比2014年5月多3.07%。咱们能够对数年、数周、数天进行相似的比较,并从分化的猜想模型中取得更明晰的图画。

8.定论

这篇博客文章的首要思维是调整传统模型甲由,通俗易懂学习:以简略直观的办法分化时刻序列,轻音乐纯音乐来分化时刻序列,并创立一个更简略直观的模型。

编译出品


版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。