今天继续MySQL的问题,也是一个常见的问题,就是计算同比和环比问题,然后在此思路的基础上做一个复合增长率的计算。在MySQL8.0之前,同比环比的思路是通过LEFT JOIN去把上一期的数据求出来,然后再进行计算。再MySQL8.0之后,计算方式就很简单了,通过窗口函数可以很简单的解决,所以今天介绍的是窗口函数的解决方案。
首先是数据的准备,数据如下,我们准备了从2020-2022三年每天三个产品的交易数据,这里就只把最关键的几个字段给留出来了↓
环比、同比一般是计算月度的,所以我们第一步需要先把数据转换成月维度的数据,这里只需要用到最基础的SQL操作,GROUP BY一下就行了,SQL语句和结果如下↓
SELECT
product,
DATE_FORMAT( s_date, "%Y-%m" ) AS ym,
SUM( amount ) AS amount,
SUM( gmv ) AS gmv
FROM
orders
GROUP BY
product,ym
这样我们就得到了每个产品每个月的金额和数量了,而且我们这里是按照产品、月份排序的。然后先计算环比,我们就用数量进行举例了,金额是一个道理。思路是我们需要找到当前月份上一个月的销售数量,使用窗口函数的LAG函数,进行一次偏移就行了。就可以得到上月的金额,然后还需要按产品进行分组,也就是OVER里面的PARTION BY 产品,然后通过环比的公式计算一下就行了,SQL语句个结果如下↓
WITH cte AS(
SELECT
product,
DATE_FORMAT( s_date, "%Y-%m" ) AS ym,
SUM( amount ) AS amount,
SUM( gmv ) AS gmv
FROM
orders
GROUP BY
product,ym
ORDER BY
product,ym)
SELECT
product,ym,amount,
LAG(amount,1) OVER(PARTITION BY product ORDER BY ym) AS lm_amount,
CONCAT(ROUND((amount - LAG(amount,1) OVER(PARTITION BY product ORDER BY ym))/
LAG(amount,1) OVER(PARTITION BY product ORDER BY ym),2),"%") AS MoM_amount
FROM
cte
这里简单介绍一下,同比和环比的公式↓
环比 = (本月值 – 上月值)/上月值,或者 本月值/上月值-1
同比 = (本月值 – 上年同期值)/上年同期值,或者 本月值/上年同期值-1
然后就是同比,思路和环比一样的,只是偏移的月份从1变成了12,SQL语句和结果如下↓
WITH cte AS(
SELECT
product,
DATE_FORMAT( s_date, "%Y-%m" ) AS ym,
SUM( amount ) AS amount,
SUM( gmv ) AS gmv
FROM
orders
GROUP BY
product,ym
ORDER BY
product,ym)
SELECT
product,ym,amount,
LAG(amount,12) OVER(PARTITION BY product ORDER BY ym) AS ly_amount,
CONCAT(ROUND((amount - LAG(amount,12) OVER(PARTITION BY product ORDER BY ym))/
LAG(amount,12) OVER(PARTITION BY product ORDER BY ym),2),"%") AS YoY_amount
FROM
cte
最后是一个巩固练习,使用窗口函数计算复合增长率。先介绍一下复合增长率的公式,就是使用本期的数据除以第一期的数据,然后根据间隔开方,再减一,公式如下↓
CAGR = (Ending Value/Beginning Value)^(1/N)-1
所以我们需要计算两个值,第一个是首期的值,第二个是间隔的期数。两个值都是用窗口函数来计算的,首期使用FIRST_VALUE计算,间隔就用ROW_NUMBER。最后使用我们上面的公司就能计算出复合增长率了,SQL语句和结果如下↓
WITH cte2 AS(
WITH cte AS(
SELECT
product,
DATE_FORMAT( s_date, "%Y-%m" ) AS ym,
SUM( amount ) AS amount,
SUM( gmv ) AS gmv
FROM
orders
GROUP BY
product,ym
ORDER BY
product,ym)
SELECT
product,ym,amount,gmv,
FIRST_VALUE(amount) OVER(PARTITION BY product ORDER BY ym) AS first_amount,
ROW_NUMBER() OVER(PARTITION BY product ORDER BY ym) as rn
FROM
cte)
SELECT
product,ym,amount,first_amount,rn,
CONCAT(ROUND((POWER(1.0*amount/first_amount, 1.0/NULLIF(rn-1,0))-1) * 100,2),"%") AS "月均复合增长率"
FROM
cte2
到此,我们几种对比的方式已经都实现了,都是使用月的维度进行演示的,使用日、周、年维度都是相同的思路,只要把顺序排列好就行了。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 engola@qq.com 举报,一经查实,本站将立刻删除。文章链接:https://www.3kemao.com/n/12169.html