时序数据,初印象不太理解,数据分析里怎么把时序数据单独分出来,做了这么多处理,看完教程还是一知半解,还需要多看、多练习!因为重点内容还没有理解、记住,Flag!先写个练习:
【练习一】 某超市牛奶销售额的时间序列数据,请完成下列问题:
(1)销售额出现最大值的是星期几?
df ['日期'].dt.dayofweek [df ['销售额']. idxmax( )]
(2)计算除去春节、国庆、五一节假日的月度销售总额.
holiday = pd.date_range(start='20170501', end='20170503').append(
pd.date_range(start='20171001', end='20171007')).append(
pd.date_range(start='20180215', end='20180221')).append(
pd.date_range(start='20180501', end='20180503')).append(
pd.date_range(start='20181001', end='20181007')).append(
pd.date_range(start='20190204', end='20190224')).append(
pd.date_range(start='20190501', end='20190503')).append(
pd.date_range(start='20191001', end='20191007'))
result = df[~df['日期'].isin(holiday)].set_index('日期').resample('MS').sum()
(3)按季度计算周末(周六和周日)的销量总额.
result = df [df ['日期']. dt. dayofweek.isin([5,6])].set_index('日期').resample('QS').sum( )