【KDD2020论文阅读总结】鸡行为分类
【链接】https://dl.acm.org/doi/pdf/10.1145/3394486.3403385
【Title】Fitbit for Chickens? Time Series Data Mining Can Increase the Productivity of Poultry Farms
【应用】时间序列分类
【领域】数据挖掘,家禽养殖
【文章要点】
本文来自时间序列的研发大户UCR(加州大学河滨分校)
文章也没特别的算法上的亮点,但是鸡行为这个方向研究的人比较少,所以这篇论文主要是介绍技术背景、数据集以及常规的算法分析。
数据采集:鸡身上的加速器传感器,该传感器可以检测到xyz三轴的分量,采集频率100Hz

采集工作流:

3个类别:喂食/进食,整理羽毛,沙浴。

分类器:最近邻分类——对于时间序列T的分类时根据给定的查询序列Q,在T中找相似的序列。
距离衡量:欧拉距离(ED)或 Dynamic Time Warping(DTW)
特征:shape 和 feature (如,方差,complecity,功率谱密度等)(同一个类别的时间序列长度可能不一样,且相差一个数量级)

complecity特征:1) CID: an efficient complexity-invariant distance for time series [14] 2)Matrix Profile V: A Generic Technique to
Incorporate Domain Knowledge into Motif Discovery” [16]
步骤:
1) 人工标注并提出备选特征
2)计算特征向量
3)向量匹配与学习阈值
std(T,100)是指滑动窗口为100(1s)的计算标准差




实验结果:

应用:区分健康的鸡和生病的鸡
直方图


