1. Tabular data
不同行间没有顺序,不同列可以是不同的数据类型。(PyTorch中的tensors是homogeneous列同质的,信息在PyTorch中以数字方式存储,典型的是浮点型也有整形。)
wine 数据集:https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
2. Time series
2D to 3D,不同行之间有顺序,每一行代表一个时间点
数据集:https://archive.ics.uci.edu/ml/datasets/bike+sharing+dataset
3. Text
操作的两个层次:字符层次和单词层次
数据集:http://www.gutenberg.org/files/1342/1342-0.txt
4. image
imageio
任意一个图像数据