根据《Data Science from Scratch》一书的说法,machine learning:creating or using models that are learned from data
为避免模型overfitting or underfitting,一种简单的方法是把现有的数据分两部分,一部分用来训练得到模型,剩下的用来检查模型好不好。
把数据分成两部分
#------------------------------------------- import random def split_data(data,prob): """split data into fractions [prob,1-prob]""" results = [],[] for row in data: results[0 if random.random()<prob else 1].append(row) return results #---------------------------------------------