分类:
所有的分类器都继承自抽象类AbstractClassifier而AbstractClassifier继承自接口Classifier。集成关系如下图所示:
而类Classifier中主要包含以下接口:
public abstract void buildClassifier(Instances data) throws Exception;
该方法主要用于根据样本数据data训练出分类器;
public double classifyInstance(Instance instance) throws Exception;
该方法是对样本instance进行分类并返回最有可能的类;
public double[] distributionForInstance(Instance instance) throws Exception;
对样本instance进行分类,如果分类成功则返回的数组值包含该类别,否则数组元素全为0;
所有的classifier必须实现classifyInstance或distributionForInstance。
聚类:
所有的聚类算法都集成自AbstractClusterer,而AbstractClusterer继承自接口Clusterer,主要调用关系如下:
Clusterer主要实现的接口如下:
void buildClusterer(Instances data) throws Exception;
根据样本数据训练聚类算法;
int clusterInstance(Instance instance) throws Exception;
public double[] distributionForInstance(Instance instance) throws Exception;
为实例归类;
int numberOfClusters() throws Exception;
返回聚类个数;
同样所有的聚类算法都必须实现clusterInstance或distributionForInstance。
规则挖掘:
关联规则主要实现的算法有Apriori,FPgrowth等,
类关系如下:
Associator中主要实现
void buildAssociations(Instances data) throws Exception;
该方法主要用于生成规则生成器。