zoukankan      html  css  js  c++  java
  • spark Mllib基本功系列编程入门之 SVM实现分类

    话不多说。直接上代码咯。欢迎交流。

    /**
    * Created by whuscalaman on 1/7/16.
    */
    import org.apache.spark.{SparkConf, SparkContext}
    import org.apache.spark.mllib.classification.SVMWithSGD
    import org.apache.spark.mllib.linalg.Vectors
    import org.apache.spark.mllib.regression.LabeledPoint

    object svmpredict {
    def main(args: Array[String]) {

    val conf = new SparkConf().setMaster("local[1]").setAppName("svmpredict")
    val sc = new SparkContext(conf)

    val data = sc.textFile("file:///root/spark-1.5.2-bin-hadoop2.6/data/mllib/sample_svm_data.txt")

    val parsedData = data.map { line =>
    val parts = line.split(" ")
    // LabeledPoint(parts(0).toDouble,parts.tail.map(x=>x.toDouble).toArray)
    LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).split(" ").map(x => x.toDouble)))
    }

    val numIterations = 20
    val model = SVMWithSGD.train(parsedData, numIterations)

    val labelAndPreds = parsedData.map { point =>
    val prediction = model.predict(point.features)
    (point.label, prediction)

    }
    val trainErr = labelAndPreds.filter(r => r._1 != r._2).count.toDouble / parsedData.count
    println("Training Error = " + trainErr)
    }
    }

    我的代码都 是在IDEA中写的。以本地化运行模式运行通过的,我的spark版本是最新的spark1.5

  • 相关阅读:
    【核心算法1】双指针问题
    关于博客园主题
    正交工具allpairs使用
    postman设置变量
    WebDriver驱动下载地址
    MySQL语法基础
    异或
    测试——pytest库上手
    and 和 or 的语句运算
    爬虫——Scrapy中选择器的基本使用(转)
  • 原文地址:https://www.cnblogs.com/whu-zeng/p/5116649.html
Copyright © 2011-2022 走看看