计算人口平均年龄 - 走看看

zoukankan html css js c++ java

计算人口平均年龄

创建实验数据:

from pyspark import SparkContext

import random

OutputFile = "file:///usr/local/spark/mycode/exercise/people"

sc = SparkContext('local','createPeopleAgeData')

peopleAge = []

for i in range(1,1001):

rand = random.randint(1,100)

peopleAge.append(str(i)+" "+str(rand))

RDD = sc.parallelize(peopleAge)

RDD.saveAsTextFile(OutputFile)

from pyspark import SparkContext

#配置sc

sc = SparkContext('local','CountAverAge')

#创建RDD 读入数据

RDD = sc.textFile("file:///usr/local/spark/mycode/exercise/peopleAge.txt")

#得到数据总条数

Count =RDD.count()

#对数据进行切割，只取年龄部分，然后把年龄字符串转成Int，然后用reduce函数累加

Average = RDD.map(lambda line : line.split(" ")[1]).map(lambda a: int(a)).reduce(lambda a,b :(a+b))

print(Count)

print(Average)

print("平均年龄为:{0}".format(Average / Count))

查看全文

相关阅读:
程序员学习新技术的10个建议
 ES6 let和const总结归纳
 ES6 对象扩展运算符 res运算符
 ES6 变量的解构赋值
 ES6的开发环境搭建
 vue给同一元素绑定单击click和双击事件dblclick，执行不同逻辑
 "双非"应届生校招如何获得大厂青睐?（内附前端大厂面经+技术岗超全求职攻略）
移动端300ms与点透总结
 Web移动端适配总结
 正则表达式总结

原文地址：https://www.cnblogs.com/SoftwareBuilding/p/9473533.html

Copyright © 2011-2022 走看看