网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

第15课:RDD创建内幕彻底解密

本节课主要内容:

创新互联公司-专业网站定制、快速模板网站建设、高性价比乌兰察布网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式乌兰察布网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖乌兰察布地区。费用合理售后完善,十载实体公司更值得信赖。

    1、RDD创建的几种方式

    2、RDD创建实战

    3、RDD内幕


RDD创建有很多种方式,以下几种创建RDD的方式:

     1、使用程序中的集合创建RDD,实际意义用于测试用;

     2、使用本地文件系统创建RDD,测试大量数据的文件;

     3、使用HDFS创建RDD,最常用的方式;

     4、基于DB创建RDD;

     5、基于NOSQL创建RDD,例如HBase;

     6、基于S3创建RDD;

     7、基于数据源创建RDD;


RDD实战:

//通过集合方式创建RDD

val conf = new SparkConf().setAppName("RDDDemo").setMaster("local")
val sc = new SparkContext(conf)
//创建RDD
val rdd = sc.parallelize(0 to 100)
//1+2=3 3+3 = 6 6+4 = 10 ....
val sum = rdd.reduce(_ + _)
println(sum)

//通过HDFS上文件创建RDD

val conf = new SparkConf().setAppName("RDDDemo").setMaster("local")
val sc = new SparkContext(conf)
//创建RDD
val lines = sc.textFile("hdfs://Master:9000/data/README.md")
val words = lines.flatMap(line => line.split(" ")).map(line => (line, 1))
val wordCount = words.reduceByKey(_ + _)
wordCount.collect().foreach(println)

备注:

资料来源于:DT_大数据梦工厂

更多私密内容,请关注微信公众号:DT_Spark

如果您对大数据Spark感兴趣,可以免费听由王家林老师每天晚上20:00开设的Spark永久免费公开课,地址YY房间号:68917580


文章名称:第15课:RDD创建内幕彻底解密
当前地址:http://bjjierui.cn/article/jiices.html

其他资讯