网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

tungsten-sort有哪些优点

这篇文章主要介绍“tungsten-sort有哪些优点”,在日常操作中,相信很多人在tungsten-sort有哪些优点问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”tungsten-sort有哪些优点”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

创新互联是一家专业提供珲春企业网站建设,专注与做网站、网站设计、HTML5、小程序制作等业务。10年已为珲春众多企业、政府机构等服务。创新互联专业网站建设公司优惠进行中。

spark实现了多种shuffle方法,通过 spark.shuffle.manager来确定。暂时总共有三种:hash shuffle、sort shuffle和tungsten-sort shuffle,从1.2.0开始默认为sort shuffle。

spark在1.4以后可以通过(spark.shuffle.manager = tungsten-sort)开启Tungsten-sort shuffle。如果Tungsten-sort 发现自己无法处理,则会自动使用 Sort Based Shuffle进行处理。Tungsten-sort优化点主要有:

  • 直接在serialized binary data上操作,不需要反序列化,使用unsafe内存copy函数直接copy数据。

  • 提供cache-efficient sorter ShuffleExternalSorter 排序压缩记录指针和partition ids,使用一个8bytes的指针,把排序转化成了一个指针数组的排序。

  • spilling的时候不需要反序列化和序列化

  • spill的merge过程也无需反序列化即可完成,但需要shuffle.unsafe.fastMergeEnabled的支持

当且仅当下面条件都满足时,才会使用新的Shuffle方式:

  • Shuffle dependency 不能带有aggregation 或者输出需要排序

  • Shuffle 的序列化器需要是 KryoSerializer 或者 Spark SQL's 自定义的一些序列化方式.* > Shuffle 文件的数量不能大于 16777216

  • 序列化时,单条记录不能大于 128 MB

tungsten-sort有哪些优点

##优点 很多性能的优化

##缺点

  1. 不可以在mapper端排序

  2. 不稳定

  3. 没有提供off-heap排序缓存

到此,关于“tungsten-sort有哪些优点”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!


网页题目:tungsten-sort有哪些优点
文章源于:http://bjjierui.cn/article/ihcedo.html

其他资讯