网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

Sparksql的批处理物理计划BatchScanExec有什么用

这篇文章将为大家详细讲解有关Spark sql的批处理物理计划BatchScanExec有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

成都创新互联公司专注于武胜企业网站建设,自适应网站建设,成都商城网站开发。武胜网站建设公司,为武胜等地区提供建站服务。全流程按需定制,专业设计,全程项目跟踪,成都创新互联公司专业和态度为您提供的服务

BatchScanExec是batch类的物理计划,对应的逻辑计划是DataSourceV2Relation,是Datasource。

它的入参是Scan类,Scan类有两个重要方法,一个获取分区列表信息;另一个方法获取读取器工厂。

override lazy val partitions: Seq[InputPartition] = batch.planInputPartitions()
  override lazy val readerFactory: PartitionReaderFactory = batch.createReaderFactory()
  override lazy val inputRDD: RDD[InternalRow] = {
    new DataSourceRDD(sparkContext, partitions, readerFactory, supportsColumnar)
  }

planInputPartitions方法获取分区列表;createReaderFactory获取分区读取者工厂,这两者决定一个DataSourceRDD来作为inputRDD对象。

对于传统的DataSource类,只要实现对应数据源的Scan子类就可以使用了。

而StreamingDataSourceV2Relation对应的物理计划是MicroBatchScanExec和ContinuousScanExec,这时候Scan就不用了,而使用MicroBatchStream和ContinuousStream两个流的定义类。

关于“Spark sql的批处理物理计划BatchScanExec有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。


分享名称:Sparksql的批处理物理计划BatchScanExec有什么用
URL网址:http://bjjierui.cn/article/jdpjes.html

其他资讯