Timsort工作原理-白红宇

Timsort工作原理

阅读量：7041 次

发布时间：2019-06-28

本文共 4696 字，大约阅读时间需要 15 分钟。

Timsort是spark中用作外部排序的机制。一个典型的应用是在spark sql中用来做Order操作的实现。Order时候将行记录插入到ExternalSorter中，ExternalSorter用timsort排序数组，返回排序后的Iterator。

spark sql的物理计划中，排序Sort属于agg相关的聚合操作。相关的类有：SortAggregateExec、SortBasedAggregationIterator、SortExec等。

1. SortAggregateExec

排序后数据的聚合操作。构造方法和入参如下：

case class SortAggregateExec(

requiredChildDistributionExpressions: Option[Seq[Expression]],

groupingExpressions: Seq[NamedExpression],

aggregateExpressions: Seq[AggregateExpression],

aggregateAttributes: Seq[Attribute],

initialInputBufferOffset: Int,

resultExpressions: Seq[NamedExpression],

child: SparkPlan)

extends UnaryExecNode

物理执行通过doExecute(): RDD[InternalRow]方法。主要代码：

val outputIter = new SortBasedAggregationIterator(

groupingExpressions,

child.output,

iter,

aggregateExpressions,

aggregateAttributes,

initialInputBufferOffset,

resultExpressions,

(expressions, inputSchema) =>

newMutableProjection(expressions, inputSchema, subexpressionEliminationEnabled),

numOutputRows)

if (!hasInput && groupingExpressions.isEmpty) {

// There is no input and there is no grouping expressions.

// We need to output a single row as the output.

numOutputRows += 1

Iterator[UnsafeRow](outputIter.outputForEmptyGroupingKeyWithoutInput())

} else {

outputIter

}

通过构造SortBasedAggregationIterator迭代器来生成聚合后的数据迭代。将聚合前的数据迭代器作为入参传入SortBasedAggregationIterator中。

1. SortExec

真正执行外部排序的类。定义：

case class SortExec(

sortOrder: Seq[SortOrder],

global: Boolean,

child: SparkPlan,

testSpillFrequency: Int = 0)

extends UnaryExecNode with CodegenSupport

child不用说自然是子执行计划。

testSpillFrequency表示是否阶段性的spill数据到磁盘，Int型表示每隔多少条数据就spill到磁盘。一般在测试环境下使用。

sortOrder是排序的字段属性。

global表示是否全局排序，如果全局排序的话一般需要先将各分区的数据打散shuffle，然后再执行排序。

1. 1. 关键方法createSorter

def createSorter(): UnsafeExternalRowSorter

生成外部排序类，然后对原始数据的每行数据，插入到外部排序类，最后外部排序类返回排序后的迭代器Iterator。

protected override def doExecute(): RDD[InternalRow] = {

val peakMemory = longMetric("peakMemory")

val spillSize = longMetric("spillSize")

val sortTime = longMetric("sortTime")

child.execute().mapPartitionsInternal { iter =>

val sorter = createSorter()

val metrics = TaskContext.get().taskMetrics()

// Remember spill data size of this task before execute this operator so that we can

// figure out how many bytes we spilled for this operator.

val spillSizeBefore = metrics.memoryBytesSpilled

val sortedIterator = sorter.sort(iter.asInstanceOf[Iterator[UnsafeRow]])

sortTime += sorter.getSortTimeNanos / 1000000

peakMemory += sorter.getPeakMemoryUsage

spillSize += metrics.memoryBytesSpilled - spillSizeBefore

metrics.incPeakExecutionMemory(sorter.getPeakMemoryUsage)

sortedIterator

}

利用UnsafeExternalRowSorter生成排序后的Iterator。

1. 1. UnsafeExternalRowSorter

UnsafeExternalRowSorter在Spark-catalyst包里。路径sql/execution/ UnsafeExternalRowSorter。

它又使用UnsafeExternalSorter作为内部排序迭代器。UnsafeExternalRowSorter本身的逻辑不复杂，主要是封装了UnsafeExternalSorter来排序。它将原始数据插入到UnsafeExternalSorter中，最后获取UnsafeExternalSorter的排序迭代器。