为什么排序具有n(logn)的下限？

在计算机科学领域中，排序是一种至关重要的操作，它可以使数据集合按照指定的顺序排列。但是，你是否想过为什么排序操作需要确保它的算法至少在 n(logn) 的时间内完成？

这个问题的答案涉及到一个叫做“基于比较”的排序算法。这些算法基于比较每个元素的两两关系，用以确定它们的有序位置。然而，这里有一个值得注意的事实，即基于比较的排序算法的下限是 n(logn)，意味着没有一种这样的算法可以做得更好。那么为什么呢？

这个问题的答案，实际上是几个著名的计算机科学家（包括John von Neumann）和数学家一次次研究后得出的结论。最具代表性的结论是决策树模型。在决策树模型中，每个叶子节点代表元素的一个可能的排列，其深度表示算法比较的次数。

让我们看看决策树模型在对5个元素排序时的情况。在这种情况下，决策树的高度至少为log2^5 = 2.32。因此，任何基于比较的排序算法必须在某些情况下比较至少三次，或在所有情况下至少在判断顺序上进行三个选择。

这是因为每个节点有两种可能性，因此，如果决策树的高度为h，则可以找到2^h个不同的排列，其中h表示最坏情况下的比较次数。

然而，由于log2^5 = 2.32，因此决策树的高度至少为3。因此，对于5个元素的排序，基于比较的算法必须进行至少3次比较以确定某个元素的位置。这是基于比较的排序算法所必需的，也就是说算法的时间复杂度的下限。

目前为止，没有一种排序算法可以超越n(logn)的下限，这是基于比较的排序算法所必须具备的。然而，还有一些非比较性排序算法，它们可以看到排序的最快时间低于n(logn) 。

例如，计数排序，桶排序和基数排序等算法可以在线性时间内完成排序算法，但是这些非比较算法通常受到各种限制，比如时间和空间的要求，以及数据集合中数据值的范围。

因此，排序是计算机科学中最具挑战性的问题之一，基于比较的排序算法设置了n(logn)的下限，使我们可以确定它们在最优情况下的速度，并使我们能够更好地研究和理解这个问题。

了解更多有趣的事情：https://blog.ds3783.com/

近期文章