第K小元素选择算法

对于在一个无序的数组中找出第K小(大)的元素,目前有很多种方法,但是BFPRT算法是目前最好的算法,其复杂度在最好或最坏情况下都是O(n)。目前主要有一下几种思路:

1、将n个数排序(比如快速排序或归并排序),选取排序后的第k个数,时间复杂度为O(nlogn)。使用STL函数sort可以大大减少编码量。

2、将方法1中的排序方法改为线性时间排序算法(如基数排序或计数排序),时间复杂度为O(n)。但线性时间排序算法使用限制较多,不常使用。

3、维护一个k个元素的最大堆,存储当前遇到的最小的k个数,时间复杂度为O(nlogk)。这种方法同样适用于海量数据的处理。

4、部分的选择排序,即把最小的放在第1位,第二小的放在第2位,直到第k位为止,时间复杂度为O(kn)。实现非常简单。

5、部分的快速排序(快速选择算法),每次划分之后判断第k个数在左右哪个部分,然后递归对应的部分,平均时间复杂度为O(n)。但最坏情况下复杂度为O(n^2)。

6、BFPRT算法,修改快速选择算法的主元选取规则,使用中位数的中位数的作为主元,最坏情况下时间复杂度为O(n)。

BFPRT的算法步骤如下:

  1. 将n个元素每5个一组,分成n/5(上界)组。

  2. 取出每一组的中位数,任意排序方法,比如插入排序。

  3. 递归的调用selection算法查找上一步中所有中位数的中位数,设为x,偶数个中位数的情况下设定为选取中间小的一个。

  4. 用x来分割数组,设小于等于x的个数为k,大于x的个数即为n-k。

  5. 若i==k,返回x;若ik,在大于x的元素中递归查找第i-k小的元素。

  6. 终止条件:n=1时,返回的即是i小元素。