C++怎么解决Top K问题_C++算法设计与Top K问题实现

Top K问题可通过优先队列、partial_sort和nth_element解决:优先队列维护大小为K的堆,适合流式数据;partial_sort对前K个元素排序,适用于需有序结果且K较小的场景;nth_element基于快速选择,平均时间复杂度O(n),效率最高但不保证前K内部有序。

Top K 问题是常见的算法问题,要求从大量数据中找出最大的(或最小的)K个元素。C++ 提供了多种高效手段来解决这个问题,核心思路是避免完全排序,只关注前 K 个目标元素,从而提升性能。

使用优先队列(堆)求 Top K

最常用且高效的方法是利用 std::priority_queue 构建小根堆(求最大 K 个元素)或大根堆(求最小 K 个元素)。

以找最大 K 个数为例:

  • 维护一个大小为 K 的小根堆
  • 遍历数组,若堆未满 K 个,直接加入
  • 若堆已满且当前元素大于堆顶,弹出堆顶并插入当前元素
  • 遍历完成后,堆中即为 Top K 元素

#include 
#include 
#include 

std::vector getTopK(std::vector& nums, int k) { std::priority_queue, std::greater> minHeap;

for (int num : nums) {
    if (minHeap.size() zuojiankuohaophpcn k) {
        minHeap.push(num);
    } else if (num > minHeap.top()) {
        minHeap.pop();
        minHeap.push(num);
    }
}

std::vectorzuojiankuohaophpcnintyoujiankuohaophpcn result;
while (!minHeap.empty()) {
    result.push_back(minHeap.top());
    minHeap.pop();
}
return result;

}

使用 partial_sort 算法

C++ 标准库提供了 std::partial_sort,可将前 K 个元素按顺序排列,其余元素无序。

适合需要有序结果且 K 较小的场景。

#include 
#include 

std::vector getTopKPartialSort(std::vector& nums, int k) { std::partial_sort(nums.begin(), nums.begin() + k, nums.end(), std::greater()); return std::vector(nums.begin(), nums.begin() + k); }

使用 nth_element 快速划分

若只需 Top K 元素但不要求顺序,std::nth_element 是最优选择之一。

基于快速选择(QuickSelect),平均时间复杂度 O(n)。

#include 
#include 

std::vector getTopKNthElement(std::vector& nums, int k) { std::nth_element(nums.begin(), nums.begin() + k - 1, nums.end(), std::greater()); return std::vector(nums.begin(), nums.begin() + k); }

三种方法各有优势:堆适合流式数据和内存受限场景;partial_sort 适合 K 小且需排序;nth_element 效率最高但不保证前 K 内部有序。根据实际需求选择即可。

基本上就这些,掌握好 STL 的这几个工具,Top K 问题就能轻松应对。