C++ vector如何去重_C++ unique函数与erase组合使用技巧

去重需先排序再用std::unique与erase组合,或用unordered_set配合remove_if保持顺序。std::unique仅移除连续重复元素并返回新末尾,需erase清理内存;保持顺序时使用哈希表记录已见元素,遍历一次完成去重,时间复杂度O(n)。

在C++中,对vector进行去重是一个常见需求。最高效且常用的方法是结合使用std::uniquevector::erase。需要注意的是,std::unique并不会真正删除元素,它只是将重复的元素“移到”容器末尾,因此必须配合erase才能实现真正的内存清理。

使用unique与erase组合去重

std::unique要求容器中的元素是已排序的,否则只会去除连续重复的元素。因此,在使用前通常需要先排序。

基本步骤如下:

  • 调用std::sort对vector排序,使相同元素相邻
  • 使用std::unique将重复元素移动到末尾,并返回新的逻辑结尾迭代器
  • erase删除从该迭代器到实际末尾的所有元素
示例代码:
#include 
#include 
#include 

int main() {
    std::vector vec = {5, 2, 8, 2, 1, 5, 3};

    // 排序使相同元素相邻
    std::sort(vec.begin(), vec.end());

    // 去重并擦除
    vec.erase(std::unique(vec.begin(), vec.end()), vec.end());

    // 输出结果:1 2 3 5 8
    for (int n : vec) std::cout << n << " ";
}

保持原始顺序的去重方法

如果不想改变原vector的元素顺序,就不能先排序。此时可以借助std::unordered_set记录已出现的元素,然后使用std::remove_if配合自定义谓词来标记重复项。

示例代码(保持顺序):
std::vector vec = {5, 2, 8, 2, 1, 5, 3};
std::unordered_set seen;

vec.erase(
    std::remove_if(vec.begin(), vec.end(), [&seen](const int& value) {
        if (seen.count(value)) {
            return true; // 标记为待移除
        }
        seen.insert(value);
        return false;
    }),
    vec.end()
);

这种方法遍历一次vector,利用哈希表快速查找,时间复杂度为O(n),适合对顺序敏感的场景。

unique函数的工作原理说明

std::unique会比较相邻元素,若相等则跳过后面的元素,只保留第一个。它返回一个迭代器,指向去重后的新末尾。原容器大小不变,被“去重”的元素仍存在于内存中,直到手动erase。

关键点:

  • std::unique不改变容器大小
  • 只对连续重复元素有效,因此常需预排序
  • 可用于自定义比较函数,如忽略大小写去重字符串

基本上就这些。掌握uniqueerase的组合用法,能高效处理大多数去重场景。是否排序取决于是否需要保持原有顺序。不复杂但容易忽略细节。