Jaki jest najskuteczniejszy sposób usuwania duplikatów i sortowania wektora?


Muszę wziąć wektor C ++ z potencjalnie dużą ilością elementów, usunąć duplikaty i posortować.

Obecnie mam poniższy kod, ale to nie działa.

      std::unique(vec.begin(), vec.end()),
std::sort(vec.begin(), vec.end());

Jak mogę to poprawnie zrobić?

Ponadto, czy szybciej jest najpierw usunąć duplikaty (podobnie jak w kodowaniu powyżej) czy najpierw wykonać sortowanie? Jeśli najpierw wykonam sortowanie, czy na pewno pozostanie posortowane po std::uniquewykonaniu?

Czy jest jeszcze inny (być może bardziej wydajny) sposób na wykonanie tego wszystkiego?

Zakładam, że nie masz możliwości sprawdzenia przed włożeniem, aby uniknąć duplikatów?
Poprawny. To byłoby idealne.
Sugerowałbym poprawienie powyższego kodu lub naprawdę wskazanie, że jest on ZŁY. std :: unique zakłada, że ​​zakres jest już posortowany.
Zgadzam się z R. Pate i Toddem Gardnerem ; std::setmoże być dobrym pomysłem tutaj. Nawet jeśli utkniesz przy użyciu wektorów, jeśli masz wystarczającą liczbę duplikatów, lepiej byłoby stworzyć zestaw do brudnej roboty.

Porównajmy trzy podejścia:

Wystarczy użyć wektora, sortuj + unikatowe

sort( vec.begin(), vec.end() );
vec.erase( unique( vec.begin(), vec.end() ), vec.end() );

Konwertuj na zestaw (ręcznie)

set<int> s;
unsigned size = vec.size();
for( unsigned i = 0; i < size; ++i ) s.insert( vec[i] );
vec.assign( s.begin(), s.end() );

Konwertuj na zestaw (za pomocą konstruktora)

set<int> s( vec.begin(), vec.end() );
vec.assign( s.begin(), s.end() );

Oto jak działają one jako liczba zmian duplikatów:

porównanie podejść wektorowych i ustawionych

Podsumowanie : gdy liczba duplikatów jest wystarczająco duża, konwersja na zestaw jest w rzeczywistości szybsza, a następnie zrzucenie danych z powrotem do wektora .

I z jakiegoś powodu ręczne wykonanie konwersji zestawu wydaje się być szybsze niż użycie konstruktora zestawu - przynajmniej na losowych danych zabawki, których użyłem.

Jestem zszokowany, że podejście konstruktora jest konsekwentnie gorsze mierzalnie niż ręczne.
Fajnie, dzięki za wykres. Czy możesz podać, jakie są jednostki dla liczby duplikatów?
Jest dość duży. Użyłem zestawów danych z 1 000 000 losowo narysowanych liczb całkowitych od 1 do 1000, 100 i 10 dla tego wykresu.
Myślę, że twoje wyniki są błędne. W moich testach im bardziej zduplikowane elementy, tym szybszy wektor (porównawczy), faktycznie skaluje się na odwrót.
Wydaje się, że brakuje opisu osi x.

Zredagowałem profilowanie Nate'a Kohla i uzyskałem różne wyniki. W moim przypadku testowym bezpośrednie sortowanie wektora jest zawsze bardziej wydajne niż użycie zestawu. Dodałem nową, bardziej wydajną metodę, używając unordered_set.

Pamiętaj, że unordered_setmetoda działa tylko wtedy, gdy masz dobrą funkcję skrótu dla typu, którego potrzebujesz unikatowo i posortowanego. Dla ints jest to łatwe! (Standardowa biblioteka zawiera domyślny skrót, który jest po prostu funkcją tożsamości). Nie zapomnij również posortować na końcu, ponieważ zestaw_uporządkowany jest, no, nieuporządkowany :)

Zrobiłem trochę kopania wewnątrz seti unordered_setwdrożenia i odkrył, że konstruktor faktycznie zbudować nowy węzeł dla każdego elementu, przed sprawdzeniem jego wartości w celu określenia, czy powinien to być rzeczywiście włożona (w realizacji programu Visual Studio, przynajmniej).

Oto 5 metod:

f1: Tylko używając vector, sort+unique

sort( vec.begin(), vec.end() );
vec.erase( unique( vec.begin(), vec.end() ), vec.end() );

f2: Konwertuj na set(za pomocą konstruktora)

set<int> s( vec.begin(), vec.end() );
vec.assign( s.begin(), s.end() );

f3: Konwertuj na set(ręcznie)

set<int> s;
for (int i : vec)
vec.assign( s.begin(), s.end() );

f4: Konwertuj na unordered_set(za pomocą konstruktora)

unordered_set<int> s( vec.begin(), vec.end() );
vec.assign( s.begin(), s.end() );
sort( vec.begin(), vec.end() );

f5: Konwertuj na unordered_set(ręcznie)

unordered_set<int> s;
for (int i : vec)
vec.assign( s.begin(), s.end() );
sort( vec.begin(), vec.end() );

Zrobiłem test z wektorem 100 000 000 ints wybranych losowo w zakresach [1,10], [1,1000] i [1,100000]

Wyniki (w sekundach im mniejsze, tym lepiej):

range         f1       f2       f3       f4      f5
[1,10]      1.6821   7.6804   2.8232   6.2634  0.7980
[1,1000]    5.0773  13.3658   8.2235   7.6884  1.9861
[1,100000]  8.7955  32.1148  26.5485  13.3278  3.9822
W przypadku liczb całkowitych możesz użyć sortowania radix, który jest znacznie szybszy niż std :: sort.
Szybka wskazówka, aby użyć sortlub uniquemetod, musisz#include <algorithm>
@ChangmingSun Zastanawiam się, dlaczego optymalizator wydawał się nie działać na F4?
@sandthorn Jak wyjaśniono w mojej odpowiedzi, implementacja buduje węzeł (w tym dynamiczny przydział) dla każdego elementu z sekwencji wejściowej, co jest marnotrawstwem dla każdej wartości, która ostatecznie jest duplikatem.
Ach, to przypomina mi jedną z przemówień Scotta Meyera o CWUK sceneriach, które mają naturę możliwości spowolnienia tego emplacerodzaju budowy.

std::unique usuwa zduplikowane elementy tylko wtedy, gdy są sąsiadami: musisz najpierw posortować wektor, zanim zadziała on zgodnie z twoimi zamierzeniami.

std::unique jest zdefiniowany jako stabilny, więc wektor będzie nadal sortowany po uruchomieniu na nim unikalnego.


Nie jestem pewien, do czego go używasz, więc nie mogę tego powiedzieć ze 100% pewnością, ale normalnie, kiedy myślę o „posortowanym, unikalnym” pojemniku, myślę o std :: set . Może lepiej pasować do twojej skrzynki użytkownika:

std::set<Foo> foos(vec.begin(), vec.end()); // both sorted & unique already

W przeciwnym razie posortowanie przed wywołaniem unikalnego (jak wskazały inne odpowiedzi) jest dobrym rozwiązaniem.

@MadCoder: niekoniecznie „ma sens", że zestaw jest implementowany w sposób posortowany. Istnieją również zestawy zaimplementowane przy użyciu tabel skrótów, które nie są sortowane.

std::uniquedziała tylko na kolejnych seriach zduplikowanych elementów, więc lepiej najpierw posortuj. Jest jednak stabilny, więc wektor pozostanie posortowany.

Oto szablon, który możesz dla Ciebie zrobić:

template<typename T>
void removeDuplicates(std::vector<T>& vec)
    std::sort(vec.begin(), vec.end());
    vec.erase(std::unique(vec.begin(), vec.end()), vec.end());

nazwij to tak:

Lub jeszcze lepiej, po prostu weź iteratory szablonów bezpośrednio (początek i koniec), i możesz uruchomić go na innych strukturach poza wektorem.
Do diabła, szablony! szybka poprawka dla małych list, pełny styl STL. +1 thx
@Kyle - tylko w innych kontenerach, które mają erase()metodę, w przeciwnym razie musisz zwrócić nowy iterator końcowy i mieć kod wywołujący obcinający kontener.
Wydajność to skomplikowana koncepcja. Są względy dotyczące czasu i przestrzeni, a także ogólne pomiary (w których otrzymujesz tylko niejasne odpowiedzi, takie jak O (n)) w porównaniu do konkretnych (np. Sortowanie bąbelkowe może być znacznie szybsze niż szybkie sortowanie, w zależności od charakterystyki wejściowej).

Jeśli masz stosunkowo niewiele duplikatów, sortowanie, a następnie unikanie i usuwanie wydają się być dobrym rozwiązaniem. Jeśli miałeś stosunkowo dużo duplikatów, utworzenie zestawu z wektora i pozwolenie mu na wykonanie ciężkiego podnoszenia może go łatwo pokonać.

Nie koncentruj się tylko na wydajności czasu. Sortowanie + unikanie + wymazywanie działa w przestrzeni O (1), podczas gdy konstrukcja zestawu działa w przestrzeni O (n). I żadne z nich nie nadaje się bezpośrednio do zmniejszania równoległości map (dla naprawdę dużych zestawów danych).

Co dałoby ci zdolność mapowania / zmniejszania?
Tak, musisz mieć jeden kontrolujący węzeł / wątek. Problem można jednak podzielić tyle razy, ile jest to konieczne, aby nałożyć górne ograniczenia na liczbę wątków roboczych / potomnych, którymi zajmuje się wątek kontrolny / macierzysty, oraz na rozmiar zbioru danych, który każdy węzeł liścia musi przetworzyć. Nie wszystkie problemy można łatwo rozwiązać za pomocą funkcji zmniejszania mapy, po prostu chciałem zauważyć, że są ludzie, którzy mają do czynienia z podobnymi (na powierzchni, w każdym razie) problemami z optymalizacją, gdzie radzenie sobie z 10 terabajtami danych nazywa się „wtorek”.

Musisz to posortować, zanim zadzwonisz, uniqueponieważ uniqueusuwa tylko duplikaty znajdujące się obok siebie.

edycja: 38 sekund ...

uniqueusuwa tylko kolejne zduplikowane elementy (co jest konieczne, aby działało w czasie liniowym), dlatego najpierw należy wykonać sortowanie. Pozostanie posortowane po połączeniu z unique.


Jeśli nie chcesz zmieniać kolejności elementów, możesz wypróbować to rozwiązanie:

template <class T>
void RemoveDuplicatesInVector(std::vector<T> & vec)
    set<T> values;
    vec.erase(std::remove_if(vec.begin(), vec.end(), [&](const T & value) { return !values.insert(value).second; }), vec.end());
Być może użyj zestawu nieuporządkowanego zamiast zestawu (i doładuj :: remove_erase_if, jeśli jest dostępny)

Zakładając, że a jest wektorem, usuń ciągłe duplikaty za pomocą

a.erase(unique(a.begin(),a.end()),a.end());działa w czasie O (n) .

ciągłe duplikaty. ok, więc potrzebuje std::sortpierwszego.

Jak już wspomniano, uniquewymaga posortowanego pojemnika. Ponadto uniquetak naprawdę nie usuwa elementów z kontenera. Zamiast tego są one kopiowane do końca, uniquezwraca iterator wskazujący na pierwszy taki zduplikowany element i oczekuje się, że zadzwonisz, eraseaby faktycznie usunąć elementy.

@Pate, masz rację. To nie wymaga. Usuwa sąsiadujące duplikaty.
@Pate, masz rację. To nie wymaga. Usuwa sąsiadujące duplikaty.
Bill Lynch,
Jeśli masz kontener, który może mieć duplikaty, i chcesz kontener, który nie ma żadnych zduplikowanych wartości w dowolnym miejscu kontenera, musisz najpierw posortować kontener, a następnie przekazać go do unikalnego, a następnie użyć kasowania, aby faktycznie usunąć duplikaty . Jeśli chcesz po prostu usunąć sąsiadujące duplikaty, nie będziesz musiał sortować kontenera. Ale skończysz na zduplikowanych wartościach: 1 2 2 3 2 4 2 5 2 zostanie zmieniony na 1 2 3 2 4 2 5 2, jeśli zostanie przeniesiony do unikatowego bez sortowania, 1 2 3 4 5, jeśli zostanie posortowany, przeniesiony do unikatowego i skasowany .
Standardowe podejście sugerowane przez Nate Kohla, po prostu za pomocą wektora, sortowania + unikatowego:

sort( vec.begin(), vec.end() );
vec.erase( unique( vec.begin(), vec.end() ), vec.end() );

nie działa dla wektora wskaźników.

Przyjrzyj się dokładnie temu przykładowi na cplusplus.com .

W ich przykładzie „tak zwane duplikaty” przeniesione na koniec są faktycznie pokazane jako? (niezdefiniowane wartości), ponieważ te „tak zwane duplikaty” są CZASAMI „dodatkowymi elementami”, a CZASAMI są „brakujące elementy” w oryginalnym wektorze.

Problem występuje podczas używania std::unique()na wektorze wskaźników do obiektów (wycieki pamięci, zły odczyt danych z HEAP, duplikowanie zwolnień, które powodują błędy segmentacji itp.).

Oto moje rozwiązanie problemu zamienić std::unique()z ptgi::unique().

Zobacz plik ptgi_unique.hpp poniżej:

// ptgi::unique()
// Fix a problem in std::unique(), such that none of the original elts in the collection are lost or duplicate.
// ptgi::unique() has the same interface as std::unique()
// There is the 2 argument version which calls the default operator== to compare elements.
// There is the 3 argument version, which you can pass a user defined functor for specialized comparison.
// ptgi::unique() is an improved version of std::unique() which doesn't looose any of the original data
// in the collection, nor does it create duplicates.
// After ptgi::unique(), every old element in the original collection is still present in the re-ordered collection,
// except that duplicates have been moved to a contiguous range [dupPosition, last) at the end.
// Thus on output:
//  [begin, dupPosition) range are unique elements.
//  [dupPosition, last) range are duplicates which can be removed.
// where:
//  [] means inclusive, and
//  () means exclusive.
// In the original std::unique() non-duplicates at end are moved downward toward beginning.
// In the improved ptgi:unique(), non-duplicates at end are swapped with duplicates near beginning.
// In addition if you have a collection of ptrs to objects, the regular std::unique() will loose memory,
// and can possibly delete the same pointer multiple times (leading to SEGMENTATION VIOLATION on Linux machines)
// but ptgi::unique() won't.  Use valgrind(1) to find such memory leak problems!!!
// NOTE: IF you have a vector of pointers, that is, std::vector<Object*>, then upon return from ptgi::unique()
// you would normally do the following to get rid of the duplicate objects in the HEAP:
//  // delete objects from HEAP
//  std::vector<Object*> objects;
//  for (iter = dupPosition; iter != objects.end(); ++iter)
//  {
//      delete (*iter);
//  }
//  // shrink the vector. But Object * pointers are NOT followed for duplicate deletes, this shrinks the vector.size())
//  objects.erase(dupPosition, objects.end));
// NOTE: But if you have a vector of objects, that is: std::vector<Object>, then upon return from ptgi::unique(), it
// suffices to just call vector:erase(, as erase will automatically call delete on each object in the
// [dupPosition, end) range for you:
//  std::vector<Object> objects;
//  objects.erase(dupPosition, last);
// Example of differences between std::unique() vs ptgi::unique().
//  Given:
//      int data[] = {10, 11, 21};
//  Given this functor: ArrayOfIntegersEqualByTen:
//      A functor which compares two integers a[i] and a[j] in an int a[] array, after division by 10:
//  // given an int data[] array, remove consecutive duplicates from it.
//  // functor used for std::unique (BUGGY) or ptgi::unique(IMPROVED)
//  // Two numbers equal if, when divided by 10 (integer division), the quotients are the same.
//  // Hence 50..59 are equal, 60..69 are equal, etc.
//  struct ArrayOfIntegersEqualByTen: public std::equal_to<int>
//  {
//      bool operator() (const int& arg1, const int& arg2) const
//      {
//          return ((arg1/10) == (arg2/10));
//      }
//  };
//  Now, if we call (problematic) std::unique( data, data+3, ArrayOfIntegersEqualByTen() );
//  TEST1: BEFORE UNIQ: 10,11,21
//  TEST1: AFTER UNIQ: 10,21,21
//  DUP_INX=2
//      PROBLEM: 11 is lost, and extra 21 has been added.
//  More complicated example:
//  TEST2: BEFORE UNIQ: 10,20,21,22,30,31,23,24,11
//  TEST2: AFTER UNIQ: 10,20,30,23,11,31,23,24,11
//  DUP_INX=5
//      Problem: 21 and 22 are deleted.
//      Problem: 11 and 23 are duplicated.
//  NOW if ptgi::unique is called instead of std::unique, both problems go away:
//  TEST1: BEFORE UNIQ: 10,11,21
//  TEST1: AFTER UNIQ: 10,21,11
//  DUP_INX=2
//  TEST2: BEFORE UNIQ: 10,20,21,22,30,31,23,24,11
//  TEST2: AFTER UNIQ: 10,20,30,23,11,31,22,24,21
//  DUP_INX=5
//  @SEE: look at the "case study" below to understand which the last "AFTER UNIQ" results with that order:
//  TEST2: AFTER UNIQ: 10,20,30,23,11,31,22,24,21
// Case Study: how ptgi::unique() works:
//  Remember we "remove adjacent duplicates".
//  In this example, the input is NOT fully sorted when ptgi:unique() is called.
//  I put | separatators, BEFORE UNIQ to illustrate this
//  10  | 20,21,22 |  30,31 |  23,24 | 11
//  In example above, 20, 21, 22 are "same" since dividing by 10 gives 2 quotient.
//  And 30,31 are "same", since /10 quotient is 3.
//  And 23, 24 are same, since /10 quotient is 2.
//  And 11 is "group of one" by itself.
//  So there are 5 groups, but the 4th group (23, 24) happens to be equal to group 2 (20, 21, 22)
//  So there are 5 groups, and the 5th group (11) is equal to group 1 (10)
//  R = result
//  F = first
//  10, 20, 21, 22, 30, 31, 23, 24, 11
//  R    F
//  10 is result, and first points to 20, and R != F (10 != 20) so bump R:
//       R
//       F
//  Now we hits the "optimized out swap logic".
//  (avoid swap because R == F)
//  // now bump F until R != F (integer division by 10)
//  10, 20, 21, 22, 30, 31, 23, 24, 11
//       R   F              // 20 == 21 in 10x
//       R       F              // 20 == 22 in 10x
//       R           F          // 20 != 30, so we do a swap of ++R and F
//  (Now first hits 21, 22, then finally 30, which is different than R, so we swap bump R to 21 and swap with  30)
//  10, 20, 30, 22, 21, 31, 23, 24, 11  // after R & F swap (21 and 30)
//           R       F 
//  10, 20, 30, 22, 21, 31, 23, 24, 11
//           R          F           // bump F to 31, but R and F are same (30 vs 31)
//           R               F      // bump F to 23, R != F, so swap ++R with F
//  10, 20, 30, 22, 21, 31, 23, 24, 11
//                  R           F       // bump R to 22
//  10, 20, 30, 23, 21, 31, 22, 24, 11  // after the R & F swap (22 & 23 swap)
//                  R            F      // will swap 22 and 23
//                  R                F      // bump F to 24, but R and F are same in 10x
//                  R                    F  // bump F, R != F, so swap ++R  with F
//                      R                F  // R and F are diff, so swap ++R  with F (21 and 11)
//  10, 20, 30, 23, 11, 31, 22, 24, 21
//                      R                F  // aftter swap of old 21 and 11
//                      R                  F    // F now at last(), so loop terminates
//                          R               F   // bump R by 1 to point to dupPostion (first duplicate in range)
//  return R which now points to 31
// 1) the #ifdef IMPROVED_STD_UNIQUE_ALGORITHM documents how we have modified the original std::unique().
// 2) I've heavily unit tested this code, including using valgrind(1), and it is *believed* to be 100% defect-free.
// History:
Nie rozumiem tutaj uzasadnienia. Więc jeśli masz pojemnik ze wskaźnikami i chcesz usunąć duplikaty, jak to wpływa na obiekty wskazywane przez wskaźniki?
Nie jestem pewien, czy rozumiem twój punkt widzenia. Weźmy prosty przypadek wektora <int *>, w którym 4 wskaźniki wskazują na liczby całkowite {1, 2. 2, 3}. Jest posortowane, ale po wywołaniu std :: unique 4 wskaźniki są wskaźnikami do liczb całkowitych {1, 2, 3, 3}.
kccqzy, oto przykładowy program, dzięki któremu lepiej rozumiesz moją odpowiedź:
@joe: Nawet jeśli po std::unique[1, 2, 3, 2] nie można wywołać delete na 2, ponieważ pozostawiłoby to wiszący wskaźnik na 2!
@ArneVogel: Być może dla trywialnych wartości „działa dobrze". To raczej bezcelowe zadzwonić uniquena zasadzie vector<unique_ptr<T>>, jak tylko powielona wartość taka może zawierać wektor jest nullptr.
Ben Voigt

Z biblioteką Ranges (pochodzącą z C ++ 20) możesz po prostu używać


Zauważ, że faktycznie usuwa zduplikowane elementy, a nie tylko je przenosi.


Informacje o testach porównawczych alexK7. Próbowałem ich i uzyskałem podobne wyniki, ale gdy zakres wartości wynosi 1 milion, przypadki przy użyciu std :: sort (f1) i przy użyciu std :: unordered_set (f5) dają podobny czas. Gdy zakres wartości wynosi 10 milionów, f1 jest szybsze niż f5.

Jeśli zakres wartości jest ograniczony, a wartości nie są oznaczone int, możliwe jest użycie std :: vector, którego rozmiar odpowiada podanemu zakresowi. Oto kod:

void DeleteDuplicates_vector_bool(std::vector<unsigned>& v, unsigned range_size)
    std::vector<bool> v1(range_size);
    for (auto& x: v)
       v1[x] = true;    

    unsigned count = 0;
    for (auto& x: v1)
        if (x)
sort (v.begin (), v.end ()), v.erase (unique (v.begin (), v, end ()), v.end ());


Jeśli szukasz wydajności i używania std::vector, polecam ten, który zapewnia ten link do dokumentacji .

std::vector<int> myvector{10,20,20,20,30,30,20,20,10};             // 10 20 20 20 30 30 20 20 10
std::sort(myvector.begin(), myvector.end() );
const auto& it = std::unique (myvector.begin(), myvector.end());   // 10 20 30 ?  ?  ?  ?  ?  ?
                                                                   //          ^
myvector.resize( std::distance(myvector.begin(),it) ); // 10 20 30
cplusplus.com nie jest w żaden sposób oficjalną dokumentacją.
std::set<int> s;
std::for_each(v.cbegin(), v.cend(), [&s](int val){s.insert(val);});
std::copy(s.cbegin(), s.cend(), v.cbegin());
być może zmień rozmiar wektora po jego wyczyszczeniu, aby przy budowaniu wektora był tylko 1 przydział pamięci. Może wolę std :: move zamiast std :: copy, aby przenieść ints do wektora zamiast kopiować je, ponieważ zestaw nie będzie później potrzebny.

Jeśli nie chcesz modyfikować wektora (kasowanie, sortowanie), możesz użyć biblioteki Newtona. W podbibliotece algorytmu znajduje się wywołanie funkcji, copy_single

template <class INPUT_ITERATOR, typename T>
    void copy_single( INPUT_ITERATOR first, INPUT_ITERATOR last, std::vector<T> &v )

więc możesz:

std::vector<TYPE> copy; // empty vector
newton::copy_single(first, last, copy);

gdzie kopia jest wektorem, w którym chcesz push_back kopię unikalnych elementów. ale pamiętaj, że wypychasz elementy i nie tworzysz nowego wektora

w każdym razie jest to szybsze, ponieważ nie kasujesz () elementów (co zajmuje dużo czasu, z wyjątkiem pop_back () z powodu zmiany przypisania)

Robię eksperymenty i jest to szybsze.

Możesz także użyć:

std::vector<TYPE> copy; // empty vector
newton::copy_single(first, last, copy);
original = copy;

czasami jest jeszcze szybszy.

Ta funkcja jest obecna w standardowej bibliotece jako unique_copy.

Bardziej zrozumiały kod z: https://en.cppreference.com/w/cpp/algorithm/unique

#include <iostream>
#include <algorithm>
#include <vector>
#include <string>
#include <cctype>

int main() 
    // remove duplicate elements
    std::vector<int> v{1,2,3,1,2,3,3,4,5,4,5,6,7};
    std::sort(v.begin(), v.end()); // 1 1 2 2 3 3 3 4 4 5 5 6 7 
    auto last = std::unique(v.begin(), v.end());
    // v now holds {1 2 3 4 5 6 7 x x x x x x}, where 'x' is indeterminate
    v.erase(last, v.end()); 
    for (int i : v)
      std::cout << i << " ";
    std::cout << "\n";


1 2 3 4 5 6 7
void removeDuplicates(std::vector<int>& arr) {
    for (int i = 0; i < arr.size(); i++)
        for (int j = i + 1; j < arr.size(); j++)
            if (arr[i] > arr[j])
                int temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
    std::vector<int> y;
    int x = arr[0];
    int i = 0;
    while (i < arr.size())
        if (x != arr[i])
            x = arr[i];
        if (i == arr.size())
            y.push_back(arr[i - 1]);
    arr = y;
Witamy w StackOverflow! Proszę edytować swoje pytanie, aby dodać wyjaśnienie jak ci roboty kod i dlaczego jest to równoważne lub lepsze od innych odpowiedzi.

PS: Uruchomiłem także „valgrind ./Main10" i valgrind nie znalazł problemów.
Sedno problemu ze std :: unique można podsumować za pomocą instrukcji „std :: unique zwraca duplikaty w nieokreślonym stanie" !!!!!!
Tak, „std :: unique zwraca duplikaty w nieokreślonym stanie". Więc po prostu nie polegaj na tablicy, która została „unikatowa" do ręcznego zarządzania pamięcią!
To wydaje się być odpowiedzią na inną odpowiedź; nie odpowiada na pytanie (w którym vectorzawiera liczby całkowite, a nie wskaźniki i nie określa komparatora).
void EraseVectorRepeats(vector <int> & v){ 
TOP:for(int y=0; y<v.size();++y){
        for(int z=0; z<v.size();++z){
            if(y==z){ //This if statement makes sure the number that it is on is not erased-just skipped-in order to keep only one copy of a repeated number
                v.erase(v.begin()+z); //whenever a number is erased the function goes back to start of the first loop because the size of the vector changes
            goto TOP;}}}}

Jest to funkcja, którą stworzyłem, której możesz użyć do usuwania powtórzeń. Potrzebne pliki nagłówkowe to tylko <iostream>i <vector>.
