Zaktualizuj pole MongoDB, używając wartości innego pola

372

Czy w MongoDB można zaktualizować wartość pola przy użyciu wartości z innego pola? Odpowiednik SQL mógłby wyglądać następująco:

UPDATE Person SET Name = FirstName + ' ' + LastName

A pseudo-kod MongoDB to:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
Chris Fulstow
źródło

Odpowiedzi:

258

Najlepszym sposobem na to jest w wersji 4.2 lub nowszej wersji, która pozwala za pomocą rurociągu agregacji w dokumencie Update oraz updateOne, updateManyczy updatemetody zbierania. Należy pamiętać, że ten drugi jest przestarzały w większości, jeśli nie we wszystkich językach sterowników.

MongoDB 4.2+

W wersji 4.2 wprowadzono również $setoperator etapu potoku, który jest aliasem $addFields. Wykorzystam $settutaj, ponieważ mapuje to, co próbujemy osiągnąć.

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

MongoDB 3.4+

W 3.4+ można używać $addFieldsi $outoperatorów rurociągów agregacji.

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

Pamiętaj, że to nie aktualizuje Twojej kolekcji, ale zastępuje istniejącą kolekcję lub tworzy nową. Również w przypadku operacji aktualizacji wymagających „rzutowania typu” konieczne będzie przetwarzanie po stronie klienta, aw zależności od operacji może być konieczne użycie find()metody zamiast .aggreate()metody.

MongoDB 3.2 i 3.0

Sposób, w jaki to robimy, polega na przesłaniu $projectdokumentów i użyciu $concatoperatora agregacji ciągów w celu zwrócenia połączonego łańcucha. my Stamtąd iterujemy kursor i używamy $setoperatora aktualizacji, aby dodać nowe pole do dokumentów za pomocą operacji zbiorczych w celu uzyskania maksymalnej wydajności.

Zapytanie agregacyjne:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2 lub nowszy

z tego musisz użyć bulkWritemetody.

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6 i 3.0

Od tej wersji musisz używać przestarzałego Bulkinterfejsu API i powiązanych z nim metod .

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})
styvane
źródło
Myślę, że występuje problem z kodem dla „MongoDB 3.2 lub nowszy”. Ponieważ forEach jest asynchroniczny, nic nie zostanie zwykle zapisane w ostatnim pakiecie bulkWrite.
Viktor Hedefalk
3
4.2+ Nie działa. MongoError: Pole z prefiksem dolara ($) „$ concat” w „name. $ Concat” nie jest ważne dla przechowywania.
Josh Woodcock
@JoshWoodcock, myślę, że masz literówkę w uruchomionym zapytaniu. Sugeruję podwójne sprawdzenie.
styvane
@JoshWoodcock Działa pięknie. Sprawdź to, używając powłoki MongoDB Web Shell
styvane
2
Dla tych, którzy napotykają ten sam problem, opisał @JoshWoodcock: zwróć uwagę, że odpowiedź dla wersji 4.2+ opisuje potok agregacji , więc nie przegap nawiasów kwadratowych w drugim parametrze!
philsch
240

Powinieneś iterować. W konkretnym przypadku:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);
Carlos Barcelona
źródło
4
Co się stanie, jeśli inny użytkownik zmieni dokument między twoimi find () a save ()?
UpTheCreek
3
To prawda, ale kopiowanie między polami nie powinno wymagać transakcji atomowych.
UpTheCreek,
3
Ważne jest, aby zauważyć, że save()całkowicie zastępuje dokument. Powinien użyć update()zamiast.
Carlos
12
Co powiesz nadb.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
Philipp Jardas,
1
Stworzyłem funkcję o nazwie, create_guidktóra generowała tylko unikalny identyfikator dla każdego dokumentu podczas iteracji forEachw ten sposób (tj. Po prostu użycie create_guidw updateinstrukcji z mutli=truespowodowało wygenerowanie tego samego identyfikatora dla wszystkich dokumentów). Ta odpowiedź działała dla mnie idealnie. +1
rmirabelle,
103

Najwyraźniej istnieje sposób, aby to zrobić skutecznie od MongoDB 3.4, patrz odpowiedź styvane .


Przestarzała odpowiedź poniżej

Nie można odwoływać się do samego dokumentu w aktualizacji (jeszcze). Musisz iterować dokumenty i aktualizować każdy dokument za pomocą funkcji. Zobacz tę odpowiedź na przykład lub po stronie serwera eval().

Niels van der Rest
źródło
31
Czy to nadal obowiązuje dzisiaj?
Christian Engel
3
@ChristianEngel: Wydaje się, że tak. Nie byłem w stanie znaleźć niczego w dokumentach MongoDB, które wspomniałoby odniesienie do bieżącego dokumentu w updateoperacji. To powiązane żądanie funkcji jest nadal nierozwiązane.
Niels van der Rest
4
Czy nadal obowiązuje w kwietniu 2017 r.? Czy są już nowe funkcje, które mogą to zrobić?
Kim
1
@Kim Wygląda na to, że nadal jest ważny. Ponadto żądanie funkcji, na które zwrócił uwagę @ niels-van-der-rest w 2013 r., Jest nadal aktualne OPEN.
Danziger
8
to nie jest już prawidłowa odpowiedź, spójrz na odpowiedź
@styvane
45

W przypadku bazy danych o wysokiej aktywności możesz napotkać problemy, w których twoje aktualizacje wpływają na aktywnie zmieniające się rekordy iz tego powodu zalecam użycie snapshot ()

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/

Eric Kigathi
źródło
2
Co się stanie, jeśli inny użytkownik dokonał edycji osoby między find () a save ()? Mam przypadek, w którym można wykonać wiele wywołań do tego samego obiektu, zmieniając je w oparciu o ich bieżące wartości. Drugi użytkownik powinien poczekać z odczytem, ​​aż pierwszy zakończy zapisywanie. Czy to osiąga?
Marco,
4
Informacje o snapshot(): Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead. link
ppython
10

Jeśli chodzi o tę odpowiedź , funkcja migawki jest przestarzała w wersji 3.6, zgodnie z tą aktualizacją . Tak więc w wersji 3.6 i nowszej można wykonać tę operację w następujący sposób:

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);
Aldo
źródło
9

Zaczynając Mongo 4.2, db.collection.update()akceptuje potok agregacji, wreszcie pozwalając na aktualizację / utworzenie pola na podstawie innego pola:

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • Pierwsza część {}to zapytanie pasujące, które filtruje dokumenty do aktualizacji (w naszym przypadku wszystkie dokumenty).

  • Druga część [{ $set: { name: { ... } }]to potok agregacji aktualizacji (zwróć uwagę na kwadratowe nawiasy kwadratowe oznaczające użycie potoku agregacji). $setto nowy operator agregacji i alias $addFields.

  • Nie zapomnij { multi: true }, w przeciwnym razie tylko pierwszy pasujący dokument zostanie zaktualizowany.

Xavier Guihot
źródło
8

Wypróbowałem powyższe rozwiązanie, ale okazało się, że nie nadaje się do dużych ilości danych. Następnie odkryłem funkcję strumienia:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})
Chris Gibb
źródło
1
Czym się to różni? Czy działanie aktualizacji zostanie ograniczone do pary? Czy masz jakieś odniesienia do tego? Dokumenty Mongo są dość słabe.
Nico,
2

Oto, co wymyśliliśmy, aby skopiować jedno pole do drugiego dla ~ 150_000 rekordów. Zajęło to około 6 minut, ale nadal jest znacznie mniej zasobochłonne niż w przypadku tworzenia i iteracji tej samej liczby obiektów rubinowych.

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
Chris Bloom
źródło
1

Z MongoDB wersji wersji 4.2 lub nowszej , aktualizacje są bardziej elastyczne, gdyż umożliwia korzystanie z rurociągu agregacji w swojej update, updateOnei updateMany. Możesz teraz przekształcić swoje dokumenty za pomocą operatorów agregujących, a następnie zaktualizować bez potrzeby jawnego określania $setpolecenia (zamiast tego używamy $replaceRoot: {newRoot: "$$ROOT"})

W tym przypadku wykorzystujemy zapytanie zagregowane, aby wyodrębnić znacznik czasu z pola ObjectID „_id” MongoDB i zaktualizować dokumenty (nie jestem ekspertem w dziedzinie SQL, ale myślę, że SQL nie zapewnia żadnego automatycznie wygenerowanego ObjectID, który ma znacznik czasu, musiałbyś automatycznie utwórz tę datę)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})
Yi Xiang Chong
źródło
Nie potrzebujesz { $replaceRoot: { newRoot: "$$ROOT" } }; oznacza to zastąpienie samego dokumentu, co nie ma sensu. Jeśli zamienisz $addFieldsna jego alias $seti updateManyktóry jest jednym z aliasów update, uzyskasz dokładnie taką samą odpowiedź jak ta powyżej.
Xavier Guihot