sql >> Databasteknik >  >> NoSQL >> MongoDB

Infogar nya fält (kolumner) till mongoDB med pandor

Metoden du behöver är update_one() med upsert=True i en slinga; du kan inte använda insert_many() av två skäl; För det första sätter du inte alltid in; någon gång uppdaterar du; för det andra update_many() (och insert_many() ) fungerar bara på ett enda filter; i ditt fall är varje filter olika eftersom varje uppdatering relaterar till en annan tidpunkt.

Detta är en generisk lösning som kombinerar dataramar (df_a , df_b i det här fallet - du kan ha så många du vill) på det sätt du behöver. Den använder iterrows för att hämta varje rad i dataramen, filtrerar du på datumet och ställer in värdena till de i dataramen. $set operatören åsidosätter värden om de redan finns där och ställer in dem om de inte är inställda. upsert=True kommer att utföra en infogning om det inte finns någon match på datumet.

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

Fullständigt utfört exempel:

from pymongo import MongoClient
from pprint import pprint
import datetime
import pandas as pd

# Sample data setup

db = MongoClient()['mydatabase']

data_a = [[datetime.datetime(2017, 5, 19, 21, 20), 96, 8, 98],
          [datetime.datetime(2017, 5, 19, 21, 21), 95, 8, 97],
          [datetime.datetime(2017, 5, 19, 21, 22), 95, 8, 97]]

df_a = pd.DataFrame(data_a, columns=['date', 'std_500_1000window', 'std_50_100window', 'std_50_2000window'])

data_b = [[datetime.datetime(2017, 5, 19, 21, 20), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 21), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 22), 98, 9, 10]]

df_b = pd.DataFrame(data_b, columns=['date', 'std_50_3000window', 'std_50_300window', 'std_50_500window'])

# Perform the upserts

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

# Print the results

for record in db.mycollection.find():
    pprint(record)

Resultat:

{'_id': ObjectId('5f0ae909df5531ac655ce528'),
 'date': datetime.datetime(2017, 5, 19, 21, 20),
 'std_500_1000window': 96,
 'std_50_100window': 8,
 'std_50_2000window': 98,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52a'),
 'date': datetime.datetime(2017, 5, 19, 21, 21),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52c'),
 'date': datetime.datetime(2017, 5, 19, 21, 22),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}



  1. Spring MongoDB-frågesortering

  2. gem-install av mongoid kastar en oinitierad konstant i Ruby, fungerar i irb

  3. Hur man tar bort markerade flera poster i en samling i MongoDB med MongoDB-kompass

  4. mongoose - välj specifika fält i Model.create