Sprawdź, czy klucz istnieje i wykonaj iterację tablicy JSON za pomocą Pythona

130

Mam kilka danych JSON z postów na Facebooku, takich jak ten poniżej:

{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}

Dane JSON są częściowo ustrukturyzowane i nie są takie same. Poniżej mój kod:

import json 

str = '{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}'
data = json.loads(str)

post_id = data['id']
post_type = data['type']
print(post_id)
print(post_type)

created_time = data['created_time']
updated_time = data['updated_time']
print(created_time)
print(updated_time)

if data.get('application'):
    app_id = data['application'].get('id', 0)
    print(app_id)
else:
    print('null')

#if data.get('to'):
#... This is the part I am not sure how to do
# Since it is in the form "to": {"data":[{"id":...}]}

Chcę, aby kod wypisał to_id jako 1543, w przeciwnym razie wypisz 'null'

Nie wiem, jak to zrobić.

pravi
źródło

Odpowiedzi:

162
import json

jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    if 'to' not in data:
        raise ValueError("No target in given data")
    if 'data' not in data['to']:
        raise ValueError("No data for target")

    for dest in data['to']['data']:
        if 'id' not in dest:
            continue
        targetId = dest['id']
        print("to_id:", targetId)

Wynik:

In [9]: getTargetIds(s)
to_id: 1543
inspectorG4dget
źródło
6
Po co te jawne inkontrole i raisejeśli ich brakuje? Po prostu uzyskaj do niego dostęp bez sprawdzania, a otrzymasz dokładnie to samo zachowanie (z wyjątkiem a KeyErrorzamiast a ValueError).
abarnert
100

Jeśli chcesz tylko sprawdzić, czy klucz istnieje, czy nie

h = {'a': 1}
'b' in h # returns False

Jeśli chcesz sprawdzić, czy istnieje wartość klucza

h.get('b') # returns None

Zwróć wartość domyślną, jeśli brakuje rzeczywistej wartości

h.get('b', 'Default value')
Athap
źródło
zwróci „null”, a nie „Wartość domyślną”, jak oczekiwano dla b w przypadku {'a': 1, 'b': null}
MikeL
16

Dobrą praktyką jest tworzenie pomocniczych metod narzędziowych do takich rzeczy, aby za każdym razem, gdy trzeba zmienić logikę walidacji atrybutów, znajdowałoby się to w jednym miejscu, a kod byłby bardziej czytelny dla obserwujących.

Na przykład utwórz metodę pomocniczą (lub klasę JsonUtilsz metodami statycznymi) w json_utils.py:

def get_attribute(data, attribute, default_value):
    return data.get(attribute) or default_value

a następnie użyj go w swoim projekcie:

from json_utils import get_attribute

def my_cool_iteration_func(data):

    data_to = get_attribute(data, 'to', None)
    if not data_to:
        return

    data_to_data = get_attribute(data_to, 'data', [])
    for item in data_to_data:
        print('The id is: %s' % get_attribute(item, 'id', 'null'))

WAŻNA UWAGA:

Jest powód, dla którego używam data.get(attribute) or default_valuezamiast po prostu data.get(attribute, default_value):

{'my_key': None}.get('my_key', 'nothing') # returns None
{'my_key': None}.get('my_key') or 'nothing' # returns 'nothing'

W moich aplikacjach uzyskanie atrybutu o wartości „null” jest tym samym, co jego całkowity brak. Jeśli Twoje użycie jest inne, musisz to zmienić.

MikeL
źródło
4
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}, {"name": "Joe Schmoe"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        print("to_id:", dest.get('id', 'null'))

Spróbuj:

>>> getTargetIds(jsonData)
to_id: 1543
to_id: null

Lub, jeśli chcesz po prostu pominąć wartości brakujących identyfikatorów zamiast drukowania 'null':

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        if 'id' in to_id:
            print("to_id:", dest['id'])

Więc:

>>> getTargetIds(jsonData)
to_id: 1543

Oczywiście w prawdziwym życiu prawdopodobnie nie chcesz printkażdego identyfikatora, ale przechowywać je i coś z nimi robić, ale to inna sprawa.

abarnert
źródło
4
if "my_data" in my_json_data:
         print json.dumps(my_json_data["my_data"])
Ajit Surendran
źródło
4

W tym celu napisałem małą funkcję. Zapraszam do zmiany przeznaczenia,

def is_json_key_present(json, key):
    try:
        buf = json[key]
    except KeyError:
        return False

    return True
tabdiukov
źródło