Pytania oznaczone «pandas»

362
Pandas Scalanie 101

Jak wykonać połączenie ( LEFT| RIGHT| FULL) ( INNER| OUTER) z pandami? Jak dodać NaN dla brakujących wierszy po scaleniu? Jak pozbyć się NaN po połączeniu? Czy mogę scalić indeks? Połącz krzyżowo z pandami? Jak scalić wiele ramek danych? merge? join? concat? update? WHO? Co? Dlaczego?! ... i...

358
Jak obrócić ramkę danych

Co to jest oś obrotu? Jak się obracać? Czy to jest oś obrotu? Długi format do szerokiego formatu? Widziałem wiele pytań dotyczących tabel przestawnych. Nawet jeśli nie wiedzą, że pytają o tabele przestawne, zwykle tak są. Praktycznie niemożliwe jest napisanie kanonicznego pytania i odpowiedzi,...

345
Jak uzyskać wartość z komórki ramki danych?

Skonstruowałem warunek, który wyodrębnia dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Teraz chciałbym wziąć wartość z konkretnej kolumny: val = d2['col_name'] Ale w rezultacie otrzymuję ramkę danych,...

343
Python Pandas Błąd tokenizacji danych

Próbuję użyć pand do manipulowania plikiem .csv, ale otrzymuję ten błąd: pandas.parser.CParserError: Błąd tokenizacji danych. Błąd C: Oczekiwano 2 pól w linii 3, patrz 12 Próbowałem czytać dokumenty pand, ale nic nie znalazłem. Mój kod jest prosty: path = 'GOOG Key...

329
pandy: filtruj wiersze DataFrame z łańcuchem operatorów

Większość operacji w pandasmoże być dokonany z operatorem łączenia ( groupby, aggregate, applyitp), ale jedynym sposobem mam stwierdzono rzędów filtrów odbywa się za pomocą zwykłego zamka indeksowania df_filtered = df[df['column'] == value] Jest to nieprzyjemne, ponieważ wymaga przypisania dfdo...

320
Pandas read_csv low_memory i dtype opcje

Dzwoniąc df = pd.read_csv('somefile.csv') Dostaję: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Kolumny (4,5,7,16) mają różne typy. Podaj opcję dtype podczas importu lub ustaw low_memory = False. Dlaczego dtypeopcja jest powiązana...

317
Jak przechowywać ramkę danych za pomocą Pand

Obecnie CSVza każdym razem, gdy uruchamiam skrypt, importuję dość dużą ramkę danych. Czy istnieje dobre rozwiązanie, aby utrzymywać tę ramkę danych stale dostępną między uruchomieniami, aby nie musiałem spędzać całego czasu na czekaniu na uruchomienie

314
Pandy warunkowe tworzenie kolumny serii / ramki danych

Mam ramkę danych w następujący sposób: Type Set 1 A Z 2 B Z 3 B X 4 C Y Chcę dodać kolejną kolumnę do ramki danych (lub wygenerować serię) o tej samej długości co ramka danych (= równa liczba rekordów / wierszy), która ustawia kolor zielony, jeśli zestaw = „Z” i „czerwony”, jeśli zestaw =...

300
Pandy - Uzyskaj wartość pierwszego wiersza danej kolumny

To wydaje się śmieszne pytanie ... ale nie widzę łatwej odpowiedzi, której się spodziewałem. Jak więc uzyskać wartość w n-tym wierszu danej kolumny w Pandach? (Jestem szczególnie zainteresowany pierwszym rzędem, ale chciałbym również bardziej ogólnej praktyki). Załóżmy na przykład, że chcę pobrać...

299
Konwertuj dict Pythona na ramkę danych

Mam słownik Python, taki jak poniżej: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390,...

289
Pandy liczą (wyraźne) odpowiedniki

Używam pand jako zamiennika bazy danych, ponieważ mam wiele baz danych (Oracle, mssql itp.) I nie jestem w stanie wykonać sekwencji poleceń do odpowiednika SQL. Mam tabelę załadowaną do DataFrame z niektórymi kolumnami: YEARMONTH, CLIENTCODE, SIZE, .... etc etc W SQL, policzenie liczby różnych...