Używając Python Pandas próbuję znaleźć Country& Placeo maksymalnej wartości. Zwraca maksymalną wartość: data.groupby(['Country','Place'])['Value'].max() Ale jak mogę uzyskać odpowiedni Countryi
Używając Python Pandas próbuję znaleźć Country& Placeo maksymalnej wartości. Zwraca maksymalną wartość: data.groupby(['Country','Place'])['Value'].max() Ale jak mogę uzyskać odpowiedni Countryi
Próbuję uzyskać dostęp do indeksu wiersza w funkcji stosowanej w całej DataFramePandas. Mam coś takiego: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 i zdefiniuję funkcję, która ma dostęp do elementów z podanym wierszem def...
Powiedzmy, że dfjest to DataFrame pandy. Chciałbym znaleźć wszystkie kolumny typu liczbowego. Coś jak: isNumeric =
Używam pand, aby pisać do pliku Excela w następujący sposób: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx zawiera już kilka różnych zakładek. Jednak nie zawiera jeszcze „Main”. Pandy...
Więc mój zbiór danych zawiera pewne informacje według lokalizacji dla n dat. Problem polega na tym, że każda data jest w rzeczywistości innym nagłówkiem kolumny. Na przykład CSV wygląda jak location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Chciałbym, żeby to...
Czy jest jakaś funkcja, która byłaby odpowiednikiem kombinacji df.isin()i df[col].str.contains()? Na przykład, powiedzmy, że mam serię s = pd.Series(['cat','hat','dog','fog','pet'])i chcę znaleźć wszystkie miejsca, w których szawiera którekolwiek z ['og', 'at'], chciałbym uzyskać wszystko oprócz...
Muszę zmieścić RandomForestRegressorod sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Ten kod zawsze działał, dopóki nie wykonałem wstępnego przetwarzania danych ( train_y). Komunikat o...
Jestem zdezorientowany regułami używanymi przez Pandas, gdy decyduję, że wybór z ramki danych jest kopią oryginalnej ramki danych lub widokiem oryginału. Jeśli mam na przykład df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Rozumiem, że queryzwraca kopię tak,...
Myślę, że to powinno być proste, ale wypróbowałem kilka pomysłów i żaden z nich nie zadziałał: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Próbowałem używać wskaźników ujemnych, ale to również prowadziło do błędów. Nadal nie rozumiem czegoś podstawowego....
Chciałbym dołączyć ciąg na początku każdej wartości we wspomnianej kolumnie ramki danych pandy (elegancko). Dowiedziałem się już, jak to zrobić i obecnie używam: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Wydaje się to cholernie nieeleganckie - czy znasz inny...
Kiedy uruchamiam program, Pandas za każdym razem wyświetla „Ostrzeżenie o przyszłości”, jak poniżej. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Otrzymałem...
Chcę znaleźć wiersze zawierające ciąg, na przykład: DF[DF.col.str.contains("foo")] Jednak to się nie udaje, ponieważ niektóre elementy są NaN: Błąd wartości: nie można indeksować wektorem zawierającym wartości NA / NaN Więc uciekam się do
Oto mój kod: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Po uruchomieniu tego kodu pojawia się następujący błąd: Traceback (most recent call last): File
Każda pomoc w tym problemie będzie bardzo mile widziana. Zasadniczo chcę uruchomić zapytanie do mojej bazy danych SQL i zapisać zwrócone dane jako strukturę danych Pandas. Załączam kod do zapytania. Czytam dokumentację dotyczącą Pand, ale mam problem ze zidentyfikowaniem typu zwracanego...
Zmagam się z pozornie bardzo prostą rzeczą, mam ramkę danych pandy zawierającą bardzo długi ciąg. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Teraz, gdy próbuję wydrukować to samo, nie widzę całego ciągu, widzę...
Łatwo jest zmienić listę list w ramkę danych pandy: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Ale jak zmienić df z powrotem w listę list? lol = df.what_to_do_now? print lol #
Mam taki arkusz kalkulacyjny: Locality 2005 2006 2007 2008 2009 ABBOTSFORD 427000 448000 602500 600000 638500 ABERFELDIE 534000 600000 735000 710000 775000 AIREYS INLET459000 440000 430000 517500 512500 Nie chcę ręcznie zamieniać kolumny z wierszem. Czy byłoby możliwe użycie pand odczytujących...
Jak mogę wydrukować ramkę danych pandy jako ładną tabelę tekstową, jak poniżej? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD...
Mam istniejącą działkę, która została utworzona z pandami takimi jak ta: df['myvar'].plot(kind='bar') Oś y ma format zmiennoprzecinkowy i chcę zmienić oś y na wartości procentowe. Wszystkie rozwiązania, które znalazłem, używają składni ax.xyz i mogę umieścić kod tylko poniżej linii powyżej, która...
Powiedzmy, że mam słownik z 10 parami klucz-wartość. Każdy wpis zawiera tablicę numpy. Jednak długość tablicy nie jest taka sama dla wszystkich. Jak mogę utworzyć ramkę danych, w której każda kolumna zawiera inny wpis? Kiedy próbuję: pd.DataFrame(my_dict) Dostaję: ValueError: arrays must all...