Pytania oznaczone «pandas»

187
Dodaj kolumnę do ramki danych o stałej wartości

Mam istniejącą ramkę danych, którą muszę dodać dodatkową kolumnę, do której będzie zawierać tę samą wartość dla każdego wiersza. Istniejące df: Date, Open, High, Low, Close 01-01-2015, 565, 600, 400, 450 Nowy plik df: Name, Date, Open, High, Low, Close abc, 01-01-2015, 565, 600, 400, 450 Wiem,...

184
pandy ponownie próbkują dokumentację

Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie wykonuje dobrej roboty wyjaśniającej opcje. Dlatego większość opcji w tej resamplefunkcji jest dość prosta, z wyjątkiem tych dwóch: reguła: ciąg przesunięcia lub obiekt reprezentujący konwersję celu jak: ciąg, metoda pobierania...

179
Konwertuj kolumny na ciąg w pandach

Mam następującą ramkę DataFrame z zapytania SQL: (Pdb) pp total_rows ColumnID RespondentCount 0 -1 2 1 3030096843 1 2 3030096845 1 i chcę to obrócić w ten sposób: total_data = total_rows.pivot_table(cols=['ColumnID']) (Pdb) pp total_data ColumnID -1 3030096843 3030096845 RespondentCount 2 1...

177
Pobieranie listy list do pand DataFrame

Czytam zawartość arkusza kalkulacyjnego na pandy. DataNitro ma metodę, która zwraca prostokątną selekcję komórek jako listę list. Więc table = Cell("A1").table daje table = [['Heading1', 'Heading2'], [1 , 2], [3, 4]] headers = table.pop(0) # gives the headers as list and leaves data Jestem...

177
pandy DataFrame: zamień wartości nan na średnią z kolumn

Mam pandy DataFrame wypełnione głównie liczbami rzeczywistymi, ale jest nanw niej również kilka wartości. Jak mogę zamienić nans na średnie z kolumn tam, gdzie się znajdują? To pytanie jest bardzo podobne do tego: numpy array: zamień wartości nan na średnią z kolumn, ale niestety podane tam...

175
Jak zdobyć ostatnie N rzędów pandy DataFrame?

Mam pandas dataframe df1i df2(df1 to vanila dataframe, df2 jest indeksowana przez „STK_ID” i „RPT_Date”): >>> df1 STK_ID RPT_Date TClose sales discount 0 000568 20060331 3.69 5.975 NaN 1 000568 20060630 9.14 10.143 NaN 2 000568 20060930 9.49 13.854 NaN 3 000568 20061231 15.84 19.262...

175
Przekonwertuj kolumnę Pandy zawierającą NaN na dtype „int”

Czytam dane z pliku .csv do ramki danych Pandas, jak poniżej. W przypadku jednej z kolumn idchcę określić typ kolumny jako int. Problem polega na tym, że idseria ma brakujące / puste wartości. Kiedy próbuję rzutować idkolumnę na liczbę całkowitą podczas czytania pliku .csv, otrzymuję: df=...

174
Zastosuj vs przekształć w obiekcie grupy

Rozważmy następującą ramkę danych: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Działają...

171
pandy loc, iloc, ix, at, iat?

Niedawno zacząłem rozgałęziać się z mojego bezpiecznego miejsca (R) do Pythona i jestem trochę zdezorientowany lokalizacją / wyborem komórki w Pandas. Przeczytałem dokumentację, ale staram się zrozumieć praktyczne konsekwencje różnych opcji lokalizacji / wyboru. Czy jest jakiś powód, dla którego...

171
Jak zapisać wykres Seaborn do pliku

Wypróbowałem następujący kod ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig =

170
Jak wydrukować pandy DataFrame bez indeksu

Chcę wydrukować całą ramkę danych, ale nie chcę drukować indeksu Poza tym jedna kolumna to typ daty i godziny, chcę tylko wydrukować godzinę, a nie datę. Ramka danych wygląda następująco: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123...