Pytania oznaczone «pandas»

160
Usuń wszystkie zduplikowane wiersze w Python Pandas

pandas drop_duplicatesFunkcja jest wielki dla „uniquifying” do dataframe. Jednak jednym z argumentów słów kluczowych do przekazania jest take_last=Truelub take_last=False, podczas gdy chciałbym usunąć wszystkie wiersze, które są duplikatami w podzbiorze kolumn. czy to możliwe? A B C 0 foo 0 A 1...

159
Załaduj dane z txt za pomocą pand

Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę przechowywać je w tablicy, w której mam dostęp do każdego elementu. Teraz po prostu robię import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Jest to struktura pliku wejściowego: 1 0 2000.0...

159
Losowy wybór wierszy w ramce danych Pandas

Czy istnieje sposób na wybranie losowych wierszy z DataFrame w Pandas. W R, korzystając z pakietu samochodowego, jest przydatna funkcja, some(x, n)która jest podobna do head, ale w tym przykładzie wybiera losowo 10 wierszy z x. Przejrzałem również dokumentację dotyczącą wycinania i wydaje się, że...

158
Wskaźnik postępu podczas operacji pand

Regularnie wykonuję operacje na pandach na ramkach danych w ponad 15 milionach wierszy i chciałbym mieć dostęp do wskaźnika postępu dla poszczególnych operacji. Czy istnieje tekstowy wskaźnik postępu dla operacji pandy podziel-zastosuj-połącz? Na przykład w czymś

156
Jak ustalić, czy kolumna Pandas zawiera określoną wartość

Próbuję ustalić, czy w kolumnie Pandy znajduje się wpis, który ma określoną wartość. Próbowałem to zrobić if x in df['id']. Myślałem, że to działa, z wyjątkiem sytuacji, gdy podałem mu wartość, o której wiedziałem, że nie ma w kolumnie 43 in df['id'], nadal zwracała True. Kiedy podzbiorę na ramkę...

156
Wyszukaj „nie zawiera” w DataFrame w pandach

Zrobiłem kilka poszukiwań i nie mogę dowiedzieć się, jak filtrować ramkę danych df["col"].str.contains(word), jednak zastanawiam się, czy istnieje sposób na odwrócenie: filtruj ramkę danych według komplementu tego zestawu. np .: z efektem !(df["col"].str.contains(word)). Czy można to zrobić...

155
pandy otrzymują średnią / średnią w kolumnie

Nie mogę uzyskać średniej lub średniej kolumny w pandach. Mają ramkę danych. Żadna z rzeczy, które wypróbowałem poniżej, nie daje mi średniej z kolumnyweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3 624870 1987...

154
Znajdź indeks elementu w serii pandy

Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak mogę uzyskać indeks określonego elementu serii w pandach Pythona? (wystarczyłoby pierwsze wystąpienie) To znaczy, chciałbym coś takiego: import pandas as pd myseries = pd.Series([1,4,0,7,5],...

153
Pandy: suma wierszy DataFrame dla danych kolumn

Mam następującą ramkę DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Chciałbym dodać kolumnę 'e', która jest sumą kolumny 'a', 'b'i 'd'. Przeglądając fora,...

151
Czy pandy mogą automatycznie rozpoznawać daty?

Dziś pozytywnie zaskoczył mnie fakt, że pandy odczytując dane z pliku danych (np.) Potrafią rozpoznać typy wartości: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Przykładowo można to sprawdzić w ten sposób: for i, r in df.iterrows(): print type(r['col1']),...

150
Zastępowanie pustych wartości (spacji) NaN w pandach

Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04...