Pytania oznaczone «pandas»

160

Usuń wszystkie zduplikowane wiersze w Python Pandas

pandas drop_duplicatesFunkcja jest wielki dla „uniquifying” do dataframe. Jednak jednym z argumentów słów kluczowych do przekazania jest take_last=Truelub take_last=False, podczas gdy chciałbym usunąć wszystkie wiersze, które są duplikatami w podzbiorze kolumn. czy to możliwe? A B C 0 foo 0 A 1...

python pandas duplicates

159

Załaduj dane z txt za pomocą pand

Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę przechowywać je w tablicy, w której mam dostęp do każdego elementu. Teraz po prostu robię import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Jest to struktura pliku wejściowego: 1 0 2000.0...

python io pandas

159

Losowy wybór wierszy w ramce danych Pandas

Czy istnieje sposób na wybranie losowych wierszy z DataFrame w Pandas. W R, korzystając z pakietu samochodowego, jest przydatna funkcja, some(x, n)która jest podobna do head, ale w tym przykładzie wybiera losowo 10 wierszy z x. Przejrzałem również dokumentację dotyczącą wycinania i wydaje się, że...

python pandas

158

Jak zamienić NaNs przez poprzedzające wartości w pandas DataFrame?

Załóżmy, że mam DataFrame z kilkoma NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2 0 1 2 3 1 4 NaN NaN 2 NaN NaN 9 To, co muszę zrobić, to zastąpić każdy NaNpierwszym nie- NaNwartością w tej samej...

python python-3.x pandas dataframe nan

158

Wskaźnik postępu podczas operacji pand

Regularnie wykonuję operacje na pandach na ramkach danych w ponad 15 milionach wierszy i chciałbym mieć dostęp do wskaźnika postępu dla poszczególnych operacji. Czy istnieje tekstowy wskaźnik postępu dla operacji pandy podziel-zastosuj-połącz? Na przykład w czymś

python pandas ipython

157

Filtrowanie ramek danych Pandas według dat

Mam Pandas DataFrame z kolumną „data”. Teraz muszę odfiltrować wszystkie wiersze w DataFrame, które mają daty spoza najbliższych dwóch miesięcy. Zasadniczo muszę zachować tylko te wiersze, które są w ciągu najbliższych dwóch miesięcy. Jaki jest najlepszy sposób, aby to...

python datetime pandas filtering dataframe

156

Jak ustalić, czy kolumna Pandas zawiera określoną wartość

Próbuję ustalić, czy w kolumnie Pandy znajduje się wpis, który ma określoną wartość. Próbowałem to zrobić if x in df['id']. Myślałem, że to działa, z wyjątkiem sytuacji, gdy podałem mu wartość, o której wiedziałem, że nie ma w kolumnie 43 in df['id'], nadal zwracała True. Kiedy podzbiorę na ramkę...

python pandas

156

Wyszukaj „nie zawiera” w DataFrame w pandach

Zrobiłem kilka poszukiwań i nie mogę dowiedzieć się, jak filtrować ramkę danych df["col"].str.contains(word), jednak zastanawiam się, czy istnieje sposób na odwrócenie: filtruj ramkę danych według komplementu tego zestawu. np .: z efektem !(df["col"].str.contains(word)). Czy można to zrobić...

python pandas contains

155

Zamień Pandas Multi-Index w kolumnę

Mam ramkę danych z 2 poziomami indeksu: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Które chcę zamienić w to: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 1 12 3 0 34 Jak najlepiej to zrobić? Potrzebuję tego, ponieważ chcę zagregować dane zgodnie z...

python pandas dataframe flatten multi-index

155

pandy otrzymują średnią / średnią w kolumnie

Nie mogę uzyskać średniej lub średniej kolumny w pandach. Mają ramkę danych. Żadna z rzeczy, które wypróbowałem poniżej, nie daje mi średniej z kolumnyweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3 624870 1987...

python pandas

154

python dataframe pandy upuść kolumnę za pomocą int

Rozumiem, że aby upuścić kolumnę, należy użyć df.drop („nazwa kolumny”, oś = 1). Czy istnieje sposób na usunięcie kolumny przy użyciu indeksu liczbowego zamiast nazwy

python pandas dataframe

154

Jak uzyskać dostęp do pandas groupby dataframe według klucza

Jak uzyskać dostęp do odpowiedniej ramki danych typu groupby w obiekcie typu groupby za pomocą klucza? Z następującą grupą: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Mogę go iterować, aby...

python pandas dataframe group-by pandas-groupby

154

Znajdź indeks elementu w serii pandy

Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak mogę uzyskać indeks określonego elementu serii w pandach Pythona? (wystarczyłoby pierwsze wystąpienie) To znaczy, chciałbym coś takiego: import pandas as pd myseries = pd.Series([1,4,0,7,5],...

python pandas

153

Jaki jest najbardziej efektywny sposób tworzenia słownika dwóch pand kolumn Dataframe?

Jaki jest najskuteczniejszy sposób zorganizowania następujących pand Dataframe: data = Position Letter 1 a 2 b 3 c 4 d 5 e do słownika takiego jak alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

python dictionary pandas dataframe

153

Pandy: suma wierszy DataFrame dla danych kolumn

Mam następującą ramkę DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Chciałbym dodać kolumnę 'e', która jest sumą kolumny 'a', 'b'i 'd'. Przeglądając fora,...

python pandas dataframe sum

152

Operatory logiczne do indeksowania wartości logicznych w Pandach

Pracuję z indeksem boolowskim w Pandach. Pytanie brzmi, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] działa dobrze, podczas gdy a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] kończy pracę z...

python pandas dataframe boolean filtering

152

Jak pozbyć się kolumny „Unnamed: 0” w pandach DataFrame?

Mam sytuację, w której czasami, gdy czytam csvz df, otrzymuję niechcianą kolumnę o nazwie indeksowej unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 Plik CSV czyta się w ten sposób: pd.read_csv('file.csv') Unnamed: 0 A B C 0 0 1 2 3 1 1 4 5 6 2 2 7 8 9 To bardzo irytujące! Czy ktoś ma...

python pandas csv dataframe

151

Czy pandy mogą automatycznie rozpoznawać daty?

Dziś pozytywnie zaskoczył mnie fakt, że pandy odczytując dane z pliku danych (np.) Potrafią rozpoznać typy wartości: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Przykładowo można to sprawdzić w ten sposób: for i, r in df.iterrows(): print type(r['col1']),...

python date types dataframe pandas

151

Pandy tworzą puste ramki DataFrame zawierające tylko nazwy kolumn

Mam dynamiczną ramkę DataFrame, która działa dobrze, ale gdy nie ma żadnych danych do dodania do ramki DataFrame, pojawia się błąd. Dlatego potrzebuję rozwiązania, aby utworzyć pustą ramkę DataFrame z tylko nazwami kolumn. Na razie mam coś takiego: df = pd.DataFrame(columns=COLUMN_NAMES) # Note...

python pandas dataframe

150

Zastępowanie pustych wartości (spacji) NaN w pandach

Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04...

python pandas dataframe