Pytania oznaczone «pandas»

93

Python Pandas: jak czytać tylko pierwsze n wierszy plików CSV?

Mam bardzo duży zestaw danych i nie mogę sobie pozwolić na wczytanie całego zestawu danych. Myślę więc o przeczytaniu tylko jednego fragmentu do treningu, ale nie mam pojęcia, jak to zrobić. Każda myśl zostanie doceniona.

93

Sortuj ramkę danych Pandas według daty

Mam następującą ramkę danych pandy: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Chcę to posortować według Date, ale kolumna to tylko plik object. Próbowałem ustawić kolumnę jako obiekt daty, ale napotkałem problem, w którym ten format nie jest wymagany. Potrzebny format to...

python pandas

93

Python Pandy: grupowanie według grup według i średniej?

Mam taką ramkę danych: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Chciałbym obliczyć średni czas na organizację na klaster. Spodziewany wynik: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 Nie wiem, jak to zrobić w Pandach, czy ktoś może pomóc?...

python pandas group-by mean

93

Python: uzyskaj liczbę częstotliwości na podstawie dwóch kolumn (zmiennych) w pandach dataframe niektórych aplikacji wierszowych

Witam mam następującą ramkę danych. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Chcę policzyć, ile razy ten sam wiersz pojawia się w ramce danych. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...

python pandas group-by dataframe

93

Ostrzeżenie użytkownika Python Pandas: sortowanie, ponieważ oś bez konkatenacji nie jest wyrównana

Robię trochę praktyki w kodzie i stosuję scalanie ramek danych, robiąc to, otrzymując ostrzeżenie użytkownika /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: Sortowanie, ponieważ oś niezwiązana z konkatenacją nie jest wyrównana. Przyszła wersja pand zmieni się...

python pandas

92

Pandy Pythona: Zachowaj wybraną kolumnę jako DataFrame zamiast Series

Po wybraniu pojedynczej kolumny z pandy DataFrame (powiedzmy df.iloc[:, 0], df['A']lub df.A, itp.), Wynikowy wektor jest automatycznie konwertowany na Series zamiast na pojedynczą kolumnę DataFrame. Jednak piszę niektóre funkcje, które przyjmują DataFrame jako argument wejściowy. Dlatego wolę...

python pandas

92

Dzielenie ramki danych na wiele ramek danych

Mam bardzo dużą ramkę danych (około 1 miliona wierszy) z danymi z eksperymentu (60 respondentów). Chciałbym podzielić ramkę danych na 60 ramek danych (po jednej dla każdego uczestnika). W ramce danych dataznajduje się zmienna o nazwie 'name', która jest unikalnym kodem dla każdego...

python split pandas dataframe

92

Grupa Pandy według zakresu wartości

Czy w pandach istnieje łatwa metoda wywoływania groupbyz zakresu przyrostów wartości? Na przykład, biorąc pod uwagę poniższy przykład, mogę podzielić i pogrupować kolumnę Bz 0.155przyrostem, aby na przykład pierwsza para grup w kolumnie była Bpodzielona na zakresy między '0 - 0,155, 0,155 - 0,31...

python group-by pandas

92

Niejednoznaczność w definicji „osi” Pandas Dataframe / Numpy Array

Byłem bardzo zdezorientowany, jak definiowane są osie Pythona i czy odnoszą się do wierszy czy kolumn DataFrame. Rozważ poniższy kod: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1...

python arrays pandas numpy dataframe

92

Konwertuj serie pandy na DataFrame

Mam SF z serii Pandas: email [email protected] [1.0, 0.0, 0.0] [email protected] [2.0, 0.0, 0.0] [email protected] [1.0, 0.0, 0.0] [email protected] [4.0, 0.0, 0.0] [email protected] [1.0, 0.0, 3.0] [email protected] [1.0, 5.0, 0.0] Chciałbym przekształcić go w następującą ramkę DataFrame: index |...

python pandas dataframe series

92

Połącz ciągi z kilku wierszy przy użyciu Pandas Groupby

Chcę scalić kilka ciągów w ramce danych opartej na zgrupowaniu w Pandas. To jest mój kod do tej pory: import pandas as pd from io import StringIO data =

python-3.x pandas pandas-groupby

92

Ładowanie pliku z więcej niż jedną linią JSON do Pandas

Próbuję wczytać w pliku JSON do ramki danych Python pandas (0.14.0). Oto pierwsza linia pliku JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical...

python json python-2.7 pandas

92

Jakie są wady i zalety między get_dummies (Pandy) a OneHotEncoder (Scikit-learn)?

Uczę się różnych metod konwersji zmiennych kategorialnych na numeryczne dla klasyfikatorów uczenia maszynowego. Natknąłem się na tę pd.get_dummiesmetodę i sklearn.preprocessing.OneHotEncoder()chciałem zobaczyć, jak różnią się pod względem wydajności i użytkowania. Znalazłem poradnik, jak używać...

python pandas machine-learning scikit-learn dummy-variable

91

Importuj plik CSV jako pandas DataFrame

W jaki sposób Python odczytuje plik CSV do pandy DataFrame (której mogę następnie użyć do operacji statystycznych, może mieć kolumny z innym typem itp.)? Mój plik CSV "value.txt"ma następującą

python pandas csv dataframe

91

kolumny dataframe python pandas są konwertowane na klucz i wartość dict

Mam ramkę danych pandy z wieloma kolumnami i chciałbym skonstruować dyktę z dwóch kolumn: jednej jako kluczy dykta, a drugiej jako wartości dyktu. Jak mogę to zrobić? Ramka danych: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 Muszę zdefiniować obszar jako klucz, liczyć...

python pandas dataframe dictionary data-conversion

91

wybierając spośród pand o wielu indeksach

Mam ramkę danych z wieloma indeksami z kolumnami „A” i „B”. Czy istnieje sposób na wybranie wierszy przez filtrowanie według jednej kolumny z wieloma indeksami bez resetowania indeksu do indeksu jednej kolumny? Na przykład. # has multi-index (A,B) df #can I do this? I know this doesn't work...

python pandas dataframe multi-index

91

Łączenie ramek danych pandy według nazw kolumn

Mam dwie ramki danych z następującymi nazwami kolumn: frame_1: event_id, date, time, county_ID frame_2: countyid, state Chciałbym uzyskać ramkę danych z następującymi kolumnami, dołączając (po lewej) na county_ID = countyid: joined_dataframe event_id, date, time, county, state Nie wiem,...

python pandas dataframe

91

Jak posortować Pandas DataFrame według indeksu?

Gdy istnieje DataFrame, jak poniżej: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Jak mogę posortować tę ramkę danych według indeksu z nienaruszoną każdą kombinacją indeksu i wartości kolumny?

python pandas

91

Czytanie pliku rozdzielanego tabulatorami za pomocą Pandas - działa w systemie Windows, ale nie na Macu

Czytałem plik danych rozdzielany tabulatorami w systemie Windows z Pandas / Python bez żadnych problemów. Plik danych zawiera uwagi w pierwszych trzech wierszach, a następnie zawiera nagłówek. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) Teraz próbuję odczytać ten plik na...

python macos pandas import tab-delimited

91

Gdzie jest dokumentacja dotycząca tagów „Freq” Pandas? [Zamknięte]

Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 2 lata temu . Popraw to pytanie...

python pandas documentation dataframe frequency