Mam bardzo duży zestaw danych i nie mogę sobie pozwolić na wczytanie całego zestawu danych. Myślę więc o przeczytaniu tylko jednego fragmentu do treningu, ale nie mam pojęcia, jak to zrobić. Każda myśl zostanie doceniona.
Mam bardzo duży zestaw danych i nie mogę sobie pozwolić na wczytanie całego zestawu danych. Myślę więc o przeczytaniu tylko jednego fragmentu do treningu, ale nie mam pojęcia, jak to zrobić. Każda myśl zostanie doceniona.
Mam następującą ramkę danych pandy: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Chcę to posortować według Date, ale kolumna to tylko plik object. Próbowałem ustawić kolumnę jako obiekt daty, ale napotkałem problem, w którym ten format nie jest wymagany. Potrzebny format to...
Mam taką ramkę danych: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Chciałbym obliczyć średni czas na organizację na klaster. Spodziewany wynik: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 Nie wiem, jak to zrobić w Pandach, czy ktoś może pomóc?...
Witam mam następującą ramkę danych. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Chcę policzyć, ile razy ten sam wiersz pojawia się w ramce danych. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...
Robię trochę praktyki w kodzie i stosuję scalanie ramek danych, robiąc to, otrzymując ostrzeżenie użytkownika /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: Sortowanie, ponieważ oś niezwiązana z konkatenacją nie jest wyrównana. Przyszła wersja pand zmieni się...
Po wybraniu pojedynczej kolumny z pandy DataFrame (powiedzmy df.iloc[:, 0], df['A']lub df.A, itp.), Wynikowy wektor jest automatycznie konwertowany na Series zamiast na pojedynczą kolumnę DataFrame. Jednak piszę niektóre funkcje, które przyjmują DataFrame jako argument wejściowy. Dlatego wolę...
Mam bardzo dużą ramkę danych (około 1 miliona wierszy) z danymi z eksperymentu (60 respondentów). Chciałbym podzielić ramkę danych na 60 ramek danych (po jednej dla każdego uczestnika). W ramce danych dataznajduje się zmienna o nazwie 'name', która jest unikalnym kodem dla każdego...
Czy w pandach istnieje łatwa metoda wywoływania groupbyz zakresu przyrostów wartości? Na przykład, biorąc pod uwagę poniższy przykład, mogę podzielić i pogrupować kolumnę Bz 0.155przyrostem, aby na przykład pierwsza para grup w kolumnie była Bpodzielona na zakresy między '0 - 0,155, 0,155 - 0,31...
Byłem bardzo zdezorientowany, jak definiowane są osie Pythona i czy odnoszą się do wierszy czy kolumn DataFrame. Rozważ poniższy kod: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1...
Mam SF z serii Pandas: email [email protected] [1.0, 0.0, 0.0] [email protected] [2.0, 0.0, 0.0] [email protected] [1.0, 0.0, 0.0] [email protected] [4.0, 0.0, 0.0] [email protected] [1.0, 0.0, 3.0] [email protected] [1.0, 5.0, 0.0] Chciałbym przekształcić go w następującą ramkę DataFrame: index |...
Chcę scalić kilka ciągów w ramce danych opartej na zgrupowaniu w Pandas. To jest mój kod do tej pory: import pandas as pd from io import StringIO data =
Próbuję wczytać w pliku JSON do ramki danych Python pandas (0.14.0). Oto pierwsza linia pliku JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical...
Uczę się różnych metod konwersji zmiennych kategorialnych na numeryczne dla klasyfikatorów uczenia maszynowego. Natknąłem się na tę pd.get_dummiesmetodę i sklearn.preprocessing.OneHotEncoder()chciałem zobaczyć, jak różnią się pod względem wydajności i użytkowania. Znalazłem poradnik, jak używać...
W jaki sposób Python odczytuje plik CSV do pandy DataFrame (której mogę następnie użyć do operacji statystycznych, może mieć kolumny z innym typem itp.)? Mój plik CSV "value.txt"ma następującą
Mam ramkę danych pandy z wieloma kolumnami i chciałbym skonstruować dyktę z dwóch kolumn: jednej jako kluczy dykta, a drugiej jako wartości dyktu. Jak mogę to zrobić? Ramka danych: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 Muszę zdefiniować obszar jako klucz, liczyć...
Mam ramkę danych z wieloma indeksami z kolumnami „A” i „B”. Czy istnieje sposób na wybranie wierszy przez filtrowanie według jednej kolumny z wieloma indeksami bez resetowania indeksu do indeksu jednej kolumny? Na przykład. # has multi-index (A,B) df #can I do this? I know this doesn't work...
Mam dwie ramki danych z następującymi nazwami kolumn: frame_1: event_id, date, time, county_ID frame_2: countyid, state Chciałbym uzyskać ramkę danych z następującymi kolumnami, dołączając (po lewej) na county_ID = countyid: joined_dataframe event_id, date, time, county, state Nie wiem,...
Gdy istnieje DataFrame, jak poniżej: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Jak mogę posortować tę ramkę danych według indeksu z nienaruszoną każdą kombinacją indeksu i wartości kolumny?
Czytałem plik danych rozdzielany tabulatorami w systemie Windows z Pandas / Python bez żadnych problemów. Plik danych zawiera uwagi w pierwszych trzech wierszach, a następnie zawiera nagłówek. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) Teraz próbuję odczytać ten plik na...
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 2 lata temu . Popraw to pytanie...