Pytania oznaczone «dataframe»

103

Jak zamienić tekst w kolumnie ramki danych Pandas?

Mam taką kolumnę w mojej ramce danych: range "(2,30)" "(50,290)" "(400,1000)" ... i chcę zamienić ,przecinek na -myślnik. Obecnie używam tej metody, ale nic się nie zmienia. org_info_exc['range'].replace(',', '-', inplace=True) Czy ktoś może pomóc?

103

Python Pandas zamienia NaN w jednej kolumnie wartością z odpowiedniego wiersza drugiej kolumny

Pracuję z tym DataFrame Pandas w Pythonie. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 NoY 45 21 2 YesZ 40 54 3 YesQ 84 N/A 3 NoR 67 N/A 3 YesA 94 N/A 3 NoT...

python pandas dataframe nan fillna

102

jak zmienić kolumnę Dataframe z typu String na typ Double w pyspark

Mam ramkę danych z kolumną jako ciągiem. Chciałem zmienić typ kolumny na Double type w PySpark. Oto droga, którą zrobiłem: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Chciałem tylko wiedzieć, czy to...

python apache-spark dataframe pyspark apache-spark-sql

102

Konwertuj ramkę danych pandy na serię

Jestem trochę nowy w pandach. Mam ramkę danych pandy, która ma 1 wiersz na 23 kolumny. Chcę przekształcić to w serię? Zastanawiam się, jaki jest najbardziej pytoniczny sposób na zrobienie tego? Próbowałem, pd.Series(myResults)ale narzeka ValueError: cannot copy sequence with size 23 to array...

python pandas dataframe series

101

Jak przesunąć kolumnę w Pandas DataFrame

Chciałbym przesunąć kolumnę w Pandach DataFrame, ale nie udało mi się znaleźć metody na zrobienie tego z dokumentacji bez przepisywania całego DF. Czy ktoś wie, jak to zrobić? Ramka danych: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Pożądane wyjście: ## x1 x2 ##0 206...

python pandas dataframe

101

Jak mogę zmienić nagłówki kolumn Dataframe pandas na małe litery?

Chcę, aby wszystkie nagłówki kolumn w moich ramkach danych pandy były małymi literami Przykład Jeśli mam: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Chciałbym...

python pandas dataframe

101

Zastąp None na NaN w pandas dataframe

Mam stolik x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Chcę zamienić Pythona None na pandy NaN. Próbowałem: x.replace(to_replace=None, value=np.nan) Ale dostałem: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or...

pandas dataframe replace nan nonetype

100

Jak wybrać wiersz z maksymalną wartością w każdej grupie

W zbiorze danych z wieloma obserwacjami dla każdego przedmiotu chcę wziąć podzbiór zawierający tylko maksymalną wartość danych dla każdego rekordu. Na przykład z następującym zestawem danych: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group...

r dataframe r-faq

99

Jak stworzyć pustą ramkę DataFrame z określonym schematem?

Chcę tworzyć dalej DataFramez określonym schematem w Scali. Próbowałem użyć odczytu JSON (mam na myśli czytanie pustego pliku), ale nie sądzę, że to najlepsza praktyka.

scala apache-spark dataframe apache-spark-sql

98

Pandy wybierające według etykiety czasami zwracają Series, czasami zwracają DataFrame

W Pandas, kiedy wybieram etykietę, która ma tylko jeden wpis w indeksie, otrzymuję z powrotem serię, ale kiedy wybieram wpis, który ma więcej niż jeden wpis, otrzymuję ramkę danych. Dlaczego? Czy istnieje sposób, aby zawsze odzyskać ramkę danych? In [1]: import pandas as pd In [2]: df =...

python pandas dataframe slice series

98

Dodaj kolumnę w ramce danych z listy

Mam ramkę danych z kilkoma kolumnami takimi jak ta: A B C 0 4 5 6 7 7 6 5 Dopuszczalny zakres wartości w tylko od 0 do 7 . Mam też listę 8 elementów, takich jak ta: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Jeśli element w kolumnie A to n , muszę wstawić n- ty...

python pandas dataframe

97

Jak wykreślić dwie kolumny ramki danych pandy za pomocą punktów?

Mam ramkę danych pandy i chciałbym wykreślić wartości z jednej kolumny w porównaniu z wartościami z innej kolumny. Na szczęście istnieje plotmetoda związana z ramkami danych, która wydaje się robić to, czego potrzebuję: df.plot(x='col_name_1', y='col_name_2') Niestety wygląda na to, że wśród...

python matplotlib plot pandas dataframe

97

Czy w Pandas jest sposób na użycie wartości poprzedniego wiersza w dataframe.apply, gdy poprzednia wartość jest również obliczana w Apply?

Mam następującą ramkę danych: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Wymagać: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23...

python pandas dataframe for-loop iteration

96

Podzbiór wierszy zawierających wartości NA (brakujące) w wybranej kolumnie ramki danych

Mamy ramkę danych z pliku CSV. Ramka danych DFzawiera kolumny zawierające zaobserwowane wartości i kolumnę ( VaR2) zawierającą datę wykonania pomiaru. Jeśli data nie została zarejestrowana, plik CSV zawiera wartość NAdla brakujących danych. Var1 Var2 10 2010/01/01 20 NA 30...

r csv dataframe subset na

95

Jak rozbić listę w komórce Dataframe na oddzielne wiersze

Chcę zamienić komórkę pandy zawierającą listę w wiersze dla każdej z tych wartości. Więc weź to: Jeśli chciałbym rozpakować i ułożyć wartości w nearest_neighborskolumnie, tak aby każda wartość była wierszem w każdym opponentindeksie, jak najlepiej się do tego zabrać? Czy istnieją metody...

python pandas dataframe

93

Zmienianie nazw kolumn DataFrame w Spark Scala

Próbuję przekonwertować wszystkie nagłówki / nazwy kolumn DataFramew Spark-Scala. na razie wymyślam następujący kod, który zastępuje tylko jedną nazwę kolumny. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }...

scala apache-spark dataframe apache-spark-sql

93

Python: uzyskaj liczbę częstotliwości na podstawie dwóch kolumn (zmiennych) w pandach dataframe niektórych aplikacji wierszowych

Witam mam następującą ramkę danych. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Chcę policzyć, ile razy ten sam wiersz pojawia się w ramce danych. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...

python pandas group-by dataframe

92

Dzielenie ramki danych na wiele ramek danych

Mam bardzo dużą ramkę danych (około 1 miliona wierszy) z danymi z eksperymentu (60 respondentów). Chciałbym podzielić ramkę danych na 60 ramek danych (po jednej dla każdego uczestnika). W ramce danych dataznajduje się zmienna o nazwie 'name', która jest unikalnym kodem dla każdego...

python split pandas dataframe

92

Niejednoznaczność w definicji „osi” Pandas Dataframe / Numpy Array

Byłem bardzo zdezorientowany, jak definiowane są osie Pythona i czy odnoszą się do wierszy czy kolumn DataFrame. Rozważ poniższy kod: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1...

python arrays pandas numpy dataframe

92

Konwertuj serie pandy na DataFrame

Mam SF z serii Pandas: email [email protected] [1.0, 0.0, 0.0] [email protected] [2.0, 0.0, 0.0] [email protected] [1.0, 0.0, 0.0] [email protected] [4.0, 0.0, 0.0] [email protected] [1.0, 0.0, 3.0] [email protected] [1.0, 5.0, 0.0] Chciałbym przekształcić go w następującą ramkę DataFrame: index |...

python pandas dataframe series