Mam taką kolumnę w mojej ramce danych: range "(2,30)" "(50,290)" "(400,1000)" ... i chcę zamienić ,przecinek na -myślnik. Obecnie używam tej metody, ale nic się nie zmienia. org_info_exc['range'].replace(',', '-', inplace=True) Czy ktoś może pomóc?
Mam taką kolumnę w mojej ramce danych: range "(2,30)" "(50,290)" "(400,1000)" ... i chcę zamienić ,przecinek na -myślnik. Obecnie używam tej metody, ale nic się nie zmienia. org_info_exc['range'].replace(',', '-', inplace=True) Czy ktoś może pomóc?
Pracuję z tym DataFrame Pandas w Pythonie. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 NoY 45 21 2 YesZ 40 54 3 YesQ 84 N/A 3 NoR 67 N/A 3 YesA 94 N/A 3 NoT...
Mam ramkę danych z kolumną jako ciągiem. Chciałem zmienić typ kolumny na Double type w PySpark. Oto droga, którą zrobiłem: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Chciałem tylko wiedzieć, czy to...
Jestem trochę nowy w pandach. Mam ramkę danych pandy, która ma 1 wiersz na 23 kolumny. Chcę przekształcić to w serię? Zastanawiam się, jaki jest najbardziej pytoniczny sposób na zrobienie tego? Próbowałem, pd.Series(myResults)ale narzeka ValueError: cannot copy sequence with size 23 to array...
Chciałbym przesunąć kolumnę w Pandach DataFrame, ale nie udało mi się znaleźć metody na zrobienie tego z dokumentacji bez przepisywania całego DF. Czy ktoś wie, jak to zrobić? Ramka danych: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Pożądane wyjście: ## x1 x2 ##0 206...
Chcę, aby wszystkie nagłówki kolumn w moich ramkach danych pandy były małymi literami Przykład Jeśli mam: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Chciałbym...
Mam stolik x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Chcę zamienić Pythona None na pandy NaN. Próbowałem: x.replace(to_replace=None, value=np.nan) Ale dostałem: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or...
W zbiorze danych z wieloma obserwacjami dla każdego przedmiotu chcę wziąć podzbiór zawierający tylko maksymalną wartość danych dla każdego rekordu. Na przykład z następującym zestawem danych: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group...
Chcę tworzyć dalej DataFramez określonym schematem w Scali. Próbowałem użyć odczytu JSON (mam na myśli czytanie pustego pliku), ale nie sądzę, że to najlepsza praktyka.
W Pandas, kiedy wybieram etykietę, która ma tylko jeden wpis w indeksie, otrzymuję z powrotem serię, ale kiedy wybieram wpis, który ma więcej niż jeden wpis, otrzymuję ramkę danych. Dlaczego? Czy istnieje sposób, aby zawsze odzyskać ramkę danych? In [1]: import pandas as pd In [2]: df =...
Mam ramkę danych z kilkoma kolumnami takimi jak ta: A B C 0 4 5 6 7 7 6 5 Dopuszczalny zakres wartości w tylko od 0 do 7 . Mam też listę 8 elementów, takich jak ta: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Jeśli element w kolumnie A to n , muszę wstawić n- ty...
Mam ramkę danych pandy i chciałbym wykreślić wartości z jednej kolumny w porównaniu z wartościami z innej kolumny. Na szczęście istnieje plotmetoda związana z ramkami danych, która wydaje się robić to, czego potrzebuję: df.plot(x='col_name_1', y='col_name_2') Niestety wygląda na to, że wśród...
Mam następującą ramkę danych: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Wymagać: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23...
Mamy ramkę danych z pliku CSV. Ramka danych DFzawiera kolumny zawierające zaobserwowane wartości i kolumnę ( VaR2) zawierającą datę wykonania pomiaru. Jeśli data nie została zarejestrowana, plik CSV zawiera wartość NAdla brakujących danych. Var1 Var2 10 2010/01/01 20 NA 30...
Chcę zamienić komórkę pandy zawierającą listę w wiersze dla każdej z tych wartości. Więc weź to: Jeśli chciałbym rozpakować i ułożyć wartości w nearest_neighborskolumnie, tak aby każda wartość była wierszem w każdym opponentindeksie, jak najlepiej się do tego zabrać? Czy istnieją metody...
Próbuję przekonwertować wszystkie nagłówki / nazwy kolumn DataFramew Spark-Scala. na razie wymyślam następujący kod, który zastępuje tylko jedną nazwę kolumny. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }...
Witam mam następującą ramkę danych. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Chcę policzyć, ile razy ten sam wiersz pojawia się w ramce danych. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1...
Mam bardzo dużą ramkę danych (około 1 miliona wierszy) z danymi z eksperymentu (60 respondentów). Chciałbym podzielić ramkę danych na 60 ramek danych (po jednej dla każdego uczestnika). W ramce danych dataznajduje się zmienna o nazwie 'name', która jest unikalnym kodem dla każdego...
Byłem bardzo zdezorientowany, jak definiowane są osie Pythona i czy odnoszą się do wierszy czy kolumn DataFrame. Rozważ poniższy kod: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1...
Mam SF z serii Pandas: email [email protected] [1.0, 0.0, 0.0] [email protected] [2.0, 0.0, 0.0] [email protected] [1.0, 0.0, 0.0] [email protected] [4.0, 0.0, 0.0] [email protected] [1.0, 0.0, 3.0] [email protected] [1.0, 5.0, 0.0] Chciałbym przekształcić go w następującą ramkę DataFrame: index |...