W jaki sposób Python odczytuje plik CSV do pandy DataFrame (której mogę następnie użyć do operacji statystycznych, może mieć kolumny z innym typem itp.)? Mój plik CSV "value.txt"ma następującą
W jaki sposób Python odczytuje plik CSV do pandy DataFrame (której mogę następnie użyć do operacji statystycznych, może mieć kolumny z innym typem itp.)? Mój plik CSV "value.txt"ma następującą
Mam ramkę danych pandy z wieloma kolumnami i chciałbym skonstruować dyktę z dwóch kolumn: jednej jako kluczy dykta, a drugiej jako wartości dyktu. Jak mogę to zrobić? Ramka danych: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 Muszę zdefiniować obszar jako klucz, liczyć...
Mam ramkę danych z wieloma indeksami z kolumnami „A” i „B”. Czy istnieje sposób na wybranie wierszy przez filtrowanie według jednej kolumny z wieloma indeksami bez resetowania indeksu do indeksu jednej kolumny? Na przykład. # has multi-index (A,B) df #can I do this? I know this doesn't work...
Mam dwie ramki danych z następującymi nazwami kolumn: frame_1: event_id, date, time, county_ID frame_2: countyid, state Chciałbym uzyskać ramkę danych z następującymi kolumnami, dołączając (po lewej) na county_ID = countyid: joined_dataframe event_id, date, time, county, state Nie wiem,...
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 2 lata temu . Popraw to pytanie...
Mam DataFrame: from pandas import * df = DataFrame({'foo':['a','b','c'], 'bar':[1, 2, 3]}) To wygląda tak: bar foo 0 1 a 1 2 b 2 3 c Teraz chcę mieć coś takiego: bar 0 1 is a 1 2 is b 2 3 is c Jak mogę to osiągnąć? Próbowałem następujących rzeczy: df['foo'] = '%s is %s' % (df['bar'],...
Załóżmy, że mam zagnieżdżony słownik „user_dict” o strukturze: Poziom 1: UserId (długa liczba całkowita) Poziom 2: Kategoria (ciąg znaków) Poziom 3: różne atrybuty (liczby zmiennoprzecinkowe, liczby wewnętrzne itp.) Na przykład wpis w tym słowniku wyglądałby tak: user_dict[12] = {...
Mam ramkę danych zawierającą kolumny a, b i c. Chciałbym dodać nową kolumnę d między b i c. Wiem, że mógłbym po prostu dodać d na końcu, używając cbind, ale jak mogę wstawić go między dwie kolumny?
Mając ramkę danych, jak mam zastąpić wszystkie określone wartości we wszystkich wierszach i kolumnach. Załóżmy na przykład, że chcę zastąpić wszystkie puste rekordy NAsłowami (bez wpisywania pozycji): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl...
Mam dwie ramki danych. Przykłady: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6...
Szukałem sposobu na opisanie moich słupków na wykresie słupkowym Pandy za pomocą zaokrąglonych wartości liczbowych z mojej ramki DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800...
Mam pandas dataframe df, jak pokazano poniżej: BrandName Specialty A H B I ABC J D K AB L Chcę zamienić „ABC” i „AB” w kolumnie BrandName na A. Czy ktoś może w tym pomóc?
Mam ramkę danych pandy (to tylko mały kawałek) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0...
Chcę dodać _xsufiks do każdej nazwy kolumny w następujący sposób: featuresA = myPandasDataFrame.columns.values + '_x' Jak mam to zrobic? Dodatkowo, gdybym chciał dodać x_jako przyrostek, jak zmieniłoby się rozwiązanie?
Używam pyspark (Python 2.7.9 / Spark 1.3.1) i mam Dataframe GroupObject, którą muszę filtrować i sortować w kolejności malejącej. Próbuję to osiągnąć za pomocą tego fragmentu kodu. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Ale generuje następujący...
Mam ramkę danych, która może wyglądać następująco: A B C foo bar foo bar bar foo foo bar Chcę przejrzeć każdy element każdego wiersza (lub każdy element każdej kolumny) i zastosować następującą funkcję, aby uzyskać kolejny DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar...
Mam ramkę danych pandy. Chcę „opóźnić” jedną z moich kolumn. Oznacza to, na przykład, przesunięcie całej kolumny „gdp” w górę o jeden, a następnie usunięcie wszystkich nadmiarowych danych na dole pozostałych wierszy, tak aby wszystkie kolumny były znowu równej długości. df = y gdp cap 0 1 2...
Mam nazwany wektor znaków zwrócony z xmlAttrs w następujący sposób: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Chciałbym przekonwertować go na ramkę danych, która wygląda następująco: testDF <-...
Mam ramkę danych z 10 kolumnami, zbierającą akcje „użytkowników”, gdzie jedna z kolumn zawiera identyfikator (nie jest unikalny, identyfikujący użytkownika) (kolumna 10). długość ramki danych wynosi około 750000 wierszy. Próbuję wyodrębnić pojedyncze ramki danych (więc otrzymuję listę lub wektor...
Mam 2 ramki danych: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null...