Pytania oznaczone «dataframe»

635
Czym różnią się iloc, ix i loc?

Czy ktoś może wyjaśnić, czym różnią się te trzy metody krojenia? Widziałem dokumenty i widziałem te odpowiedzi , ale wciąż nie jestem w stanie wyjaśnić, jak te trzy są różne. Wydają mi się one w dużej mierze wymienne, ponieważ znajdują się na niższych poziomach krojenia. Powiedzmy, że chcemy...

543
Poziomy współczynnika upuszczenia w podzestawie danych

Mam ramkę danych zawierającą factor. Kiedy tworzę podzbiór tej ramki danych za pomocą subsetlub innej funkcji indeksowania, tworzona jest nowa ramka danych. Jednak factorzmienna zachowuje wszystkie swoje pierwotne poziomy, nawet jeśli / jeśli nie istnieją w nowej ramce danych. Powoduje to problemy...

513
Konwertuj listę na ramkę danych

Mam zagnieżdżoną listę danych. Jego długość wynosi 132, a każdy element jest listą o długości 20. Czy istnieje szybki sposób na przekształcenie tej struktury w ramkę danych, która ma 132 wiersze i 20 kolumn danych? Oto kilka przykładowych danych do pracy: l <- replicate( 132,...

502
Szybki odczyt bardzo dużych tabel jako ramek danych

Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować, ponieważ ramki danych w R. read.table()mają wiele wygodnych funkcji, ale wygląda na to, że w implementacji jest dużo logiki, która spowolniłaby wszystko. W moim przypadku zakładam, że znam typy kolumn z wyprzedzeniem, tabela...

480
Utwórz pustą ramkę danych

Próbuję zainicjować ramkę data.frame bez żadnych wierszy. Zasadniczo chcę określić typy danych dla każdej kolumny i nazwać je, ale nie chcę tworzyć żadnych wierszy. Do tej pory najlepsze, co udało mi się zrobić, to: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="",...

459
Jak policzyć wartości NaN w kolumnie w pandach DataFrame

Mam dane, w których chcę znaleźć liczbę NaN, więc jeśli jest mniejsza niż jakiś próg, upuszczę te kolumny. Spojrzałem, ale nie byłem w stanie znaleźć dla tego żadnej funkcji. istnieje value_counts, ale byłoby to dla mnie powolne, ponieważ większość wartości jest odrębna i chcę NaNtylko liczyć...

438
Losuj wiersze DataFrame

Mam następujące DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame jest odczytywany z pliku csv. Wszystkie wiersze, które mają Type1, są na górze, następnie wiersze z Type2, a następnie wiersze z Type3 itd. Chciałbym...