Czy ktoś mógłby zaoferować jakieś wskazówki, jak używać weights
argumentu w lm
funkcji R. Powiedzmy, na przykład, że próbujesz dopasować model do danych o ruchu drogowym i miałeś kilkaset wierszy, z których każdy reprezentował miasto (o innej populacji). Jeśli chciałbyś, aby model dostosował względny wpływ każdej obserwacji na podstawie wielkości populacji, czy możesz po prostu określić weights=[the column containing the city's population]
? Czy to rodzaj wektora, w który można wejść weights
? A może musiałbyś całkowicie użyć innej funkcji / pakietu / podejścia R?
Ciekawe, jak ludzie sobie z tym radzą - nie widziałem, żeby było to omówione w żadnym tutorialu modelowania liniowego, który tam widziałem. Dzięki!
źródło
lm
podsumowaniu, jeśli są skalowane vs nie ...lm
podsumowaniu? Współczynniki czy błędy standardowe?To, co sugerujesz, powinno działać. Sprawdź, czy to ma sens:
Druga linia tworzy taki sam punkt przecięcia i nachylenie jak trzecia linia (różniąca się od wyniku pierwszej linii), podając jedną obserwację względnie dwukrotnie większą niż każda z pozostałych dwóch obserwacji, podobnie jak wpływ duplikacji trzeciej obserwacji.
źródło
summary
wyjściowe są różne dla 2. i 3. wiersza, szczególnie dla wartości p współczynnika. Zastanawiam się, że tak się stanie, jeśli 2 instrukcje odnoszą się do tego samego zestawu danych.