Mam zestaw danych zawierający dane dotyczące temperatury, opadów i plonów soi dla gospodarstwa przez 10 lat (2005–2014). Na podstawie tych danych chciałbym przewidzieć rentowności w 2015 r.
Należy pamiętać, że zestaw danych zawiera CODZIENNE wartości temperatury i opadów, ale tylko 1 wartość rocznie dla plonu, ponieważ zbiory roślin mają miejsce pod koniec sezonu wegetacyjnego upraw.
Chcę zbudować regresję lub inny model oparty na uczeniu maszynowym, aby przewidzieć plony w 2015 r., W oparciu o regresję / jakiś inny model wyprowadzony z badania zależności między plonami a temperaturą i opadami w poprzednich latach.
Znam się na uczeniu maszynowym za pomocą scikit-learn. Nie wiem jednak, jak przedstawić ten problem. Problem polega na tym, że temperatura i opady są codzienne, ale wydajność wynosi tylko 1 wartość rocznie.
Jak do tego podejść?
źródło
Odpowiedzi:
Na początek możesz przewidzieć wydajność w nadchodzącym roku na podstawie dziennych danych z poprzedniego roku. Możesz oszacować parametry modelu, biorąc pod uwagę wartość każdego roku jako jeden „punkt”, a następnie zweryfikuj model za pomocą walidacji krzyżowej. Możesz rozszerzyć ten model, biorąc pod uwagę więcej niż w ubiegłym roku, ale spoglądając za daleko, będziesz miał problemy z weryfikacją modelu i stroju.
źródło
sklearn.cross_validation
metod z „Label” w nazwie, takich jak sklearn.cross_validation.LabelKFold .Możesz użyć Bayesian Belief Network do przewidywania. Ona jest linkiem do podstawowych wyjaśnień. Sieć Bayesowska
źródło
Masz 10 punktów danych, przy czym każdy punkt danych ma wymiary 365 (temperatura na każdy dzień) + 365 (opady na każdy dzień). Idealnie byłoby najpierw zmniejszyć wymiary za pomocą metod uczenia maszynowego, np. PCA. Następnie użyj metod uczenia maszynowego, aby zbudować model predykcyjny. Jednak ze względu na mały zestaw danych nie sądzę, aby techniki uczenia maszynowego były odpowiednie dla twojego problemu.
źródło