Jak wybrać odpowiedni model regresji?

2

Zatem głównym pytaniem mojego projektu jest to, w jakim stopniu poziom udziału eksportu w PKB w PKB (tj. Eksport jako% całkowitego PKB) wpływa na jego wzrost PKB.

Porównuję tę hipotezę dla dwóch różnych krajów, Chin i Indii.

Mam roczne szeregi czasowe dotyczące eksportu jako% całkowitego PKB dla obu krajów i ich wzrostu PKB w ciągu ostatnich 30 lat, ale nie mam pojęcia, jak wybrać odpowiedni model, aby zacząć go analizować.

Myślałem o użyciu modelu Autoregresyjnego, jakieś myśli? Jeśli jest to poprawne, to jak mam zacząć modelować na podstawie moich danych?

Babar Sattar
źródło
1
Zastanawiam się, czy tak naprawdę jest to bardziej merytoryczne / teoretyczne pytanie dla ekonomistów rozwoju niż pytanie statystyczne. Zastanawiasz się, czy wzrost części PKB spowodowany eksportem koreluje ze wzrostem części nie wynikającej z eksportu, czy koreluje się z pewnym opóźnieniem, czy powoduje Granger itp.? W końcu eksport nie będzie stały i dopóki reszta gospodarki odpowiednio się nie zmniejszy, PKB wzrośnie.
@gung ma rację: chociaż chcielibyśmy pomóc, nie ma wystarczających informacji, aby to zrobić. Jeśli mógłbyś sformułować w sposób ilościowy teorię ekonomiczną dotyczącą związków między twoimi zmiennymi, moglibyśmy pomóc ci sformułować ją w sposób statystyczny, ale strona statystyk nie jest miejscem, w którym można zapytać, jakie modele ekonomiczne mają racjonalne zastosowanie.
Dziękuję wszystkim za szybkie odpowiedzi, zgadzam się z faktem, że sam tytuł jest wadliwy. Ponieważ nie chcę zbytnio odbiegać od tematu i muszę przeprowadzić jakąś analizę ekonometryczną, zastanawiałem się nad wykonalnością zmiany tytułu w celu jego uproszczenia. Mógłbym to zrobić po prostu patrząc na całkowitą wartość eksportu i to, jak korelują one z całkowitym PKB danego kraju. Mam już dane z ostatnich 30 lat dla obu zmiennych, a wstępna analiza graficzna sugeruje korelację. więc na pewno mógłbym wymodelować tę nową permutację?
Babar Sattar

Odpowiedzi:

2

Działki Czy surowe dane wyglądają, jakby miały cykle? (Zakładam, że biorąc pod uwagę, że mówisz o danych ekonomicznych i chcesz zastosować model autoregresyjny). Następnie spróbuj uzyskać porządek modelu autoregresyjnego, biorąc różnice, aż znikną cykle. Można to również przetestować formalnie przy użyciu (wersji) testu Durbin-Watson. Prawdopodobnie będą dalsze wzorce. Co widzisz? Czy zmienność pozostaje stała w czasie (prawdopodobnie, gdy masz wartości procentowe), czy też istnieje tendencja do wzrostu zmienności? Jaka gładka (i prosta) funkcja podąża za ogólnym rozkładem danych? Dopasuj, oceń dopasowanie, powtórz z różnymi funkcjami, aż będziesz mieć coś rozsądnego.

Wybór modeli jest znacznie bardziej sztuką niż nauką i często istnieje kilka rozsądnych modeli, których można użyć.

użytkownik3697176
źródło
1

Myślę, że możesz używać modeli VAR w tego rodzaju zastosowanych problemach polityki. Myślę, że interesują Cię niektóre pytania, takie jak „jak wpływ eksportu na PKB i PKB na eksport?” Tak więc, jeśli tak jest, uważam, że najbardziej odpowiednim sposobem jest użycie modeli VAR, w których można analizować przyczynowość (jak przyczynowość Grangera) między kluczowymi zmiennymi. Ale musisz spojrzeć na swoje dane, jeśli szeregi czasowe są zintegrowane, jeśli tak, możesz użyć modelu VECM (Vector Vector Correction Model), który można uznać za inną wersję modeli VAR.

optymalna kontrola
źródło
Zastanawiam się teraz, czy zmienić tytuł po prostu na wpływ eksportu na PKB. Moje dane wciąż są szeregami czasowymi, ale jeden kraj wykazuje integrację między dwiema zmiennymi, podczas gdy drugi nie. Czy Twoim zdaniem VAR jest nadal najlepszym wyborem?
Babar Sattar
Ile masz zmiennych w swoim modelu? Jeśli w twoich modelach są przynajmniej niektóre zmienne zintegrowane, możesz użyć modeli VAR.
optymalna kontrola
Tylko dwa. Zależny jest od PKB, niezależny od eksportu i okres błędu. Jeśli można dodać inne determinanty PKB, takie jak konsumpcja, inwestycje i wydatki rządowe.
Babar Sattar
Jeśli masz zintegrowane PKB i eksport, możesz zastosować podejście VAR z modelem VECM. Ponieważ nie możesz zastosować innego podejścia, jeśli masz co najmniej 2 zintegrowane serie w swoich danych. Twoje szacunki będą stronnicze. Zatem najlepszym sposobem jest użycie modelowania VAR.
optymalna kontrola