Prowadzę badania związku między kolejnością narodzin danej osoby a późniejszym ryzykiem otyłości, wykorzystując dane z kilku rocznych kohort porodowych (np. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).
Kluczowym wyzwaniem jest to, że kolejność urodzeń jest powiązana z innymi cechami, takimi jak wiek matki, liczba młodszych i / lub starszych rodzeństw oraz odstępy urodzeniowe, które mogą również wpływać na wynik za pomocą różnych mechanizmów. Ponadto, jakikolwiek wpływ tych rzeczy na późniejsze ryzyko otyłości może zostać zmodyfikowany przez skład płciowy rodzeństwa, w tym „dziecko indeksowe” (uczestnik kohorty porodowej).
Dla każdego indeksu dziecko można narysować oś czasu pokazującą wszystkie porody w rodzinie, z wiekiem matki w zmiennej czasowej.
Próbuję zidentyfikować metody analizy tego rodzaju danych, w których kolejność, czas i charakter zdarzeń mogą mieć znaczenie. Zadaję to pytanie ze względu na różnorodność aplikacji, z którymi współpracują członkowie - spodziewam się, że ktoś będzie miał natychmiastowe sugestie, których identyfikacja zajmie mi więcej czasu. Będziemy wdzięczni za wszelkie akty we właściwym kierunku (kierunkach).
Powiązane pytania: w jaki sposób powinienem analizować dane dotyczące przedziałów urodzeniowych kobiet?
Odpowiedzi:
Możesz rozważyć zastosowanie modeli wielopoziomowych (regresja mieszana) do oszacowania efektów rodzinnych i pomiędzy nimi. Jedną z możliwych strategii jest zastosowanie zaplanowanego podejścia do budowania modelu hierarchicznego. Na przykład przetestuj każdy potencjalny predyktor w modelu jednoczynnikowym. Jeśli efekty między rodzinami usuwają efekt kolejności narodzin, to zdecydowanie sugeruje, że kolejność narodzin nie jest ważna, ale że inne czynniki są. Przykład przytoczenia tego efektu kolejności urodzeń na IQ:
Mam nadzieję, że to pomocne.
źródło
Podchodzę do tego jako pytania statystycznego i nie mam specjalnej wiedzy na temat zagadnień medycznych.
Patrząc na artykuł, do którego się odwołujesz, widzę, że jedna kohorta zawierała 970 osób. Jeśli masz dane o kilku kohortach mniej więcej tego rozmiaru, wówczas ogólny rozmiar zestawu danych oferuje możliwość wyboru stosunkowo dużych podzbiorów, w których oś czasu każdej osoby spełnia określone warunki. Na przykład, podzbiór może obejmować, powiedzmy, wszystkie osoby płci męskiej w wieku 25-29 lat. Regresja dla takiego podzbioru odpowiedniej miary późniejszej otyłości względem kolejności urodzenia wyeliminowałaby jakikolwiek możliwy wpływ na późniejszą otyłość różnic płciowych dziecka indeksowanego i w dużym stopniu wyeliminowałaby ewentualny wpływ wieku matczynego.
Rozszerzenie tego podejścia na płeć rodzeństwa nie jest proste, ponieważ jeśli jednym z warunków dla podzbioru byłoby, powiedzmy, że dziecko indeksowe ma starsze rodzeństwo żeńskie, oznacza to, że dziecko indeksowe nie jest najstarszym dzieckiem, zawężając zakres zmiennej niezależnej w regresji. Jednak rozwiązaniem może być zdefiniowanie warunków za pomocą „jeśli w ogóle”. Na przykład można zdefiniować podzbiór obejmujący wszystkie osobniki płci męskiej w wieku 25–29 lat oraz ze starszym rodzeństwem, jeśli w ogóle, wszystkie kobiety. Taki podzbiór nadal obejmowałby osoby o dowolnym porządku urodzenia.
Gdyby podzbiór był zdefiniowany przez zbyt złożony zestaw warunków, wówczas liczba osobników w nim zawartych mogłaby być tak mała, że uzyskane oszacowania współczynników byłyby zbyt nieprecyzyjne, aby były użyteczne. Gdyby przyjąć to podejście, prawdopodobnie trzeba byłoby dokonać kompromisu przy definiowaniu podzbiorów, między wyeliminowaniem jak największej liczby możliwych efektów a włączeniem wystarczającej liczby osób, aby uzyskać użyteczny wynik.
źródło
Sugerowałbym analizę danych funkcjonalnych, ale podejrzewam, że możesz mieć dużo rodzin z zbyt małą liczbą dzieci, aby uzyskać rozsądne szacunki. Śmiało i czytaj jednak, ponieważ odpowiada on Twoim potrzebom. Być może ktoś już go używał z podobnymi danymi.
Jeśli nie chcesz robić czegoś tak masowo nieparametrycznego, powinieneś wykorzystać swoją wiedzę kliniczną, aby zmniejszyć wymiarowość danych. Na przykład jedna zmienna w twoim modelu może być liczbą dzieci, inna może być średnią liczbą lat między dziećmi i tak dalej. Jeśli w tych zmiennych występuje jakikolwiek efekt, może się pojawić, nawet jeśli od razu nie określiłeś poprawnie formy funkcjonalnej. Dalsze budowanie modeli opartych na wiedzy może pozwolić na zbudowanie modelu wysoce przewidywalnego - po prostu upewnij się, że zachowałeś zestaw sprawdzania poprawności!
źródło