Czy obserwowana częstotliwość alleli jest znacznie mniejsza niż przewidywana?

10

Pytanie : Jak mogę skonstruować test w celu ustalenia, czy obserwowana częstotliwość „górskich” alleli (ryc. 1) jest znacznie niższa w środkowych i południowych górach niż przewidywana (ryc. 2) w modelu selekcji ekologicznej ( szczegóły poniżej )

Problem : Moją początkową myślą było zresetowanie reszt modelowych względem szerokości i długości geograficznej (co skutkuje jedynie znaczącą interakcją między szerokością i długością geograficzną). Problem polega na tym, że reszty (ryc. 3) mogą odzwierciedlać zmiany nie wyjaśnione przez model i / lub że dzieje się to biologicznie, np. Allel nie miał czasu na rozprzestrzenienie się na południe do swojego potencjału lub istnieje pewna bariera dla przepływu genów. Jeśli porównasz obserwowane (ryc. 1) i oczekiwane (ryc. 2) częstotliwości allelu górskiego, istnieje oczywista różnica, szczególnie w środkowych i południowych górach Szwecji i Norwegii. Zgadzam się, że model może nie wyjaśniać wszystkich odmian, ale czy mogę wymyślić rozsądny test, aby zbadać pomysł, że allel górski nie osiągnął swojego potencjału w środkowych i południowych górach?

tło: Mam bi-alleliczny marker AFLP, którego rozkład częstotliwości wydaje się być związany z siedliskiem górskim (i szerokości geograficznej: długości geograficznej) w porównaniu z siedliskami nizinnymi na półwyspie skandynawskim (ryc. 1). „Góra” - allele jest prawie ustalone na północy, która jest górzysta. Jest prawie nieobecny lub naprawiony dla „nizinnego” allelu na południu, w którym brakuje gór. Gdy ktoś porusza się w górach z północy na południe, allele „górskie” występują z mniejszą częstotliwością. Ta różnica w częstotliwości „górskich” alleli z północy na południe może być po prostu wynikiem filogeografii lub procesów historycznych, ponieważ region został skolonizowany zarówno z północy, jak i południa. Na przykład, jeśli allel górski pochodzi z populacji północnej, być może nie miał czasu w pełni rozwinąć się w populację południową,

Moja robocza hipoteza jest taka, że ​​częstotliwość „górskich” alleli jest wynikiem selekcji ekologicznej (hipoteza zerowa to selekcja neutralna).

W moim ekologicznym modelu selekcji zastosowałem uogólniony model addytywny (GAM) z dwumianową częstotliwością allelu jako zmienną odpowiedzi (129 miejsc pobranych z Fennoscandinavii z typowo 10–20 osobnikami z każdego miejsca) oraz kilka zmiennych klimatycznych i sezonowych zmienne predykcyjne. Wyniki modelu są następujące (TMAX04-06 = maksymalna temperatura w kwietniu i czerwcu, Phen_NPPMN = średnia wydajność wegetacji w sezonie wegetacyjnym, PET_HE_YR = roczna potencjalna ewapotranspiracja, Dist_Coast = odległość do wybrzeża):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

wprowadź opis zdjęcia tutaj

Ryc. 1. Obserwowana częstotliwość alleli „górskich” dla bi-allelicznego markera AFLP. Linie konturowe w odstępach co 0,1 częstotliwości, cieniowanie kolorów to wysokość z niebieskimi dla najniższych i czerwonych dla najwyższych.

wprowadź opis zdjęcia tutaj

Ryc. 2. Przewidywana częstotliwość dla „górskich” alleli dla bi-allelicznego markera AFLP. Linie konturowe w odstępach co 0,1 częstotliwości, cieniowanie kolorów to wysokość z niebieskimi dla najniższych i czerwonych dla najwyższych.

wprowadź opis zdjęcia tutaj

Ryc. 3. Ekologiczny model selekcji (z wykorzystaniem GAM) pozostałości w podziale na cały obszar badań (Fennoscandinavia) i osobno dla Norwegii, Szwecji i Finlandii. Czerwone przerywane linie reprezentują wtórną strefę kontaktu między populacjami północną i południową wywnioskowaną z innych markerów AFLP oraz stabilną analizę izotopową piór wyhodowanych na ich oddzielnych zimowiskach w Afryce. Cienka czarna kropkowana linia jest środkiem strefy.

Keith Larson
źródło
1
Dzięki za dużą ilość szczegółów. Jak wchodzi w grę model zerowy? Wydaje się, że tylko model selekcji ekologicznej ma znaczenie przy porównywaniu zaobserwowanych i oczekiwanych.
gui11aume
Jakie są twoje rzeczywiste dane tutaj? Wyjście modelu mówi „n = 129”, ale czy to 129 osobników lub 129 lokalizacji w każdej z nich ma częstotliwości alleli, czy ...?
onestop
Przepraszam, chciałem przedstawić jak najwięcej informacji, aby umożliwić wam jak najlepsze zrozumienie logiki (lub nielogiczności) mojego podejścia do opracowywanego przeze mnie manuskryptu. Moje pytanie znajduje się na górze, chciałbym znaleźć powód, aby ustalić, czy różnica między zaobserwowanym a oczekiwanym jest znacząco różna. To może mnie poinformować o tym, czy allel nadal się rozprzestrzenia, czy też istnieje jakaś bariera w osiągnięciu oczekiwanej wartości. Jeśli chodzi o „N = 129”, ponieważ jest to częstotliwość alleli, oznacza to 129 miejsc z typowo od 10 do 20 osobnikami pobranymi z każdego miejsca.
Keith Larson,
Wspominasz, że osoby wydają się panmikować w przypadku loci matczynego i automsomalnego. Czy masz dostęp do tych danych? Jak oceniłeś panmixię?
Sameer

Odpowiedzi:

1

To pytanie może być martwe, ale wykresy tutaj są wspaniałe, a odpowiedź tutaj wydaje się intuicyjnie oczywista. Jeśli szukasz allelu „górskiego”, oczywistym wyborem byłoby użycie wysokości (lub jej zastępcy) jako predyktora. Gdyby wykazało to istotny związek z częstotliwością alleli, stanowiłoby to mocny dowód na twoją hipotezę.

Możesz dodać więcej zmiennych predykcyjnych opisujących inne aspekty góry niż jej wysokość - na przykład „nierówność terenu” lub typ roślinności - które są wyjątkowo górzyste i mogą być również związane z częstotliwością alleli.

Michael K.
źródło