Przeprowadzam wywiady z ludźmi na temat stanowiska programisty / badacza algorytmów w kontekście statystyki / uczenia maszynowego / eksploracji danych.
Szukam pytań, które należy zadać, aby określić, w szczególności znajomość, zrozumienie i płynność kandydata z podstawową teorią, np. Podstawowe właściwości oczekiwania i wariancji, niektóre typowe rozkłady itp.
Moje bieżące pytanie brzmi: „Istnieje nieznana ilość którą chcielibyśmy oszacować. W tym celu mamy estymatory które, biorąc pod uwagę , są bezstronne i niezależne, a każda z nich ma znana wariancja , inna dla każdego. Znajdź optymalny estymator który jest obiektywny i ma minimalną wariancję. "
Spodziewałbym się, że każdy poważny kandydat poradzi sobie z tym z łatwością (mając trochę czasu na opracowanie obliczeń), a jednak jestem zaskoczony, jak wielu kandydatów, którzy podobno z odpowiednich dziedzin nie osiągnęli nawet najmniejszego postępu. Dlatego uważam to za dobre, dyskryminujące pytanie. Jedynym problemem związanym z tym pytaniem jest to, że jest tylko jedno.
Jakie inne pytania można w tym celu zastosować? Alternatywnie, gdzie mogę znaleźć zbiór takich pytań?
źródło
Odpowiedzi:
Co chcesz, aby twój programista statystyczny zrobił?
Armia USA mówi „trenuj, z którym będziesz walczył, ponieważ będziesz walczył tak, jak zostałeś wyszkolony”. Przetestuj je pod kątem tego, co chcesz, aby robili przez cały dzień. Naprawdę chcesz, aby „tworzyły wartość” lub „zarabiały pieniądze” dla firmy.
Szef 101
Pomyśl „pokaż mi pieniądze”.
Uwaga: jeśli twoje symboliczne pytanie dotyczące manipulacji nie łączy się czysto z „pieniędzmi”, być może zadajesz niewłaściwe pytanie.
Istnieją 3 rzeczy, które każdy pracownik musi zrobić, aby zostać pracownikiem:
Jeśli nie zdobędziesz tych solidnych podstaw, żadna inna odpowiedź nie przyniesie ci żadnego pożytku.
Jeśli możesz je zastąpić dobrym oprogramowaniem lub dobrze wyszkolonym nastolatkiem, w końcu będziesz musiał to zrobić, a to będzie cię kosztować.
Dane 101
Co powinni być w stanie zrobić:
(regresja / dopasowanie, w tym modele liniowe, glm, podstawa radialna,
równania różnicowe), czy to prawda, że „x „(testowanie hipotez), ile próbek potrzebuję (próbkowanie akceptacyjne), jak uzyskać najwięcej
danych z kilku / tanich / wydajnych eksperymentów (statystyczny projekt
eksperymentu) - zastrzeżenie, nie jestem inżynierem statystycznym Możesz je zapytać pytanie „jakie są różne podstawowe zadania i w jaki sposób sprawdzasz, czy statystyki mogą je wykonać skutecznie i poprawnie?
Powinny być w stanie czytać z plików csv, xlsx (excel), SQL i
zdjęć. (HDF5, Rdata) Jeśli masz niestandardowy format, powinien on
być w stanie go przeczytać i szybko i
skutecznie pracować z narzędziami . Powinni znać siłę / słabość formatu. CSV jest szybki w użyciu, istnieje od zawsze, szybki prototyp, ale wzdęty, nieefektywny i powolny do uruchomienia.
mówią „są kłamstwa, cholerne kłamstwa i statystyki”, ale nie w mojej
firmie. Te same dobre dane wejściowe dają takie same dobre wyniki. Wynik nie jest liczbą, zawsze jest to decyzja biznesowa, która informuje o
działaniu technicznym i skutkuje wynikiem biznesowym. Różne testy mogą ustawić pokrętło na 5,5 lub 6,5, ale zdolność jest zawsze powyżej 1,33.
decydenci i / lub twórcy stworów i / lub oni sami w ciągu roku mogą
zrozumieć przy najmniejszej ilości błędów. Piękna rzecz jest w stanie to wytłumaczyć, aby twoja babcia to zrozumiała. To ( link ) jest moją odpowiedzią, ale mi się podoba.
Zingery analityczne:
Myślę, że niemożliwe pytania są świetne. Są niemożliwe z jakiegoś powodu. Dobrze jest wiedzieć, czy coś jest niemożliwe przez bramę. Lepiej jest wiedzieć, dlaczego, mieć pewne sposoby na zaangażowanie się lub zadać inne pytanie.
Inne pytania CV. ( link ) Na reddit. ( link ) inne ( link )
BTW: to było dobre pytanie. Z czasem będę musiał zaktualizować tę odpowiedź.
źródło