Co kryje się za interfejsem API Google Prediction?

28

Google Prediction API to usługa w chmurze, w której użytkownik może przesłać dane szkoleniowe, aby wyszkolić tajemniczego klasyfikatora, a następnie poprosić go o klasyfikację danych przychodzących, na przykład w celu wdrożenia filtrów spamu lub przewidzenia preferencji użytkownika.

Ale co jest za kulisami?


źródło
2
Podejrzewam, że mają nadzieję zachować poufność informacji handlowych!
onestop
To może być prawda, ale wideo (z lata 2010 r.) Sugeruje, że do tego czasu eksperymentowali; więc opublikowałem to Q, mając nadzieję, że od tego czasu pojawiły się wycieki.
6
Istnieje „kilka” algorytmów, które API predykcji może wybierać podczas szkolenia / prognozowania danych. Silnik wybiera ten, który uzna za najlepszy. Niektórzy użytkownicy zażądali nieco większej kontroli nad tym wyborem, goo.gl/mod/5EoA , nawet jeśli algorytm jest nieznany. Redditors spekulowali tutaj na temat odwagi, reddit.com/r/MachineLearning/comments/evdxb/... , ale statystyki mówienia są dla mnie stracone.
hyperslug
2
@hyperslug Opublikuj jako odpowiedź, jest dość przydatna, więc chciałbym ją zaakceptować.

Odpowiedzi:

11

Google używa różnych technik uczenia maszynowego i algorytmu do szkolenia i prognozowania. Strategie uczenia się nadzorowanego na dużą skalę: 1. Podpróbka 2. Zawstydzająco równoległe niektóre algorytmy 3. Rozproszone opadanie gradientu 4. Głosowanie większościowe 5. Mieszanka parametrów 6. Iteracyjna mieszanina parametrów

Powinni szkolić i przewidywać model z różnymi technikami uczenia maszynowego i używając algorytmu do wyboru najlepszego modelu i prognozy zwrotu.

  1. Podpróbkowanie zapewnia gorszą wydajność
  2. Mieszanka parametrów poprawia się, ale nie tak dobra jak wszystkie dane
  3. Algorytmy rozproszone szybciej zwracają lepsze klasyfikatory
  4. Iteracyjna mieszanina parametrów osiąga tak dobre wyniki jak wszystkie dane

Ale oczywiście nie jest to do końca jasne w dokumentacji API.

404Dreamer_ML
źródło