Pytania oznaczone «hive»

88
Jak poznać wersje Hive i Hadoop z wiersza polecenia?

Jak mogę znaleźć używaną wersję programu Hive w wierszu polecenia. Poniżej znajdują się szczegóły- Używam Putty do łączenia się z tabelą ula i uzyskiwania dostępu do rekordów w tabelach. Więc co zrobiłem - otworzyłem Putty i wpisałem nazwę hosta - leo-ingesting.vip.name.coma potem kliknąłem...

87
Parkiet vs ORC vs ORC z Snappy

Przeprowadzam kilka testów na formatach przechowywania dostępnych w Hive i używam Parquet i ORC jako głównych opcji. Raz włączyłem ORC z domyślną kompresją, a raz ze Snappy. Przeczytałem wiele dokumentów, w których stwierdzono, że Parquet jest lepszy pod względem złożoności...

85
Różnica między INNER JOIN a LEFT SEMI JOIN

Jaka jest różnica między INNER JOINi LEFT SEMI JOIN? W poniższym scenariuszu, dlaczego otrzymuję dwa różne wyniki? Zestaw INNER JOINwyników jest dużo większy. Czy ktoś może wyjaśnić? Próbuję uzyskać nazwy, table_1które pojawiają się tylko w table_2. SELECT name FROM table_1 a INNER JOIN...

81
Jak wyprowadzić wyniki zapytania HiveQL do pliku CSV?

chcielibyśmy umieścić wyniki zapytania Hive w pliku CSV. Pomyślałem, że polecenie powinno wyglądać tak: insert overwrite directory '/home/output.csv' select books from table; Kiedy go uruchamiam, mówi, że zakończyło się pomyślnie, ale nigdy nie mogę znaleźć pliku. Jak znaleźć ten plik, czy...