Pytania oznaczone «hadoop»

Hadoop to projekt open source Apache, który zapewnia oprogramowanie do niezawodnego i skalowalnego przetwarzania rozproszonego. Rdzeń składa się z rozproszonego systemu plików (HDFS) i menedżera zasobów (YARN). Różne inne projekty open source, takie jak Apache Hive, używają Apache Hadoop jako warstwy trwałości.

185
Kiedy stosować Hadoop, HBase, Hive i Pig?

Jakie są korzyści z przy użyciu Hadoop lub HBase lub gałąź ? Z mojego zrozumienia, HBase unika korzystania z mapowania i ma pamięć zorientowaną na kolumny na HDFS. Hive to podobny do sql interfejs dla Hadoop i HBase . Chciałbym również wiedzieć, jak Hive wypada w porównaniu ze Pig...

144
Jak wyłączyć logowanie INFO w Spark?

Zainstalowałem Sparka za pomocą przewodnika AWS EC2 i mogę poprawnie uruchomić program za pomocą bin/pysparkskryptu, aby dostać się do podpowiedzi iskry, a także mogę pomyślnie wykonać przewodnik Szybki start. Jednak do końca życia nie mogę wymyślić, jak zatrzymać wszystkie szczegółowe...

134
Różnica między HBase i Hadoop / HDFS

To trochę naiwne pytanie, ale jestem nowy w paradygmacie NoSQL i niewiele o nim wiem. Więc jeśli ktoś może mi pomóc jasno zrozumieć różnicę między HBase i Hadoop lub jeśli podasz kilka wskazówek, które mogą pomóc mi zrozumieć różnicę. Do tej pory zrobiłem kilka badań i zgodnie z. według mojego...

122
Nazwa węzła jest w trybie awaryjnym. Nie mogę odejść

root# bin/hadoop fs -mkdir t mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/t. Name node is in safe mode. nie jest w stanie nic stworzyć w hdfs Zrobiłem root# bin/hadoop fs -safemode leave Ale pokazuję safemode: Unknown command Jaki...