Alternativas distribuídas ao hadoop

Tenho uma pergunta curiosa.

Quais são algumas distribuídas e escaláveis? alternativas ao hadoop. Estou à procura de alguns sistemas de arquivos distribuídos como HDFS que podem ser usados como um armazenamento barato e eficaz e gostaria de um motor de processamento de dados(lote/tempo real) em cima dele. Sei que o Spark pode ser uma boa alternativa. Mas eu gostaria de usar este sistema como um arquivo de arquivos que é distribuído, tolerante a culpa e scalable.Is Ali qualquer apt soluções ? As sugestões são bem-vindas. Obrigado.
Author: Sachin, 2016-08-17

2 answers

Estas são algumas outras alternativas para Hadoop e Apache Spark. Cluster Map Reduce, Hydra and Conclusion, they are all relatively good for big data projects. Leia mais aqui https://datafloq.com/read/Big-Data-Hadoop-Alternatives/1135

 4
Author: Frank Odoom, 2016-08-17 05:20:16
Se ainda estiver a procurar alternativas, este Artigo da Gigaom pode ajudar.: https://gigaom.com/2012/07/11/because-hadoop-isnt-perfect-8-ways-to-replace-hdfs/ Por padrão Spark flushed para HDFS.

Uma vez que o HDFS é uma alternativa de código aberto para o GFS(Google FS), pode utilizar um conector para o GFS(o Google FS está disponível através do Google Cloud Platform Storage services) ... há uma pegada: é caro em transferências maciças de dados entre nós/clusters. O Hadoop não foi concebido para dados em tempo real,mas menos dinâmicos. Espero que isto ajude de alguma forma.

Todos os links acima são o artigo da Gigaom que partilhei. Espero que isto ajude de alguma forma.

 2
Author: P.M, 2017-06-20 04:33:46