Alternativas distribuídas ao hadoop
Tenho uma pergunta curiosa.
Quais são algumas distribuídas e escaláveis? alternativas ao hadoop. Estou à procura de alguns sistemas de arquivos distribuídos como HDFS que podem ser usados como um armazenamento barato e eficaz e gostaria de um motor de processamento de dados(lote/tempo real) em cima dele. Sei que o Spark pode ser uma boa alternativa. Mas eu gostaria de usar este sistema como um arquivo de arquivos que é distribuído, tolerante a culpa e scalable.Is Ali qualquer apt soluções ? As sugestões são bem-vindas. Obrigado.
4
2 answers
Estas são algumas outras alternativas para Hadoop e Apache Spark. Cluster Map Reduce, Hydra and Conclusion, they are all relatively good for big data projects. Leia mais aqui https://datafloq.com/read/Big-Data-Hadoop-Alternatives/1135
4
Author: Frank Odoom, 2016-08-17 05:20:16
Se ainda estiver a procurar alternativas, este Artigo da Gigaom pode ajudar.:
https://gigaom.com/2012/07/11/because-hadoop-isnt-perfect-8-ways-to-replace-hdfs/
Por padrão Spark flushed para HDFS.
Uma vez que o HDFS é uma alternativa de código aberto para o GFS(Google FS), pode utilizar um conector para o GFS(o Google FS está disponível através do Google Cloud Platform Storage services) ... há uma pegada: é caro em transferências maciças de dados entre nós/clusters. O Hadoop não foi concebido para dados em tempo real,mas menos dinâmicos. Espero que isto ajude de alguma forma.
- MapR claims 20% faster than regular HDFS (but underlying FS is HDFS) https://mapr.com/why-mapr/
- o NetApp também tem uma alternativa aos HDFS http://www.netapp.com/us/solutions/applications/big-data-analytics/index.aspx
Todos os links acima são o artigo da Gigaom que partilhei. Espero que isto ajude de alguma forma.
2
Author: P.M, 2017-06-20 04:33:46