Diferença entre porco e Colmeia? Porquê as duas coisas? [fechado]
O meu passado tinha 4 semanas no mundo Hadoop. Um pouco na colmeia, porco e Hadoop usando o Hadoop VM de Cloudera. Li o ... do um (digamos porco) pode servir o propósito. É só porque o porco é evangelizado pelo Yahoo! e a colmeia pelo Facebook?
Como conhecer as versões Hive e Hadoop do comando prompt?
Como posso descobrir qual a versão da colmeia que estou a usar a partir do comando prompt. Abaixo estão os detalhes -
... alguma maneira do comando que eu possa encontrar Qual é a versão da colmeia que eu sou? usando e Hadoop versão também?
O que é colmeia, é uma base de dados? [fechado]
Comecei agora a explorar a colmeia. Tem todas as estruturas semelhantes a um RDBMS como tabelas, juntas, partições.. o q ... em cima de HDFS. Eu não acho que é simplesmente uma linguagem de consulta porque ele tem tabelas, junções e partições..
SparkSQL vs colmeia em Spark-Difference e prós e contras?
o SparkSQL CLI utiliza internamente o HiveQL e, no caso do Hive on spark(Colmeia-7292) , o hive usa o spark como motor d ... lançar um pouco mais de luz, como exatamente estes dois cenários são diferentes e prós e contras de ambas as abordagens?
Comprimir o ficheiro em S3
Tenho um ficheiro de 17,7 GB no S3. Foi gerado como a saída de uma consulta da colmeia, e não é comprimido.
Eu sei que ... eta de comprimir o arquivo em S3, ou permitir a compressão em transferência em s3cmd, boto, ou ferramentas relacionadas.
Variável do tipo de mapa na colmeia
Estou a ter dificuldade em definir o tipo de mapa na colmeia. De acordo com Hive Manual há definitivamente um tipo de ma ... osso dizer algo como, select name, ph, ${nameToID[CategoryName]} from users
Por favor, avisa-me sobre isto.
Obrigado!
Explicação da arquitectura tez Apache
Estava a tentar ver o que faz o Apache Tez com o Hive muito mais rápido do que o mapa reduzir com o hive.
Não consigo entender o conceito de DAG.
Qualquer um tem uma boa referência para entender a arquitetura do Apache tez.
Interface gráfica para usar o Hadoop
Existe uma maneira fácil de usar o Hadoop que não seja com a linha de comando?
Que Ferramentas estás a usar e qual é a melhor?
Como configurar o Hive para usar o Spark?
Tenho um problema em usar a colmeia com faísca. Instalei um único nó HDP 2.1 (Hadoop 2.4) via Ambari no meu CentOS 6.5. ... meia use faísca em vez de MapReduce? Há outras formas de o mudar? (Eu já tentei mudá-lo via ambari e no hive-site.xml)
Declarações de casos na colmeia
Ok, eu tenho um seguinte código para marcar os registos que têm o month_cd mais alto em tabl com bandeira binária:
Sel ... az nenhum sentido para mim, e parece ser demasiado óbvio para ser um erro no motor de execução. O que me está a escapar?
Apache Hive regexp extract UDF
estou a encontrar um pedaço de código na colmeia Apache como o regexp_extract(entrada, '[0-9]*', 0), alguém me pode explicar o que este código faz? Obrigado.
Como podemos construir tenancy multi em cima do ecossistema hadoop?
Estamos a tentar construir vários imóveis em cima do ecossistema hadoop.
O nosso ecossistema normalmente inclui compone ... obter alguma ajuda em Como devo proceder com o meu desenvolvimento para criar multi tenancy sobre o ecossistema Hadoop?
Quais são os casos de uso comum da colmeia?
Sou novo na colmeia, não sei como as empresas usam a colmeia. Deixa-me dar-te um cenário e ver se estou conceptualmente ... eu continuo adicionando novos arquivos de log para a mesa? Tenho de continuar a adicioná-los manualmente todos os dias?
Como criar arquivos ORC ou Parquet a partir do código PHP?
Existe alguma biblioteca que possa ser usada para escrever ficheiros de dados personalizados a partir de uma aplicação ... negativo, qual é a melhor prática neste caso? Esperemos que não envolva a criação de mapas reduzir cluster.
10X
- Nir
Localização dos registos da pesquisa na colmeia
Estou a achar muito difícil localizar os registos de consulta da colmeia, basicamente quero ver que consultas foram exec ... asicamente, quero encontrar as perguntas neste estado.
select foo, count(*) from table where field=value group by foo;
Sqoop vs Informatica Big Data edition for Data sourcing
tenho a opção de usar o Sqoop ou a Informatica Big Data edition para obter dados em HDFS. Os sistemas fonte São Tearadat ... a e arquivar a tabela externa.
A Informática é a ferramenta ETL utilizada na organização.
no que diz respeito
Sanjeeb
Como passar vírgula Em Cadeia através de rHadoopClient?
Eu gostaria de ler numa tabela armazenada na colmeia em R e quero remover todas as vírgulas no processo (para garantir ... é essencial que eu mude as vírgulas na consulta.
actualização: mudar as aspas simples e duplas resolveram o problema.
Colmeia explicar a compreensão do plano
Há algum recurso adequado de onde possamos entender o plano gerado pela Colmeia? Eu tentei procurá-lo no wiki, mas não c ... ações sobre como inferir o plano de explicação.
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Explicar
- A processar o JSON.
estou a tentar obter alguns valores de JSON aninhado para milhões de linhas (5 TB+ table). Qual é a man ... a é a melhor função.
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject
Como converter o ficheiro sas7bdat para csv?
quero converter A.sas7bdat file to A.formato csv / txt para que eu possa carregá-lo para uma tabela de colmeias.
Estou a receber .ficheiro sas7bdat de um servidor externo e não tem SAS na minha máquina.
- 1
- 2