Diferença entre porco e Colmeia? Porquê as duas coisas? [fechado]

O meu passado tinha 4 semanas no mundo Hadoop. Um pouco na colmeia, porco e Hadoop usando o Hadoop VM de Cloudera. Li o ... do um (digamos porco) pode servir o propósito. É só porque o porco é evangelizado pelo Yahoo! e a colmeia pelo Facebook?

Como conhecer as versões Hive e Hadoop do comando prompt?

Como posso descobrir qual a versão da colmeia que estou a usar a partir do comando prompt. Abaixo estão os detalhes - ... alguma maneira do comando que eu possa encontrar Qual é a versão da colmeia que eu sou? usando e Hadoop versão também?

O que é colmeia, é uma base de dados? [fechado]

Comecei agora a explorar a colmeia. Tem todas as estruturas semelhantes a um RDBMS como tabelas, juntas, partições.. o q ... em cima de HDFS. Eu não acho que é simplesmente uma linguagem de consulta porque ele tem tabelas, junções e partições..

SparkSQL vs colmeia em Spark-Difference e prós e contras?

o SparkSQL CLI utiliza internamente o HiveQL e, no caso do Hive on spark(Colmeia-7292) , o hive usa o spark como motor d ... lançar um pouco mais de luz, como exatamente estes dois cenários são diferentes e prós e contras de ambas as abordagens?

Comprimir o ficheiro em S3

Tenho um ficheiro de 17,7 GB no S3. Foi gerado como a saída de uma consulta da colmeia, e não é comprimido. Eu sei que ... eta de comprimir o arquivo em S3, ou permitir a compressão em transferência em s3cmd, boto, ou ferramentas relacionadas.

Variável do tipo de mapa na colmeia

Estou a ter dificuldade em definir o tipo de mapa na colmeia. De acordo com Hive Manual há definitivamente um tipo de ma ... osso dizer algo como, select name, ph, ${nameToID[CategoryName]} from users Por favor, avisa-me sobre isto. Obrigado!

Explicação da arquitectura tez Apache

Estava a tentar ver o que faz o Apache Tez com o Hive muito mais rápido do que o mapa reduzir com o hive. Não consigo entender o conceito de DAG. Qualquer um tem uma boa referência para entender a arquitetura do Apache tez.

Interface gráfica para usar o Hadoop

Existe uma maneira fácil de usar o Hadoop que não seja com a linha de comando? Que Ferramentas estás a usar e qual é a melhor?

Como configurar o Hive para usar o Spark?

Tenho um problema em usar a colmeia com faísca. Instalei um único nó HDP 2.1 (Hadoop 2.4) via Ambari no meu CentOS 6.5. ... meia use faísca em vez de MapReduce? Há outras formas de o mudar? (Eu já tentei mudá-lo via ambari e no hive-site.xml)

Declarações de casos na colmeia

Ok, eu tenho um seguinte código para marcar os registos que têm o month_cd mais alto em tabl com bandeira binária: Sel ... az nenhum sentido para mim, e parece ser demasiado óbvio para ser um erro no motor de execução. O que me está a escapar?

Apache Hive regexp extract UDF

estou a encontrar um pedaço de código na colmeia Apache como o regexp_extract(entrada, '[0-9]*', 0), alguém me pode explicar o que este código faz? Obrigado.

Como podemos construir tenancy multi em cima do ecossistema hadoop?

Estamos a tentar construir vários imóveis em cima do ecossistema hadoop. O nosso ecossistema normalmente inclui compone ... obter alguma ajuda em Como devo proceder com o meu desenvolvimento para criar multi tenancy sobre o ecossistema Hadoop?

Quais são os casos de uso comum da colmeia?

Sou novo na colmeia, não sei como as empresas usam a colmeia. Deixa-me dar-te um cenário e ver se estou conceptualmente ... eu continuo adicionando novos arquivos de log para a mesa? Tenho de continuar a adicioná-los manualmente todos os dias?

Como criar arquivos ORC ou Parquet a partir do código PHP?

Existe alguma biblioteca que possa ser usada para escrever ficheiros de dados personalizados a partir de uma aplicação ... negativo, qual é a melhor prática neste caso? Esperemos que não envolva a criação de mapas reduzir cluster. 10X - Nir

Localização dos registos da pesquisa na colmeia

Estou a achar muito difícil localizar os registos de consulta da colmeia, basicamente quero ver que consultas foram exec ... asicamente, quero encontrar as perguntas neste estado. select foo, count(*) from table where field=value group by foo;

Sqoop vs Informatica Big Data edition for Data sourcing

tenho a opção de usar o Sqoop ou a Informatica Big Data edition para obter dados em HDFS. Os sistemas fonte São Tearadat ... a e arquivar a tabela externa. A Informática é a ferramenta ETL utilizada na organização. no que diz respeito Sanjeeb

Como passar vírgula Em Cadeia através de rHadoopClient?

Eu gostaria de ler numa tabela armazenada na colmeia em R e quero remover todas as vírgulas no processo (para garantir ... é essencial que eu mude as vírgulas na consulta. actualização: mudar as aspas simples e duplas resolveram o problema.

Colmeia explicar a compreensão do plano

Há algum recurso adequado de onde possamos entender o plano gerado pela Colmeia? Eu tentei procurá-lo no wiki, mas não c ... ações sobre como inferir o plano de explicação. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Explicar

- A processar o JSON.

estou a tentar obter alguns valores de JSON aninhado para milhões de linhas (5 TB+ table). Qual é a man ... a é a melhor função. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject

Como converter o ficheiro sas7bdat para csv?

quero converter A.sas7bdat file to A.formato csv / txt para que eu possa carregá-lo para uma tabela de colmeias. Estou a receber .ficheiro sas7bdat de um servidor externo e não tem SAS na minha máquina.