Diferença entre porco e Colmeia? Porquê as duas coisas? [fechado]

O meu passado tinha 4 semanas no mundo Hadoop. Um pouco na colmeia, porco e Hadoop usando o Hadoop VM de Cloudera. Li o ... do um (digamos porco) pode servir o propósito. É só porque o porco é evangelizado pelo Yahoo! e a colmeia pelo Facebook?

Interface gráfica para usar o Hadoop

Existe uma maneira fácil de usar o Hadoop que não seja com a linha de comando? Que Ferramentas estás a usar e qual é a melhor?

Apache PIG-GROUP BY

estou a tentar alcançar a funcionalidade abaixo no porco. Tenho um conjunto de registos de amostras como este. Note ... de e sexo. Este conjunto de dados é enorme, por isso esta abordagem está a demorar muito tempo. Há uma abordagem melhor?

Utilização em cláusula com filtro de suínos

O apoio dos suínos na cláusula? filtered = FILTER bba BY reason not in ('a','b','c','d'); Ou devo dividi-lo em vários bo? Obrigado!