Utilização em cláusula com filtro de suínos
O apoio dos suínos na cláusula?
filtered = FILTER bba BY reason not in ('a','b','c','d');
Ou devo dividi-lo em vários bo?
Obrigado!
6 answers
Não o encontrei em nenhuma das amostras da documentação.
Você pode obter usando e/ou não
Em vez disso, pode usar o udf a partir do Apache DataFu. Isto irá ajudá-lo a evitar escrever muito de OR.
Https://github.com/linkedin/datafu/blob/master/src/java/datafu/pig/util/InUDF.java
Porco 0, 12 adicionado ao Operador http://www.edureka.co/blog/operators-in-apache-pig-diagnostic-operators / ver o fim da página..Nota. Não o localizei em documentos oficiais (além da simples menção nas notas de lançamento)
A = LOAD 'source.txt ' AS (utilizador: chararray, idade: chararray);
B= Filtro A por ($1 corresponde a 'tapan') e ($1 corresponde a 'super-homem');
No entanto, se o número de filtragem necessário for enorme. Então, provavelmente, você pode apenas criar uma relação que contém todas essas palavras-chave e fazer uma junção para filtrar onde a ocorrência corresponde. Esperar ajuda.
Podemos utilizar a seguinte cláusula:
A = FILTER alias_name BY col_name IN (val1, val2,...,valn);
DUMP A;