apache-spark-sql

Concatenate columns in Apache Spark DataFrame

Como combinamos duas colunas num DataFrame Apache? Existe alguma função em Spark SQL que possamos usar?

Como escrever testes de unidade em Spark 2.0+?

Tenho tentado encontrar uma forma razoável de testar a estrutura de testes JUnit. Embora pareça haver bons exemplos para ... o que está a ser carregado exista ou não; numa SparkSession devidamente configurada, será lançado um erro mais sensato .

unit-testing scala apache-spark junit apache-spark-sql

Como salvar um DataFrame spark como csv em disco?

por exemplo, o resultado disto: df.filter("project = 'en'").select("title","count").groupBy("title").sum() devolveria uma matriz. Como gravar um ficheiro csv em disco ?

scala apache-spark apache-spark-sql

SQL on Spark: Como posso obter todos os valores de distinção?

sql apache-spark-sql

Filtro de transferência de dados para faísca

val df = sc.parallelize(Seq((1,"Emailab"), (2,"Phoneab"), (3, "Faxab"),(4,"Mail"),(5,"Other"),(6,"MSL12" ... a que {[[2]} -- isto é para selecionar os registros, mas como excluir os registros. ? Versão: Spark 1.6.2 Scala: 2, 10

scala apache-spark apache-spark-sql