Como criar arquivos ORC ou Parquet a partir do código PHP?

Existe alguma biblioteca que possa ser usada para escrever ficheiros de dados personalizados a partir de uma aplicação PHP no formato ORC ou Parquet para consultas Presto ?

Em caso negativo, qual é a melhor prática neste caso? Esperemos que não envolva a criação de mapas reduzir cluster.

10X - Nir

Author: Nir, 2017-06-27

1 answers

Ali está o https://github.com/apache/parquet-cpp projecto que fornece uma implementação em C++ para escrever ficheiros Parquet sem qualquer utilização do MapReduce ou do JVM. Apesar de já existirem Python (https://arrow.apache.org/docs/python/parquet.html), Ruby / Lib (https://github.com/red-data-tools/parquet-glib) e NodeJS (https://github.com/skale-me/node-parquet) ligações, não há nenhum ainda para o PHP. Mas dadas essas ligações mencionadas, você deve ser capaz de escrever uns para PHP muito facilmente.

 2
Author: Uwe L. Korn, 2017-06-27 13:00:29