Como extrair texto do documento PDF? [fechado]
Como extrair texto do documento PDF usando o PHP ?
(não posso usar Outras ferramentas, Não tenho acesso de raiz)
encontrei algumas funções a funcionar para texto simples, mas não lidam bem com caracteres Unicode:
Http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf-data-extraction-437.html
46
2 answers
Descarrega a classe .pdf2text.php @ https://pastebin.com/dvwySU1a (Atualizado em 5 de abril de 2014) ou http://www.phpclasses.org/browse/file/31030.html (Registo necessário)
Código:
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('filename.pdf');
$a->decodePDF();
echo $a->output();
A aula não funciona com todos os pdf que eu testei, tente e você pode ter sorte:)
Se o acima não funcionar, tente http://pdfparser.org/
44
Author: Pedro Lobito, 2017-06-09 21:38:47
Eu sei que este tópico é bastante antigo, mas esta necessidade ainda está viva.
Eu li muitos documentos, fórum e script e construir um novo avançado que suporta PDF comprimido e descompactado:
Espero que ajude o everone.
10
Author: Sebastien Malot, 2013-08-08 09:39:37