Como extrair texto do documento PDF? [fechado]

Como extrair texto do documento PDF usando o PHP ?

(não posso usar Outras ferramentas, Não tenho acesso de raiz)

encontrei algumas funções a funcionar para texto simples, mas não lidam bem com caracteres Unicode:

Http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf-data-extraction-437.html

Author: Sfisioza, 2011-08-09

2 answers

Descarrega a classe .pdf2text.php @ https://pastebin.com/dvwySU1a (Atualizado em 5 de abril de 2014) ou http://www.phpclasses.org/browse/file/31030.html (Registo necessário)

Código:

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('filename.pdf'); 
$a->decodePDF();
echo $a->output(); 
A aula não funciona com todos os pdf que eu testei, tente e você pode ter sorte:)

Se o acima não funcionar, tente http://pdfparser.org/

 44
Author: Pedro Lobito, 2017-06-09 21:38:47
Eu sei que este tópico é bastante antigo, mas esta necessidade ainda está viva. Eu li muitos documentos, fórum e script e construir um novo avançado que suporta PDF comprimido e descompactado:

Https://gist.github.com/smalot/6183152

Espero que ajude o everone.
 10
Author: Sebastien Malot, 2013-08-08 09:39:37