Como converter programaticamente HTML para epub? [fechado]
7 answers
A resposta curta é sim, pode ser feito em qualquer linguagem de programação.
Passos básicos:
- converta o seu HTML para XHTML (+ CSS). Isto pode ser feito em seu programa ou através de um arquivo XSLT.
- Copie os seus ficheiros (XHTML, CSS, quaisquer imagens e tipos de letra) para uma estrutura de pastas que siga o formato.
- fecha a estrutura do directório e nomeia o arquivo com um".ePub " extension.
Alguns sites para o ajudar a começar:
- um bom tutorial para o que está em um arquivo epub (e como criar um você mesmo) pode ser encontrado aqui: http://www.jedisaber.com/eBooks/Introduction.shtml usei isto para começar.
- especificações para o .a norma epub está aqui. http://www.idpf.org/
- um validador para .os epubs podem ser descarregados a partir daqui: https://github.com/IDPF/epubcheck
Nota: o validador de epubcheck mudou-se do código google para o GitHub; repare no novo ENDERECO.
Calibre suporta uma ampla variedade de formatos de entrada, incluindo HTML, e uma grande variedade de formatos de saída, incluindo EPUB, mas não é "uma linguagem de programação ou de biblioteca". Existem razões específicas para desejar uma abordagem baseada na programação em vez de uma ferramenta independente? Se sim, talvez Python e ebookmaker.py por exemplo, pode ajudar-te.
A late reply, but I found the Python 3-based ebookmaker to be of value, at least after I contributed a pull request to remove a UTF-8 BOM. Um problema com ele parece ser que ele usa expressões regulares quebradiças para processar HTML , mas eu acho que vou ter que relatá-lo lá.
Aqui estápdf para epub , Eu sei que não é isso que você quer, mas é um começo.
O calibre pode ter o que você quer
Estou a usar a seguinte biblioteca de Aspose - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx
Em apenas duas linhas de código eu sou capaz de fazer html para conversões epub. Utilizar isto atualmente em um sistema de produção.
Document doc = new Document (_sourceFilePath);
Doc.Gravar (_destinationFilePath, SaveFormat.Epub);
Comecei agora a implementar tal ferramenta em Java (compatível com OpenJDK): html2epub. A fim de se livrar de editar manualmente o arquivo de configuração, eu provavelmente vou começar uma ferramenta separada para gerar o arquivo de configuração a partir de qualquer diretório (no entanto, ainda seria necessário para determinar a ordem dos XHTMLs em EPUB para não-programmatical uso, o desenvolvimento de uma interface gráfica, auxiliar de ferramenta poderia ser considerado, para uma totalmente flexível programmatical solução, eu não vim com uma idéia ainda). Antes disso, implementei conversores baseados em scripts shell para Entrada XML personalizada ( hag2epub tools ) - no caso de estar interessado, eu provavelmente iria transferi-los para entrada XHTML (com um ficheiro de configuração para os meta-dados EPUB ou obter meta-dados do Índice mais alto.html de um directório, se existir).