Como converter Word (doc) para PDF em linux?
Tenho um conjunto de ficheiros em formato .doc, que precisam de ser convertidos para o formato *.pdf***. Estou a utilizar o Ubuntu linux.
Tenho um conjunto de ficheiros em formato .doc, que precisam de ser convertidos para o formato *.pdf***. Estou a utilizar o Ubuntu linux.
Alternativa 1)
sudo apt-get install cups-pdf
Depois navegar para Sistema > Administração > Imprimir e criar uma nova impressora, defini-la como impressora de ficheiros PDF, e nomeá-la como “pdf”.
Em seguida, executar:
oowriter -pt pdf your_word_file.doc
Agora encontrará o seu ficheiro .pdf em ~/PDF.
Alternativa 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Se o pacote tetex-extra não estiver disponível com a sua distribuição, tente texlive-base mais texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Pode utilizar:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Se estiver a correr X, então pode fazê-lo através do Open Office. Já que está prestes a objectar a fazê-lo manualmente, lembre-se que há alguns bons macro scripts no Open Office para que possa automatizá-lo . Pode fazer algo semelhante com o AbiWord (AbiWord –to=pdf).
Se não tiver X então há anti-palavra, mas isso apenas extrai o texto - não faz qualquer formatação ou gráficos. Há também wvWare que utilizei para extrair em massa imagens de ficheiros doc, mas nunca tentei utilizá-lo para converter ficheiros doc para pdfs. Os ficheiros
Oh e .docx podem precisar de algo diferente, mas como são apenas ficheiros xml zipados, não deve ser muito difícil fazer algo útil com eles. Para extrair imagens em massa, basta descomprimi-las e copiar o directório de imagens, mas nunca precisei de as converter no Linux.
Eu tentaria usar para Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Para windows:
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter requer que o OpenOffice.org seja executado como um serviço e escuta na porta (por defeito) 8100; a forma mais simples de iniciar o OpenOffice.org como um serviço é a partir da linha de comando:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
O Open Office é um bom caminho a seguir, mas a fidelidade de conversão nem sempre é bem sucedida.
Se está atrás de uma solução 100% Linux, então esse é o melhor caminho a seguir. Contudo, se não se importar com uma única caixa do Windows e escrever um pouco de código para fazer interface com ela a partir do seu sistema Linux então veja este post .
Escrevi este post para que se apliquem as habituais isenções de responsabilidade.
dopdf
no Windows virtual
& - Defina dopdf
como a sua impressora por defeito durante a instalação.*.doc
no Escritório virtual e imprima-o na impressora virtual dopdf
.*.pdf
aparecerá na pasta My Documents
do Windows virtual
& - Envie-o como anexo de correio electrónico para onde quer que precise de o enviar.