2012-07-30 18:01:56 +0000 2012-07-30 18:01:56 +0000
42
42
Advertisement

Como remover uma marca de água de um ficheiro PDF?

Advertisement

Pensei que esta seria uma tarefa simples, mas acabou por se revelar o contrário.

A marca de água é a mesma imagem (sobreposta, mas transparente) em cada uma das páginas. Eu próprio criei o ficheiro PDF (por isso aqui não há preocupações de direitos de autor) usando o PDFCreator 0.9.8.

Já experimentei o Adobe Acrobat Pro do meu amigo, mas não funcionou. Ele tenta removê-lo, mas não consegue. Tentei remover o cabeçalho/rodapé, etc., mas a marca de água simplesmente não desaparece.

Como é que posso remover a marca de água?

Advertisement

Respostas (7)

74
74
74
2012-07-30 18:06:32 +0000

Para as marcas de água baseadas na imagem, existem várias ferramentas que prometem a sua remoção automática. Por exemplo:

Todos estes são livres de tentar, mas requerem uma licença para produzir de facto a saída desejada.

Contudo, a marca de água deste ficheiro PDF específico (que o OP me enviou por e-mail) não é uma imagem única que se repete em todas as páginas. Afinal, o PDFCreator codificou-o (quase pixel a pixel) em cada uma delas. Isto torna a marca de água muito mais difícil de remover (e resulta num ficheiro PDF bastante inchado).

Uma vez que a marca de água é na realidade composta de muitas imagens minúsculas, pode removê-las com um editor PDF (por exemplo, Foxit Advanced PDF Editor ), simplesmente seleccionando-as e premindo Delete. Infelizmente, tem de repetir isto para cada página.

Uma solução menos demorada seria remover programticamente a marca de água. Precisamos:

Passos

  1. Descarregar Pdftk e extrair pdftk.exe e libiconv2.dll a %windir%\System32* , um directório no caminho ou qualquer outro local à sua escolha.

  2. Descarregar e instalar o Bloco de Notas++.

  3. Os fluxos PDF são normalmente comprimidos utilizando o DEFLATE algoritmo. Isto poupa espaço, mas torna a fonte do PDF ilegível.

  4. Abrir uncompressed.pdf com Notepad++ para revelar a estrutura da marca de água.

  5. Pressionar Ctrl + H e definir o seguinte:

  6. A marca de água foi agora removida, mas o ficheiro PDF tem erros (os comprimentos dos fluxos estão incorrectos) e não está comprimido.

  7. uncompressed.pdf já não é necessário. Pode apagá-lo.

O resultado é o mesmo PDF sem a marca de água (e cerca de metade do tamanho).

6
6
6
2012-07-30 18:05:35 +0000

Parece que a marca de água faz realmente parte das imagens dentro do .PDF, e não é uma imagem separada apresentada por cima dele por aquilo que está a utilizar para exibir o .PDF. Talvez não consiga remover a marca de água sem extrair as imagens do .PDF, passando-as por um editor de imagens, e depois reconstruir o .PDF manualmente.

4
Advertisement
4
4
2014-12-16 18:45:16 +0000

Para marcas de água de texto, a edição de uma versão PostScript pode ser muito mais fácil: Após

$ pdftops document.pdf

editar document.ps, depois converter de volta para PDF via

$ ps2pdf document.ps

1
1
1
2014-10-23 19:26:41 +0000

Os artefactos do carimbo são que se pode apagá-lo dentro do Adobe Acrobat Pro, no entanto regenera num movimento de rato porque o objecto do fluxo o mantém persistente.

Se tentar editar a fonte pdf - o que é complicado, há uma hipótese de que o ficheiro seja corrompido.

Se o selo for um fluxo, podemos interrompê-lo desligando o computador da Rede, o que eu fiz.

Depois, utilizando o Adobe Acrobat Pro, seleccionei uma das minhas anotações, cliquei com o botão direito do rato para obter o popup, e seleccionei “Mostrar Lista de Comentários”.

Seleccione a marca de água/ carimbo nefasta da Lista, clique com o botão direito do rato para obter o popup, e seleccione “Delete”. Faça isto em todas as páginas onde a afixação ocorre.

Guardar o Ficheiro com outro nome. A minha aplicação falhou, mas não antes de guardar o ficheiro!

Abra o ficheiro novo e muito mais pequeno; note que todas as marcas de água/carimbos são gonzo.

No meu caso, o tamanho do ficheiro do meu documento de 3 páginas diminuiu de 300 kb para uns impressionantes 60 kb. Todos os dados e anotações originais permaneceram intactos - sem as marcas de água.

~Caça ao bem :o)

1
Advertisement
1
1
2017-03-17 12:49:33 +0000

Encontrei outra forma de o fazer:

  1. utilizar a ferramenta pdf2htmlEX (ou qualquer outro conversor PDF para HTML) para converter o PDF para um ficheiro HTML.
  2. Editar HTML com um editor de texto, e remover a marca de água. Guarde-o.
  3. Imprimir para o HTML para um novo documento PDF
  4. Lucro
1
1
1
2015-01-13 15:42:01 +0000

converter o documento em ficheiro .rtf utilizando zamzar. A marca de água desaparece automaticamente após a conversão. Please Note: - Funciona perfeitamente se o documento contiver material de texto. Sempre foi de grande ajuda… (Utilizador de Mac)

0
Advertisement
0
0
2016-10-16 05:22:05 +0000

Este é um suplemento à resposta de @Dennis de 18:06 30 Jul 2012. Ele aborda certamente o caso mais difícil.

No caso mais simples em que a marca de água é simples, texto sem adornos, por exemplo

Smedley Para o Comissário

as marcas de água PDF não comprimidas podem ser definidas desta forma:

BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

onde 75.96 é o offset horizontal e 625 o offset vertical para esta marca de água em particular. (Sim, tanto números reais como inteiros podem ser vistos.)

Uma regexp como a seguinte funcionará para todas essas marcas de água, ignorando quaisquer variações na sua colocação:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Esteja ciente, tho, de que uma variedade de operadores PDF modificadores podem entrar em jogo com marcas de água que têm uma formatação mais complicada. Esta fantasia pode transformar o que o leitor espera (espera?) numa corda contígua, fácil de procurar, numa confusão de sopa de alfabeto. Por exemplo,

E1 = mc² por Smedley™*

Pode ser o produto disto:

BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. … ou muito pior se a sua marca de água for realçada pela cor!

Tendo notado tudo isto, notarei também que a PDFtk tem uma versão GUI que pretende lidar com marcas de água, em consideração a uma taxa de licenciamento de $4. Não custa nada!

Por outro lado, encontro actualmente no seu sítio web um suporte completo para O/S através de Windows 8 e OS X 10.8 Mountain Lion. Essa vindima foi há mais de 4 anos. Será que o PDFtk está a ficar desactualizado? Suspeito que não, mas não sei.

Advertisement