Este é um suplemento à resposta de @Dennis de 18:06 30 Jul 2012. Ele aborda certamente o caso mais difícil.
No caso mais simples em que a marca de água é simples, texto sem adornos, por exemplo
Smedley Para o Comissário
as marcas de água PDF não comprimidas podem ser definidas desta forma:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
onde 75.96
é o offset horizontal e 625
o offset vertical para esta marca de água em particular. (Sim, tanto números reais como inteiros podem ser vistos.)
Uma regexp como a seguinte funcionará para todas essas marcas de água, ignorando quaisquer variações na sua colocação:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Esteja ciente, tho, de que uma variedade de operadores PDF modificadores podem entrar em jogo com marcas de água que têm uma formatação mais complicada. Esta fantasia pode transformar o que o leitor espera (espera?) numa corda contígua, fácil de procurar, numa confusão de sopa de alfabeto. Por exemplo,
E1 = mc² por Smedley™*
Pode ser o produto disto:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
. … ou muito pior se a sua marca de água for realçada pela cor!
Tendo notado tudo isto, notarei também que a PDFtk tem uma versão GUI que pretende lidar com marcas de água, em consideração a uma taxa de licenciamento de $4. Não custa nada!
Por outro lado, encontro actualmente no seu sítio web um suporte completo para O/S através de Windows 8
e OS X 10.8 Mountain Lion
. Essa vindima foi há mais de 4 anos. Será que o PDFtk está a ficar desactualizado? Suspeito que não, mas não sei.