Guide PDFUnlock
Criptografia de PDF explicada: RC4, AES-128, AES-256
Uma explicação técnica mas acessível de como funciona a criptografia de PDF — do legado RC4-40 ao moderno AES-256. Entenda por que alguns PDFs são fáceis de quebrar e outros são quase impossíveis.
· Equipe PDFUnlock
Todo PDF criptografado usa um dos quatro algoritmos de criptografia, e o algoritmo determina quase tudo sobre se a senha pode ser recuperada. Este guia explica cada um em linguagem simples, com detalhes técnicos suficientes para entender por que um PDF de 25 anos é trivialmente quebrável enquanto um moderno pode ser inquebrável.
Se você só quer saber qual criptografia seu PDF usa, envie-o para o PDFUnlock — a análise é gratuita e instantânea.
Como funciona a criptografia de PDF em alto nível
Quando você define uma senha em um PDF, o aplicativo (geralmente o Adobe Acrobat) não simplesmente “bloqueia” o arquivo. Ele transforma todo o conteúdo do documento usando uma cifra matemática. A senha que você escolhe se torna a chave que reverte essa transformação.
A especificação PDF define um dicionário de criptografia armazenado no cabeçalho do arquivo. Esse dicionário contém o identificador do algoritmo, o comprimento da chave, flags de permissões e um conjunto de hashes de verificação. Quando você digita uma senha para abrir o arquivo, o leitor de PDF gera o hash da sua entrada usando os parâmetros desse dicionário e verifica se o resultado corresponde ao hash armazenado. Se corresponder, o leitor deriva a chave de descriptografia e decodifica o documento.
É por isso que as ferramentas de recuperação de senha não precisam do PDF completo — precisam apenas do dicionário de criptografia (algumas centenas de bytes). O hash extraído desse dicionário é contra o que ferramentas de quebra como o Hashcat trabalham.
RC4-40: A cifra legada (Acrobat 2-4)
RC4-40 foi o primeiro algoritmo de criptografia usado em arquivos PDF, introduzido em meados dos anos 1990. O “40” refere-se ao comprimento da chave: 40 bits.
Por que é fraca: Uma chave de 40 bits significa que há apenas cerca de 1,1 trilhão de chaves possíveis. Isso parece muito, mas uma GPU moderna pode testar mais de 20 bilhões de chaves por segundo. Todo o espaço de chaves pode ser esgotado em menos de um minuto. Isso significa que todo PDF RC4-40 pode ser quebrado independentemente da complexidade da senha — mesmo uma senha aleatória de 50 caracteres cai porque a segurança efetiva é limitada pela chave de 40 bits, não pelo comprimento da senha.
Como identificá-la: PDFs criados com Acrobat 2, 3 ou 4 (aprox.
1996-2001) usam RC4-40 por padrão. O dicionário de criptografia
mostra /V 1 e /Length 40. O PDFUnlock os reporta como “RC4-40” com
um emblema verde indicando recuperação quase certa.
Tempo de recuperação: Segundos a minutos. A taxa de sucesso é efetivamente 100%.
RC4-128: A chave estendida (Acrobat 5-8)
O Acrobat 5 (lançado em 2001) atualizou o comprimento da chave para 128 bits mantendo a cifra de fluxo RC4. O espaço de chaves saltou de 2^40 para 2^128 — um número tão grande que a busca exaustiva é impossível.
Por que ainda é vulnerável: Embora o espaço de chaves não possa ser forçado bruta, as senhas que geram essas chaves são escolhidas por humanos. A maioria das pessoas usa palavras de dicionário, nomes, datas e padrões previsíveis. Um ataque de dicionário que testa os 14 milhões de senhas na lista de palavras rockyou.txt — mais regras comuns como anexar números, capitalizar letras e substituir caracteres — cobre a grande maioria das senhas do mundo real.
Velocidade de quebra: O hashing RC4-128 é relativamente rápido. Uma NVIDIA L4 (nossa GPU de produção) testa cerca de 250-350 milhões de candidatos por segundo contra um PDF RC4-128 — cerca de 1 bilhão de candidatos por hora. Um ataque de dicionário com mutações de regras completa em minutos para padrões comuns.
Taxa de sucesso de recuperação no PDFUnlock: ~45% com o plano Standard (1h), ~65% com Deep, ~75% com Max. Senhas verdadeiramente aleatórias com mais de 10 caracteres geralmente estão seguras.
AES-128: A cifra moderna (Acrobat 9)
O Adobe Acrobat 9 (2008) substituiu o RC4 pelo AES (Advanced Encryption Standard) usando chaves de 128 bits. AES é uma cifra de bloco, fundamentalmente diferente da cifra de fluxo RC4, e é considerada criptograficamente sólida pelos padrões modernos.
O que mudou para a quebra: Surpreendentemente, a implementação AES-128 do hashcat em GPUs NVIDIA modernas é na verdade MAIS RÁPIDA que sua implementação RC4-128 — cerca de 1,3-1,8 bilhão de candidatos por segundo em uma L4. Isso porque o AES tem aceleração por hardware (AES-NI na CPU, unidades tensoriais dedicadas na GPU) enquanto o RC4 não tem.
A função de derivação de senha importa: O Acrobat 9 usa um esquema mais complexo de derivação de chave (baseado em MD5 com 50 rodadas de RC4 para a verificação de senha). Isso é mais lento por candidato que AES puro mas ainda muito mais rápido que funções modernas de hashing de senha como bcrypt ou Argon2.
Taxa de sucesso de recuperação no PDFUnlock: ~45% com o plano Standard (1h), ~65% com Deep, ~75% com Max. Ataques de dicionário permanecem eficazes porque humanos ainda escolhem senhas fracas.
AES-256: Segurança máxima (Acrobat 10+)
O Acrobat X (2010) e todas as versões subsequentes usam AES-256 — a opção mais forte na especificação PDF. A derivação de chave também mudou significativamente: o Acrobat X usa SHA-256 com hashing iterativo, e o Acrobat XI/DC introduziu um esquema de derivação de chave ainda mais caro.
Por que o AES-256 é genuinamente difícil: O Acrobat X+ usa AES-256 com R=6 (seis rodadas iterativas de SHA-256 para derivação de chave). Em uma NVIDIA L4 isso limita a velocidade de quebra a aproximadamente 15.000-18.000 candidatos por segundo — isso é ~20.000 vezes mais lento que RC4-128. Em um orçamento de 1 hora, só podemos testar ~50 milhões de candidatos contra AES-256, vs. ~1 bilhão contra RC4-128.
A matemática não mente: A 15 kH/s, verificar o dicionário rockyou.txt completo de 14 milhões de palavras leva cerca de 16 minutos. Adicionar regras de mutação comuns (que multiplicam o espaço de busca por 1000-10000x) aumenta o tempo para dias ou semanas. Força bruta de todas as senhas possíveis de 8 caracteres levaria mais de 200 anos em uma única GPU.
Taxa de sucesso de recuperação no PDFUnlock: ~20% com Standard, ~30% com Deep, ~38% com Max. Apenas senhas que aparecem em dicionários comuns ou usam padrões muito previsíveis são recuperáveis. Senhas verdadeiramente aleatórias de 12+ caracteres são praticamente irrecuperáveis com a tecnologia atual.
Como verificar o tipo de criptografia do seu PDF
Você não precisa ser um especialista técnico para determinar qual criptografia seu PDF usa. Aqui estão vários métodos:
PDFUnlock (mais fácil): Envie o arquivo para pdfunlock.app. A página de análise mostra o tipo exato de criptografia, comprimento da chave e taxa de sucesso de recuperação estimada — tudo gratuitamente.
Adobe Acrobat Reader: Abra o PDF (se possível), vá para Arquivo > Propriedades > Segurança. O campo “Método de Segurança” mostra o nível de criptografia.
Linha de comando (qpdf): Execute qpdf --show-encryption seuarquivo.pdf.
Isso exibe o algoritmo, comprimento da chave e todas as flags de
permissão.
O que isso significa para a recuperação de senha
O tipo de criptografia determina se a recuperação é provável, possível mas incerta ou praticamente impossível:
| Criptografia | Comprimento | Velocidade (L4 GPU) | Plano Standard | Plano Deep | Plano Max |
|---|---|---|---|---|---|
| RC4-40 | 40 bits | ~2 GH/s | ~100% | ~100% | ~100% |
| RC4-128 | 128 bits | ~300 MH/s | ~45% | ~65% | ~75% |
| AES-128 | 128 bits | ~1,5 GH/s | ~45% | ~65% | ~75% |
| AES-256 R=6 | 256 bits | ~15 kH/s | ~20% | ~30% | ~38% |
A conclusão mais importante: o tipo de criptografia importa muito mais do que o comprimento da senha para a viabilidade da recuperação. Um PDF RC4-40 com uma senha de 30 caracteres é mais fácil de quebrar que um PDF AES-256 com uma senha de 6 caracteres, porque o espaço de chaves RC4-40 é pequeno o suficiente para busca exaustiva.
Conclusão
A criptografia de PDF evoluiu dramaticamente em 30 anos. Se seu PDF bloqueado é antigo (criado antes de 2008), a recuperação é muito provável. Se usa AES-256 moderno, o sucesso depende inteiramente da força da senha. O primeiro passo é sempre verificar com o que você está lidando — envie seu PDF para o PDFUnlock para uma análise gratuita e instantânea.