2009-08-11 13:11:38 +0000 2009-08-11 13:11:38 +0000
26
26

Como posso editar texto Unicode no Bloco de Notas++?

Por vezes edito texto em inglês que inclui caracteres Unicode. Por alguma razão, no meu PC, o Notepad++ converte Caracteres Unicode para ????‘s corrompendo assim o texto e perdendo todos esses dados. Estou à procura de uma forma de editar tal texto, preservando ao mesmo tempo os caracteres Unicode. Estou a usar Consolas como a minha fonte. Se a fonte não tem todos esses caracteres, porque devo perder os dados quando copio o texto do Notepad++ (através da área de transferência do Windows)?

Respostas (5)

15
15
15
2011-09-17 11:54:32 +0000

O problema descrito na pergunta acontece quando um empty/novo documento é definido como “ANSI”, e Unicode caracteres são colados nele.

Não há nenhuma auto-detecção quando utilizado com um documento vazio/novo, pelo menos não na versão do Notepad+++ que testei (v5.4.5). “ANSI” é o padrão no Bloco de Notas++ para um novo documento, a menos que definido no menu ConfiguraçõesPreferências separador → Documento novo/ Directório de Salvamento Aberto.

Solução

A solução é definir a codificação para UTF-8 antes de colar, menu FormatoCódigo em UTF-8:

Exemplo

Copiei algum texto para um novo documento Notepad++, Russo (русский язык, russkiy yazyk), de Firefox mostrando a página da Wikipedia língua russa _.

Se a codificação _ não_ foi alterada de “ANSI” este é o resultado:

Se a codificação _ foi_ alterada este é o resultado:

Como se pode ver na figura abaixo (a parte Cirílico está destacada), o Bloco de Notas+++ converte efectivamente os caracteres Unicode em ASCII 63 (hexadecimal 3F), pontos de interrogação. É por isso que os caracteres Unicode se perdem (no modo “ANSI”) ao copiar o texto através da prancheta (é não um problema de fonte - a informação perde-se).

Testado em: Bloco de notas++ v5.4.5 (UNICODE).

15
15
15
2009-08-11 13:30:37 +0000

Se o ficheiro estiver efectivamente codificado em Unicode, o Notepad++ deve detectá-lo automaticamente. A fonte Consolas funciona bem para mim. Pode tentar uma destas duas opções de menu:

  • Encodificação -\ > Encodificação em UTF-8
  • Encodificação -\ > Converter para UTF-8

Tenho quase a certeza que o primeiro fará o que quiser.

5
5
5
2009-08-11 13:30:46 +0000

Há boas e más notícias.

Bom notícias: Notepad++ suporta Unicode (pelo menos pelo que posso recolher).

Más notícias: Aparentemente, o suporte Unicode está apenas no Windows XP.

Na verdade não tenho uma máquina Windows à minha frente. Pelo que me lembro, existe um menu de Codificação sob o menu Formatar algures. A codificação para Unicode é na realidade mais comummente UTF-8.

Aqui está uma imagem ‘bonita’ do suporte para Unicode no Notepad++,

1
1
1
2015-04-14 13:13:05 +0000

Isto é trabalhado para mim:

Mudei a fonte para Courier New in style configurator no meu PC (Windows 7 com conjunto de caracteres inglês/americano e romeno para conjunto não-Unicode). Está a trabalhar com fontes Courier New & Tahoma + codificação UTF-8.

0
0
0
2018-09-19 10:12:31 +0000

No menu superior seleccionar o Encoding depois escolher Encode in UTF-8 ou Encode in UTF-8 Without BOM depois pode editar texto na codificação Unicode.