Predefinição:Modernização automática/Instruções
Aspeto
Informações gerais
[editar]Esta página é tem várias finalidades:
- Permitir a modernização automática dos textos do Wikisource, através da listagem de pares da forma "
*expressão antiga: expressão atual
". A lista também seria útil para gerar "regras de conversão" que também fossem utilizáveis pelo Conversor de Idiomas do MediaWiki; - Servir como base para a criação de verbetes do Wikcionário correspondentes à ortografia antiga das palavras.
- Ser uma referência para a atualização de um script pessoal que simplifica a revisão do texto (obtido por OCR) do livro Elementos de Arithmetica;
- Ver também
Tarefas
[editar]Comuns
[editar]- Adicionar regras para
- As variações no número (singular e plural) ou gênero gramatical (masculino ou feminino)
- As conjugações dos verbos
- Corrigir regras
- Contendo erros de digitação ou concordância, se for possível (ver item 4.3)
- Mover regras que não têm como ser convertidas pelo script:
- Remover regras
- Repetidas
- Desnecessárias
- Regras com primeira letra maiúscula quando já existir a mesma regra com todas em minúsculas[3]
- Regras com mais de uma palavra cuja conversão já possa ser feita por uma regra de uma só palavra
- Que causem problemas (falsos positivos, concordância, etc...):
- Expressões cujo significado depende fortemente do contexto no qual aparecem[4]
- Obs: Para remover este tipo de regra, simplesmente troque o asterisco "*" por dois-pontos ":", para que futuros editores possam perceber que a regra foi removida intencionalmente
- A concordância da versão modernizada fica prejudicada se a modernização de uma expressão muda de número ou gênero gramatical
- Expressões cujo significado depende fortemente do contexto no qual aparecem[4]
- Repetidas
Técnicas
[editar]- Considerar possibilidade de realizar a conversão das combinações de "q" e "g" com "ü" (qü: qu, gü: gu), sem ter que especificar cada palavra com trema individualmente
- Analisar a possibilidade de converter de uma só vez (em vez de especificar cada palavra onde ocorrem):
- ff: f
- mm: m
- nn: n
- l-os: los
- l-as: las
- Obs
- Poderá ser necessário adicionar à tabela os falsos positivos (para que sejam convertidos de volta). Isso pode valer a pena se o número de falsos positivos for bem menor que o de palavras que realmente mudam.
- Nos casos de palavras que sofrem outras mudanças além das que forem especificadas na variável
ws_typo
do script, as regras colocadas nos dicionários parecerão estranhas, pois o lado esquerdo será uma expressão não existia e que também não existe. Exemplo: se fosse convertido "ll" para "l", seria preciso uma regra "aly: ali" para converter "ally" para "ali". No entanto, "aly" não é uma palavra (nem era antigamente). - Identificar outras sequências de letras que podem passar pelo mesmo processo (talvez "aes"-->"ais").
Notas
[editar]- ↑ Se fosse habilitada a conversão de expressões com 4 palavras, o desempenho geral do script seria mais reduzido, tornando ineficiente também a conversão das palavras individuais e expressões com 2 ou 3 palavras. Por isso o comprimento das sequência é limitado a 3 palavras separadas por espaços. Caso queira aumentar este limite, mesmo tornando o script mais lento, basta incluir
max_seq = 4
(ou um número maior - não recomendado) em seu script pessoal. - ↑ O script entende como "palavra" uma sequência de caracteres consecutivos do seguinte "alfabeto":
ABCDEFGHIJKLMNOPQRSTUVWXYZ'-ÁÀÂÃÇÉÊẼÍÓÒÔÕQ̃ÚŰÜŨ
(tanto maiúsculas quanto minúsculas). - ↑ Regras em minúsculas tambem convertem suas correspondentes em maiúsculas: "exemplo: teste" converterá também "Exemplo: Teste" e "EXEMPLO: TESTE". Regras apenas com a primeira letra maiúscula converterão também a versão com tudo em maiúsculas: "Exemplo: Teste" converterá também "EXEMPLO: TESTE" (mas não "exemplo: teste"). Regras com outra combinação de maiúsculas e minúsculas (ou com tudo em maiúsculas) só se aplicam àquela combinação específica: "EXEMPLO: TESTE" só converte "EXEMPLO: TESTE" e "ExEmPlO: tesTE" só converte "ExEmPlO: tesTE"
- ↑ Às vezes é possível contornar o problema definindo regras com mais palavras, que permitam definir precisamente o significado (evitando conversões fora de contexto). Por exemplo, "metro: metrô" não é uma regra aceitável (pois metro também aparece como unidade de medida), mas "metro de Madrid" é válida (pois neste caso metro provavelmente se refere ao meio de transporte)