Predefinição:Modernização automática/Instruções

Wikisource, a biblioteca livre

Informações gerais[editar]

Esta página é tem várias finalidades:

  1. Permitir a modernização automática dos textos do Wikisource, através da listagem de pares da forma "*expressão antiga: expressão atual". A lista também seria útil para gerar "regras de conversão" que também fossem utilizáveis pelo Conversor de Idiomas do MediaWiki;
  2. Servir como base para a criação de verbetes do Wikcionário correspondentes à ortografia antiga das palavras.
  3. Ser uma referência para a atualização de um script pessoal que simplifica a revisão do texto (obtido por OCR) do livro Elementos de Arithmetica;
Ver também
  1. Cândido de Figueiredo, 1913. (Dicionário Aberto)
  2. Michaelis

Tarefas[editar]

Comuns[editar]

  1. Adicionar regras para
    1. As variações no número (singular e plural) ou gênero gramatical (masculino ou feminino)
    2. As conjugações dos verbos
  2. Corrigir regras
    1. Contendo erros de digitação ou concordância, se for possível (ver item 4.3)
  3. Mover regras que não têm como ser convertidas pelo script:
    1. As que tenham mais de quatro palavras no lado esquerdo para uma seção a parte[1]
    2. Aquelas cujo lado esquerdo tenham parêntesis e outros caracteres que não formem "palavras"[2]
  4. Remover regras
    1. Repetidas
    2. Desnecessárias
      1. Regras com primeira letra maiúscula quando já existir a mesma regra com todas em minúsculas[3]
      2. Regras com mais de uma palavra cuja conversão já possa ser feita por uma regra de uma só palavra
    3. Que causem problemas (falsos positivos, concordância, etc...):
      1. Expressões cujo significado depende fortemente do contexto no qual aparecem[4]
        • Obs: Para remover este tipo de regra, simplesmente troque o asterisco "*" por dois-pontos ":", para que futuros editores possam perceber que a regra foi removida intencionalmente
      2. A concordância da versão modernizada fica prejudicada se a modernização de uma expressão muda de número ou gênero gramatical

Técnicas[editar]

  1. Considerar possibilidade de realizar a conversão das combinações de "q" e "g" com "ü" (qü: qu, gü: gu), sem ter que especificar cada palavra com trema individualmente
  2. Analisar a possibilidade de converter de uma só vez (em vez de especificar cada palavra onde ocorrem):
    • ff: f
    • mm: m
    • nn: n
    • l-os: los
    • l-as: las
      Obs
      • Poderá ser necessário adicionar à tabela os falsos positivos (para que sejam convertidos de volta). Isso pode valer a pena se o número de falsos positivos for bem menor que o de palavras que realmente mudam.
      • Nos casos de palavras que sofrem outras mudanças além das que forem especificadas na variável ws_typo do script, as regras colocadas nos dicionários parecerão estranhas, pois o lado esquerdo será uma expressão não existia e que também não existe. Exemplo: se fosse convertido "ll" para "l", seria preciso uma regra "aly: ali" para converter "ally" para "ali". No entanto, "aly" não é uma palavra (nem era antigamente).
      • Identificar outras sequências de letras que podem passar pelo mesmo processo (talvez "aes"-->"ais").

Notas[editar]

  1. Se fosse habilitada a conversão de expressões com 4 palavras, o desempenho geral do script seria mais reduzido, tornando ineficiente também a conversão das palavras individuais e expressões com 2 ou 3 palavras. Por isso o comprimento das sequência é limitado a 3 palavras separadas por espaços. Caso queira aumentar este limite, mesmo tornando o script mais lento, basta incluir max_seq = 4 (ou um número maior - não recomendado) em seu script pessoal.
  2. O script entende como "palavra" uma sequência de caracteres consecutivos do seguinte "alfabeto": ABCDEFGHIJKLMNOPQRSTUVWXYZ'-ÁÀÂÃÇÉÊẼÍÓÒÔÕQ̃ÚŰÜŨ (tanto maiúsculas quanto minúsculas).
  3. Regras em minúsculas tambem convertem suas correspondentes em maiúsculas: "exemplo: teste" converterá também "Exemplo: Teste" e "EXEMPLO: TESTE". Regras apenas com a primeira letra maiúscula converterão também a versão com tudo em maiúsculas: "Exemplo: Teste" converterá também "EXEMPLO: TESTE" (mas não "exemplo: teste"). Regras com outra combinação de maiúsculas e minúsculas (ou com tudo em maiúsculas) só se aplicam àquela combinação específica: "EXEMPLO: TESTE" só converte "EXEMPLO: TESTE" e "ExEmPlO: tesTE" só converte "ExEmPlO: tesTE"
  4. Às vezes é possível contornar o problema definindo regras com mais palavras, que permitam definir precisamente o significado (evitando conversões fora de contexto). Por exemplo, "metro: metrô" não é uma regra aceitável (pois metro também aparece como unidade de medida), mas "metro de Madrid" é válida (pois neste caso metro provavelmente se refere ao meio de transporte)