Case Study: PT - sc-voice/ms-dpd GitHub Wiki
EN: English
The initial MS-DPD Portuguese (PT) translations are made by [DeepL](https://deepl.com) and reviewed by Karl Lew in consulation with [Michaelis PT Diçionário](https://michaelis.uol.com.br/) as well as the [SuttaCentral PT dictionary](https://suttacentral.net).Translations were made from the EN headword definitions of the Digital Pali Dictionary DPD.
The initial translations made by DeepL are placed in the meaning_raw
field, which classifies them as "provisional content pending human review".
Once reviewed, each entry can be upgraded to the meaning_1
field, which classifies them as "human-reviewed content".
To illustrate this process, here are some examples.
-
MS-DPD fields:
meaning_1|meaning_raw|meaning_lit
- DPD: calming; stilling; settling; giving peace||causing to be calm
- DeepL/PT: |acalmar; acalmar; acalmar; dar paz|provocar a calma
- Reviewer (Karl Lew)/PT: acalmar; aquietar; assentar; dar paz||causando calma
DeepL did not do well here. The word "acalmar" is clumsily used for three different EN words. And we have also ended up with the rather peculiar turn of phrase "provocar a calma" (provoking calm? 😆). In cases like this, human review can produce a better result.
Notably, in other cases, review is more difficult:
- DPD: |fortunate|having good fortune quality
- DeepL/PT: |feliz|ter qualidade de sorte
- Reviewer (Karl Lew)/PT: ????
The word "fortunate" is strongly tied to "gain". And the word "gain" is a very very tricky one to get right by itself, especially since it has strong implications for wrong/right view. In this case, it is important to think carefully about comprehensive and consistent translation throughout and entire corpus. This means that additional changes will need to be made in the context of a future comprehensive review.
Because the review is uncertain at this time, the DeepL/PT meaning is left as meaning_raw
(i.e., provisional and unreviewed).
This is a "raw translation" that will be specially marked as such in applications.
To complete the review process, a comprehensive review will need to define and address translations of words that have deeper meaning in Buddhism.
Overall it is good to distinguish DeepL content from human content. To maintain that distinction, it is important to have separate commits to Github for DeepL translations and human reviews. This separation provides more context for future reviews.
PT: Portuguêse
As traduções iniciais para o português (PT) do MS-DPD são feitas por [DeepL](https://deepl.com) e revistas por Karl Lew em consulta com o [Michaelis PT Diçionário](https://michaelis.uol.com.br/), bem como com o [Dicionário SuttaCentral PT](https://suttacentral.net).As traduções foram efectuadas a partir das definições de palavras-chave EN do [Digital Pali Dictionary DPD] (https://dpdict.net).
As traduções iniciais feitas por DeepL são colocadas no campo meaning_raw
, que as classifica como "conteúdo provisório a aguardar revisão humana".
Uma vez revistas, cada entrada pode ser actualizada para o campo meaning_1
, que as classifica como "conteúdo revisto por humanos".
Para ilustrar este processo, eis alguns exemplos.
-
MS-DPD:
meaning_1|meaning_raw|meaning_lit
- DPD/EN: calming; stilling; settling; giving peace||causing to be calm
- DeepL/PT: |acalmar; acalmar; acalmar; dar paz|provocar a calma
- Revisor (Karl Lew)/PT: acalmar; aquietar; assentar; dar paz||causando calma
DeepL não se saiu bem aqui. A palavra "acalmar" é utilizada de forma desajeitada para três palavras EN diferentes. E acabámos também com a peculiar frase "provocar a calma" (provocar? 😆). Em casos como este, a análise humana pode produzir um melhor resultado.
Noutros casos, nomeadamente, a revisão é mais difícil:
- DPD/EN: |fortunate|having good fortune quality
- DeepL/PT: |feliz|ter qualidade de sorte
- Revisor (Karl Lew)/PT: ????
A palavra "fortunate" está fortemente ligada a ganho. E a palavra "ganho" é uma palavra muito, muito complicada de acertar por si só, especialmente porque tem fortes implicações para a visão de errado/certo. Neste caso, é importante pensar cuidadosamente numa tradução abrangente e consistente ao longo de todo o corpus. Isto significa que terão de ser introduzidas alterações adicionais no contexto de uma futura revisão global.
Uma vez que a revisão é incerta neste momento, o significado de DeepL/PT é deixado como meaning_raw
(ou seja, provisório e não revisto).
Trata-se de uma "tradução em bruto" que será especialmente assinalada como tal nas aplicações.
Para completar o processo de revisão, uma revisão abrangente terá de definir e abordar as traduções de palavras que têm um significado mais profundo no budismo.
De um modo geral, é bom distinguir o conteúdo DeepL do conteúdo humano. Para manter essa distinção, é importante ter commits separados no Github para [DeepL traduções e revisões humanas] (https://github.com/sc-voice/ms-dpd/commits/main/dpd/pt). Esta separação fornece mais contexto para futuras revisões.