Documentació - mtuoc/mtuoc.github.io GitHub Wiki

Cada component té la seva pròpia documentació en els seus respectius Wikis. Aquí pots trobar els enllaços a la documentació per a cada projecte.

  • MTUOC-any2text: Scripts per convertir diversos formats d'arxiu a text.
  • MTUOC-TMX2tabtxt: Scripts i programes per a la conversió d'arxius TMX a arxius de text separat per tabuladors (tsv).
  • MTUOC-SDLTM2tabtxt: Scripts i programes per a la conversió de memòries de traducció de Trados (SDLTM) a arxius de text separat per tabuladors (tsv).
  • MTUOC-tokenizers: Tokenitzadors per a diverses llengües.
  • MTUOC-segmenter: Scripts i programes per a segmentar arxius de text i corpus.
  • MTUOC-aligner: Scripts i programes per a l'alineació automàtica de documents fent servir Hunalign o SBERT.
  • MTUOC-web-downloader: Un conjunt d'scripts per a descarregar un lloc web sencer i guardar-lo localment.
  • MTUOC-clean-parallel-corpus: Un script de Python per a la neteja de corpus paral·lels.
  • MTUOC-PCorpus-rescorer: Un conjunt de programes per a re-avaluar corpus paral·lels.
  • MTUOC-corpus-combination: Un programa desenvolupat en Python per a seleccionar segments similars d'un corpus paral·lel de gran mida.
  • MTUOC-corpus-preprocessing: Un script MTUOC script per a preprocessar corpus paral·lels per a l'entrenament de sistemes de traducció automàtica.
  • MTUOC-training-scripts: Scripts i arxius de configuració per a entrenar sistemes de traducció automàtica (Moses, Marian, OpenNMT...)
  • MTUOC-server: Un servidor per a posar en marxa sistemes de traducció automàtica.
  • MTUOC-eval/wiki: Un programa fàcil de fer servir per a l'avaluació de sistemes de traducció automàtica mitjaçant mètriques automàtiques.
  • PosEdiOn: Un conjunt de programes per a portar a terme experiments de traducció i postedició i calcular indicadors d'esforç de traducció.
  • MTUOC-translator: Un conjunt de programes per a traduir arxius amb el servidor MTUOC.
  • MTUOC-editor: En desenvolupament
  • MTUOC-novaIEC: Un script senzill i arxiu de dades per a convertir textos catalans de la normativa ortogràfica antiga a la nova. Tots els canvis s'han pres de ORTOGRAFIA Modificacions entrades DIEC2.
  • MTUOC-Trados-plugin: Un plug-in per a Trados per a fer servir els servidors de traducció automàtica MTUOC.
  • MTUOC: Arxius i scripts generals del projecte MTUOC.