Woche 1 - mkappus1/DatenmanagementMTHS24 GitHub Wiki

1. Einleitung

In dieser ersten Woche des Kurses werden wir die folgenden Aktivitäten durchführen:

  • Empfohlene Lektüre:
    • Neuronale maschinelle Übersetzung, ein Artikel mit Verweis auf einige Lehrmaterialien der UOC (Universitat Oberta de Catalunya), geschrieben von Anotni Oliver (übersetzt von mir mit Hilfe maschineller Übersetzungsysteme). Der Artikel bietet eine gute Einführung in neuronale Netzwerke und neuronale maschinelle Übersetzung. Wenn Sie Lust haben, können Sie einige einfache „Experimente“ mit neuronalen Netzen und Worteinbettungen durchführen.
    • Materialien aus dem Kurs Pre-Editing, MT, Post-Editing aus dem FS 24 auf Moodle
  • Sie lernen die wahrscheinlich wichtigste Quelle für parallele Korpora kennen: Opus Corpora.
  • Sie besorgen sich eine Arbeitsumgebung mit einem Unix-Terminal, richten diese ein und lernen grundlegende Unix-Befehle kennen.
  • Sie lernen Unix-Befehle, die eine grundlegende Vorverarbeitung paralleler Korpora ermöglichen.
  • Sie lernen wie man in Python geschriebene Skripte ausführt.

2. Empfohlene Lektüre

Artikel von Antoni Oliver:

  • Das Original auf Spanisch
  • Die übersetzung auf Deutsch (von mir mit Hilfe von NMT)

Zu diesen Materialien gibt es ein zugehöriges Github-Repository: https://github.com/aoliverg/materiales-TAN. Dort finden Sie eine Reihe von Programmen, mit denen Sie kleine Experimente mit neuronalen Netzwerken und Embeddings durchführen können.

3 Parallele Korpora

4 Linux auf Ihrem Computer

5 Grundlegende UNIX Befehle