Woche‐1 - mkappus1/DatenmanagementMTHS24 GitHub Wiki

1. Einleitung

In dieser ersten Woche des Kurses werden wir die folgenden Aktivitäten durchführen:

  • Empfohlene Lektüre:
    • Neuronale maschinelle Übersetzung, einige Lehrmaterialien der UOC, die ich geschrieben habe und die eine gute Einführung in neuronale Netzwerke und neuronale maschinelle Übersetzung sein können. Wenn Sie Lust haben, können Sie einige einfache „Experimente“ mit neuronalen Netzen und Worteinbettungen durchführen.
    • Materialien aus dem Kurs Pre-Editing, MT, Post-Editing aus dem FS 24 auf Moodle
  • Sehen Sie sich das Haupt-Repository für parallele Korpora an: Opus Corpora.
  • Besorgen Sie sich eine Arbeitsumgebung mit einem Linux-Terminal und lernen Sie die grundlegenden Unix-Anweisungen.
  • Lernen Sie die Unix-Befehle, die uns eine grundlegende Vorverarbeitung paralleler Korpora ermöglichen.
  • Lernen Sie, wie man in Python geschriebene Skripte ausführt.

2. Empfohlene Lektüre

Diese Woche empfehle ich Ihnen die Lektüre einiger UOC-Lehrmaterialien, die ich für verschiedene Themen vorbereitet habe: Neuronale maschinelle Übersetzung. Ich denke, es ist eine gute Einführung in neuronale Netzwerke und neuronale maschinelle Übersetzungssysteme.

Zu diesen Materialien gibt es ein zugehöriges Github-Repository: https://github.com/aoliverg/materiales-TAN. Dort finden Sie eine Reihe von Programmen, mit denen Sie einige interessante Experimente mit neuronalen Netzwerken und Embeddings durchführen können. Im Laufe dieser Woche werde ich sie besprechen, falls jemand sie durchführen möchte. Bevor Sie diese Programme ausprobieren, sollten Sie einen Blick darauf werfen, wo ich über Python spreche.

3 Parallele Korpora