Woche 2: Anleitung LF‐Aligner - mkappus1/DatenmanagementMTHS24 GitHub Wiki

Woche 2: Anleitung LF-Aligner

LF Aligner ist ein kostenloses Open-Source-Tool, das Übersetzern bei der Erstellung von Translation Memories (TMs) durch das Alignment zweisprachiger Texte helfen soll. Es ist besonders nützlich, wenn man Dokumente in zwei verschiedenen Sprachen hat und eine Translation-Memory-Datei erstellen möchte, die später in verschiedenen CAT-Tools (Computer-Aided Translation) wie SDL Trados, OmegaT oder memoQ verwendet werden kann.

Die Software funktioniert, indem sie Sätze aus den Dokumenten in der Ausgangs- und Zielsprache mithilfe von Hunalign, einem Algorithmus, der automatisch entsprechende Textsegmente abgleicht, miteinander verknüpft. Hun Align schauen wir später noch genauer an. LF Aligner unterstützt mehrere Dateiformate, darunter TXT, DOC, DOCX, RTF, PDF und HTML, und kann die abgeglichenen Daten in Formaten wie TMX, tabulatorgetrenntes TXT und XLS ausgeben.

LF Aligner kann von der Webseite Sourceforge heruntergeladen werden.:

grafik

Nachdem Klick auf die Schaltfläche Download wird die aktuelle Version von LF Aligner als ZIP-Datei für das Betriebssystem heruntergladen, das auf dem Rechner läuft (hier Windows).

grafik


Hinweis: Versionen für andere Betriebssysteme (oder ältere Versionen der Software können ber die Liste unter der Registerkarte Files heruntergeladen werden.

grafik


Speichern Sie die ZIP-Datei in einem geeigneten Verzeichnis und entpacken Sie sie.

grafik grafik

Suchen Sie im Unterverzeichnis aligner die Datei LF_aligner_X.YZ.exe (wobei XYZ für die Versionsnummern stehen, hier LF_aligner_4.25.exe). Starten Sie das Programm mit Doppelklick auf die .EXE Datei. Wenn alles funktioniert, erscheint zunächst ein Kommandozeilenfenster.

grafik

Dann erscheint das erste Fenster der eigentlichen Anwendung:

grafik

Hir können Sie den Dateityp der Dateien angeben, die Sie alignieren wollen. Einige Formate wie .docx oder .pdf werden dann im Hintergrund in ein Textformat umgewandelt. Bestätigen Sie mit Next.

Im nächsten Schritt wählen Sie die Sprachen für die zu alignierenden Dateien aus.

grafik

Bestätigen Sie mit Next.

Wählen Sie jeweils über Browse die beiden Dateien aus, die Sie alignieren möchten.

grafik

Bestätigen Sie mit Next.

Im Hintergrund werden die Dateien nun satzweise segmentiert. Im folgenden Dialogfenster werden Ihnen die (zahlenmässigen) Ergebnisse dieser Segmentierung (im Vergleich zur Anzahl der Absätze im Dokument) präsentiert. Wenn die Zahl der Segmente in Ausgangs- und Zieldatei einigermassen übereinstimmen (hier es hier mit 274 und 266 Segmenten der Fall ist) können Sie die Segmentierung auf Satzebene übernehmen und mit next bestätigen. Wenn nicht, können Sie über die Option revert to paragraph segmented versions mit den nach Absätzen segmentierten Dateipaaren weiterarbeiten.

grafik

Danach können Sie auswählen, ob und in welcher Arbeitsumgebung Sie das automatische Alignment prüfen und anpassen wollen.

grafik

Sie können entweder die graphische Oberfläche benutzen (siehe Screenshot unten) oder in einer Exceldatei die Anpassungfen durchführen oder auf die Prüfung und Anpassung verzichten (no review)

Die grafische Oberfläche sieht folgerdermassen aus und es stehen Ihnen für die Bearbeitung des Aligments, die im Menü edit angegebenen Optionen zur Verfügung.

grafik

Wenn Sie die Bearbeitung des Alignments im Editor abgeschlossen haben, können Sie die grafische Oberfläche über save & exit verlassen. grafik

Im Assistenten können Sie nun einstellen ob Sie (zu den zweisprachigen tabulatorgetrennten Dateien) auch eine TMX-Datei als Ergebnis speicher wollen. grafik

Wenn Sie eine TMX-Datei erzeugen wollen, können Sie nun weitere Einstellungen vornehmen. Zunächst können Sie die gewünschten Sprachcodes für die verwendeten Sprachen eingeben, die in der TMX-Datei verwendet werden sollen.

grafik Ausserdem können Sie einstellen ob weitere Informationen in die TMX-Datei aufgenommen werden sollen.

grafik

Nach dem Abschluss des Alignmentprozesses sollten Sie im Ordner "align_Datum_Uhrzeit grafik die folgenden Dateien finde.

grafik Öffnen Sie die TMX-Datei und die Datei "aligned_..." in einem geeigneten Texteditor zur Prüfung.

grafik

Geben Sie diese beiden Dateien auf Moodle ab.