Page Index - mkappus1/DatenmanagementMTHS24 GitHub Wiki
51 page(s) in this GitHub Wiki:
- Home
- 1 Aufgabe UNIX Befehle
- 1 Übung: Inhalt von 2 Dateien in einer Datei tabellenförmig zusammenfassen
- 1.3 Parallele Korpora
- 1.4 Linux auf Ihrem Computer
- 1.5 Grundlegende UNIX Befehle
- 1.6 Grundlegende Korpusvorbereitung mit Unix Befehlen
- 1.6 Schritt für Schritt
- 2.2 Vorarbeiten
- 2.3 Konvertieren von TMX in Tabelle
- 2.4 Alignment mit LF Aligner
- 2.5 Alignment mit hunalign
- 3.1 Übersicht
- 3.2. Die Sitemap erstellen
- 3.3 Herunterladen der Inhalte der Website (I)
- 3.4 Herunterladen der Inhalte der Website (II) ‐Trafilatura
- 3.4 Konvertierung in Text
- 3.5 Konvertierung in Text ‐ noch nicht zu bearbeiten
- 4. Erstellung paralleler Korpora (III). Alignment der heruntergeladenen Websites
- 5.1 Übersicht
- A.1 Python Virtuelle Umgebungen Voraussetzungen
- A.2 Übersicht Python Installation
- Anleitungen Nutzung
- Exkurs ‐ Ausgabeumleitung in UNIX
- Exkurs ‐ Das Dienstprogramm grep
- Exkurs ‐ Der Befehl "sudo"
- Exkurs ‐ die Werkzeuge more, less und nano
- Exkurs ‐ Pfade in UNIX Linux Umgebungen
- Exkurs ‐ Pythonbibliotheken und die Datei requirements.txt
- Exkurs ‐ RAW dateien in Github
- Exkurs ‐ Selenium und andere Strategien für das Webscraping
- Exkurs ‐ SQLite
- Exkurs ‐ Truecasing
- Exkurs ‐ Was ist eine Batch‐Datei?
- Exkurs ‐ YAML Dateien
- Exkurs: Tokenisierung
- Freiwillige Übung Subword‐Segmentierung
- Kurzübersicht Check‐Liste Block 6
- Test
- test woche 4
- Willkommen
- Woche 1
- Woche 1: Tipps und Tricks
- Woche 2
- Woche 2: Anleitung LF‐Aligner
- Woche 2: Tipps & Tricks
- Woche 6: Korpusbereinigung
- Woche 7
- Woche‐1
- Woche‐1.Woche‐1‐Hauptseite
- Woher weiss ich ich einen Grafikprozessor habe oder nicht?