Przetwarzanie danych do plików csv - SigmaNgo/SMW GitHub Wiki

  1. Po sklonowaniu repo przejdź do folderu /rawData/.
  2. Zmień wszystkie pliki .doc do .docx (z niestotnego powodu pliki .doc nie są dobrze obsługiwane przez użyty poniżej skrypt; procedura zmiany .doc do .docx musi się odbyć za pomocą narzędzia spoza niniejszego repo).
  3. Wykonaj komendę python transformAllFiles.py ../transformedData/.
  4. Skrypt transformuje wszystkie napotkane pliki .docx i .odt do plików .csv.

Specyfikacja czym jest plik csv znajduje się tutaj i tutaj.