Przetwarzanie danych do plików csv - SigmaNgo/SMW GitHub Wiki
- Po sklonowaniu repo przejdź do folderu
/rawData/
.
- Zmień wszystkie pliki .doc do .docx (z niestotnego powodu pliki .doc nie są dobrze obsługiwane przez użyty poniżej skrypt; procedura zmiany .doc do .docx musi się odbyć za pomocą narzędzia spoza niniejszego repo).
- Wykonaj komendę
python transformAllFiles.py ../transformedData/
.
- Skrypt transformuje wszystkie napotkane pliki .docx i .odt do plików .csv.
Specyfikacja czym jest plik csv znajduje się tutaj i tutaj.