Результаты обработки архивов - PetrovaDaria/software-glitches GitHub Wiki

Всего было обработано 2259 веб-архивов, которые содержали в себе 42,580,871 текстов.
Обработка была распараллелена на 8 потоков.

Общее время скачивания веб-архивов - 238697.89301799994 секунд ~ 3978 минут ~ 66 часов.
Общее время распаковки веб-архивов - 561443.5059710002 секунд ~ 9357 минут ~ 155 часов.
Общее время обработки веб-архивов - 2811144.8302679993 секунд ~ 46852 минут ~ 780 часов.

Количество текстов, содержащих слова из обеих категорий - 3,584,466.
Количество текстов, содержащих словосочетания - 347,268.
После повторной обработки количество текстов, содержащих слова из обеих категорий - 344,240.