Создание рабочей модели сбора информации с сайтов при помощи webHarvest, чтобы набрать базу для тестов.
Проектирование базы данных, создание базового контроллера для взаимодействия с базой.
Реализация простейших методов анализа комментариев на семантику
Начало разработки веб-интерфейса (чтобы не оставлять на самый конец)
Второй этап:
Проект собирается
Базовый контроллер бд
Обработка простых запросов
Третий этап:
Проект по-прежнему собирается даже лучше чем раньше
Контроллер БД соответствует необходимому минимуму для запросов рода "получить отзывы на товар", "получить тезисы о товаре"
Методы анализа комментариев позволяют выделить примерный набор тезисов
Рабочий, не пугающий веб-интерфейс
План задач на альфу
5-12.10.2011
Александр, Руслан - webHarvest, наладить сбор данных, сделать базу комментариев. Есть риск не успеть из-за сложности структуры сайтов интернет-магазинов.
Олег - javaSpring, Apache Tomcat. Задача настроить веб-сервер, разобраться с тем как принимать и обрабатывать http запросы. Риск технологии достаточно сложные, банально может не хватить времени.
Сергей - Создать таблицы БД, реализовать контроллер с базовыми функциями. Риск - сложность освоение технологии, нехватка времени.
12-19.10.2011
Александр, Руслан - webHarvest(основное направление до тех пор, пока не получится перевести сбор информации в фоновый режим). Если webHarvest освоен, сбор информации не занимает много времени, Александр и Руслан приступают к части алгоритмов обработки информации.Риск: может не получиться нормально автоматизировать сбор информации webHarvest-ом.
Олег - Сделать так, чтобы сервер работал, отвечал на базовые запросы. Риск не уложиться во время.
Сергей - расширение функционала контроллера БД. Риск не уложиться во время.
19-26.10.2011
26-2.10-11.2011
2-9.11.2011
Бета-версия
Переход с webHarvest на lucene
Развитие интеллекта системы (модуль miner)
Разработка виджета
Разработка дружелюбного интерфейса
Расширение набора пользовательских запросов
Добавление пользовательской и временной БД для снижения нагрузки на основную и увеличения скорости отклика на запросы пользователей