博物馆网站数据采集子系统周记 - sekaiiiii/BUCTCS1703SECD GitHub Wiki

博物馆网站数据采集子系统周记

第六周周记

本周工作：

确定了团长和组长人选。
确定了各组人员
初步确定了技术栈

本组工作：

博物馆数据采集子系统

本组人员

组长：曹锦华组员：周强柱、李宇洋、李霄

初步确定的技术栈

前端：react native
后端：nodejs
数据库：mysql

周记更新人员：曹锦华

第七周周记

本周要完成的任务

GitHub上创建自己小组的目录
完成各个小组的项目管理计划，周记
各个小组的需求文档，越详细越好
周五晚八点之前完成

本周已完成的任务

GitHub上已创建本小组的目录
项目管理计划第一版已完成
周记已上传
需求文档已完成
周二召开了小组内例会，安排了工作，分配了学习任务
小组成员进行了python学习，确定了部分技术栈（BeautifulSoup4）
提出了关于爬取数据的数据结构问题。

周记更新人员：曹锦华

第八周周记

本周安排工作

对项目管理文档进行修改-李宇洋
对需求文档进行修改-李宇洋
确定爬取数据的数据结构-曹锦华、周强柱
本周出一点成果

组内分工正式明确

文档撰写人员：李霄、李宇洋
代码编写人员：曹锦华、周强柱
代码测试人员：周强柱

本周学习任务

爬虫开发学习，周强柱提出使用scrapy框架可以更便捷的爬取数据，组员开始学习scrapy
继续学习如何编写爬虫和网页基本知识

本周已完成工作

周一开了组内会议，完成了本周工作分配和学习任务
组内人员完成了对GitHub的初步学习，基本掌握了GitHub的使用
需求文档已完成并上传至班级GitHub库
跟二组人员开了一次沟通会，明确了要爬取的格式和内容
代码编写人员开始第一版的代码编写，在自己电脑中尝试爬取数据
完成了对scrapy框架的初步学习，按照教程对一些网站进行了文本爬取

周记更新人员：曹锦华

第九周周记

本周工作

召开本周小组工作例会分配了本周任务：

撰写设计文档：李宇洋、李霄
代码编写：曹锦华、周强柱任务截止时间与要求：
设计文档本周三出初稿，交由曹锦华进行技术部分修改
设计文档要求Markdown格式
代码编写本周三拿出爬取的第一版可以使用的数据
周三后开始对爬取数据直接存进数据库的代码编写

本周已完成工作

召开组内例会参加了团内关于ER图的会议，确定了负责部分的ER图

周记更新人员：曹锦华

第十周周记

本周工作

继续进行数据爬取和代码的编写
完成对数据上传到服务器数据库的工作

其他事项

由于技术实现遇上难题，申请了第二组的人员支持
第二组组员张俊峰将在本周对本组工作进行支持和指导

工作进展

完成了对130家博物馆的经纬度数据的确定与上传
完成了部分博物馆的基本信息爬取

周记更新人员：曹锦华

第十一周周记

本周工作

继续进行数据爬取和代码的编写继续完成数据上传到服务器数据库的工作对数据库进行了修改

周记更新人员：曹锦华

第十二周周记

本周工作

与第二组成员一同进行会议研讨
继续进行数据爬取和代码的编写
继续完成数据上传到服务器数据库的工作

周记更新人员：曹锦华

第十三周周记

本周工作

已完成博物馆基本信息爬取
正在进行博物馆展览信息、教育信息、藏品信息爬取

周记更新人员：曹锦华

#第十四周周记 ##本周工作

提交软件测试报告
提交用户使用手册
准备答辩相关事宜
完善代码库
完善数据库数据

周记更新人员：曹锦华