博物馆网站数据采集子系统周记 - sekaiiiii/BUCTCS1703SECD GitHub Wiki
博物馆网站数据采集子系统周记
第六周周记
本周工作:
- 确定了团长和组长人选。
- 确定了各组人员
- 初步确定了技术栈
本组工作:
博物馆数据采集子系统
本组人员
组长:曹锦华 组员:周强柱、李宇洋、李霄
初步确定的技术栈
- 前端:react native
- 后端:nodejs
- 数据库:mysql
周记更新人员:曹锦华
第七周周记
本周要完成的任务
- GitHub上创建自己小组的目录
- 完成各个小组的项目管理计划,周记
- 各个小组的需求文档,越详细越好
- 周五晚八点之前完成
本周已完成的任务
- GitHub上已创建本小组的目录
- 项目管理计划第一版已完成
- 周记已上传
- 需求文档已完成
- 周二召开了小组内例会,安排了工作,分配了学习任务
- 小组成员进行了python学习,确定了部分技术栈(BeautifulSoup4)
- 提出了关于爬取数据的数据结构问题。
周记更新人员:曹锦华
第八周周记
本周安排工作
- 对项目管理文档进行修改-李宇洋
- 对需求文档进行修改-李宇洋
- 确定爬取数据的数据结构-曹锦华、周强柱
- 本周出一点成果
组内分工正式明确
- 文档撰写人员:李霄、李宇洋
- 代码编写人员:曹锦华、周强柱
- 代码测试人员:周强柱
本周学习任务
- 爬虫开发学习,周强柱提出使用scrapy框架可以更便捷的爬取数据,组员开始学习scrapy
- 继续学习如何编写爬虫和网页基本知识
本周已完成工作
- 周一开了组内会议,完成了本周工作分配和学习任务
- 组内人员完成了对GitHub的初步学习,基本掌握了GitHub的使用
- 需求文档已完成并上传至班级GitHub库
- 跟二组人员开了一次沟通会,明确了要爬取的格式和内容
- 代码编写人员开始第一版的代码编写,在自己电脑中尝试爬取数据
- 完成了对scrapy框架的初步学习,按照教程对一些网站进行了文本爬取
周记更新人员:曹锦华
第九周周记
本周工作
召开本周小组工作例会 分配了本周任务:
- 撰写设计文档:李宇洋、李霄
- 代码编写:曹锦华、周强柱 任务截止时间与要求:
- 设计文档本周三出初稿,交由曹锦华进行技术部分修改
- 设计文档要求Markdown格式
- 代码编写本周三拿出爬取的第一版可以使用的数据
- 周三后开始对爬取数据直接存进数据库的代码编写
本周已完成工作
召开组内例会 参加了团内关于ER图的会议,确定了负责部分的ER图
周记更新人员:曹锦华
第十周周记
本周工作
- 继续进行数据爬取和代码的编写
- 完成对数据上传到服务器数据库的工作
其他事项
- 由于技术实现遇上难题,申请了第二组的人员支持
- 第二组组员张俊峰将在本周对本组工作进行支持和指导
工作进展
- 完成了对130家博物馆的经纬度数据的确定与上传
- 完成了部分博物馆的基本信息爬取
周记更新人员:曹锦华
第十一周周记
本周工作
继续进行数据爬取和代码的编写 继续完成数据上传到服务器数据库的工作 对数据库进行了修改
周记更新人员:曹锦华
第十二周周记
本周工作
- 与第二组成员一同进行会议研讨
- 继续进行数据爬取和代码的编写
- 继续完成数据上传到服务器数据库的工作
周记更新人员:曹锦华
第十三周周记
本周工作
- 已完成博物馆基本信息爬取
- 正在进行博物馆展览信息、教育信息、藏品信息爬取
周记更新人员:曹锦华
#第十四周周记 ##本周工作
- 提交软件测试报告
- 提交用户使用手册
- 准备答辩相关事宜
- 完善代码库
- 完善数据库数据