博物馆网站数据采集子系统周记 - sekaiiiii/BUCTCS1703SECD GitHub Wiki

博物馆网站数据采集子系统周记

第六周周记

本周工作:

  1. 确定了团长和组长人选。
  2. 确定了各组人员
  3. 初步确定了技术栈

本组工作:

博物馆数据采集子系统

本组人员

组长:曹锦华 组员:周强柱、李宇洋、李霄

初步确定的技术栈

  1. 前端:react native
  2. 后端:nodejs
  3. 数据库:mysql

周记更新人员:曹锦华

第七周周记

本周要完成的任务

  1. GitHub上创建自己小组的目录
  2. 完成各个小组的项目管理计划,周记
  3. 各个小组的需求文档,越详细越好
  4. 周五晚八点之前完成

本周已完成的任务

  1. GitHub上已创建本小组的目录
  2. 项目管理计划第一版已完成
  3. 周记已上传
  4. 需求文档已完成
  5. 周二召开了小组内例会,安排了工作,分配了学习任务
  6. 小组成员进行了python学习,确定了部分技术栈(BeautifulSoup4)
  7. 提出了关于爬取数据的数据结构问题。

周记更新人员:曹锦华

第八周周记

本周安排工作

  1. 对项目管理文档进行修改-李宇洋
  2. 对需求文档进行修改-李宇洋
  3. 确定爬取数据的数据结构-曹锦华、周强柱
  4. 本周出一点成果

组内分工正式明确

  • 文档撰写人员:李霄、李宇洋
  • 代码编写人员:曹锦华、周强柱
  • 代码测试人员:周强柱

本周学习任务

  • 爬虫开发学习,周强柱提出使用scrapy框架可以更便捷的爬取数据,组员开始学习scrapy
  • 继续学习如何编写爬虫和网页基本知识

本周已完成工作

  1. 周一开了组内会议,完成了本周工作分配和学习任务
  2. 组内人员完成了对GitHub的初步学习,基本掌握了GitHub的使用
  3. 需求文档已完成并上传至班级GitHub库
  4. 跟二组人员开了一次沟通会,明确了要爬取的格式和内容
  5. 代码编写人员开始第一版的代码编写,在自己电脑中尝试爬取数据
  6. 完成了对scrapy框架的初步学习,按照教程对一些网站进行了文本爬取

周记更新人员:曹锦华

第九周周记

本周工作

召开本周小组工作例会 分配了本周任务:

  • 撰写设计文档:李宇洋、李霄
  • 代码编写:曹锦华、周强柱 任务截止时间与要求:
  • 设计文档本周三出初稿,交由曹锦华进行技术部分修改
  • 设计文档要求Markdown格式
  • 代码编写本周三拿出爬取的第一版可以使用的数据
  • 周三后开始对爬取数据直接存进数据库的代码编写

本周已完成工作

召开组内例会 参加了团内关于ER图的会议,确定了负责部分的ER图

周记更新人员:曹锦华

第十周周记

本周工作

  1. 继续进行数据爬取和代码的编写
  2. 完成对数据上传到服务器数据库的工作

其他事项

  • 由于技术实现遇上难题,申请了第二组的人员支持
  • 第二组组员张俊峰将在本周对本组工作进行支持和指导

工作进展

  1. 完成了对130家博物馆的经纬度数据的确定与上传
  2. 完成了部分博物馆的基本信息爬取

周记更新人员:曹锦华

第十一周周记

本周工作

继续进行数据爬取和代码的编写 继续完成数据上传到服务器数据库的工作 对数据库进行了修改

周记更新人员:曹锦华

第十二周周记

本周工作

  • 与第二组成员一同进行会议研讨
  • 继续进行数据爬取和代码的编写
  • 继续完成数据上传到服务器数据库的工作

周记更新人员:曹锦华

第十三周周记

本周工作

  • 已完成博物馆基本信息爬取
  • 正在进行博物馆展览信息、教育信息、藏品信息爬取

周记更新人员:曹锦华

#第十四周周记 ##本周工作

  1. 提交软件测试报告
  2. 提交用户使用手册
  3. 准备答辩相关事宜
  4. 完善代码库
  5. 完善数据库数据

周记更新人员:曹锦华