W48,18.11.26~18.12.02 - NJU-NLP/IntelligentSearch GitHub Wiki
Search Platform
本周主要进展:在服务器上尝试配置docker、SooPAT及百度Google专利搜索引擎比较、初步规划智能引擎框架
下周计划:配置完成docker、创建工程
存在的困难:因服务器上系统为win7,docker配置存在许多问题 1.只能用低版本的docker toolbox进行配置 2.docker配置工程中需要进入服务器的BIOS打开按钮
Semantic Search Engine
本周主要进展:在服务器上配置了网络环境,下载了sql server 2008 R2,把mdf数据文件导入到了DB中; 编写了中文分词和去停用词的代码; 初步了解TensorFlow
下周计划:进一步了解TensorFlow和CNN
存在的困难:三个人一台服务器有些影响效率
Patent Mining
本周主要进展:打开了mdf文件,完成小数据集的LDA算法。
下周计划:在大数据集上跑LDA算法并改进LDA算法。
存在的困难:服务器需要Python3,无权限修改。