W49 , 18.12.03~18.12.09 - NJU-NLP/IntelligentSearch GitHub Wiki
Search Platform
本周主要进展:在服务器上尝试配置docker、SooPAT及百度Google专利搜索引擎比较、初步规划智能引擎框架
下周计划:配置完成docker、创建工程
存在的困难:因服务器上系统为win7,docker配置存在许多问题 1.只能用低版本的docker toolbox进行配置 2.docker配置工程中需要进入服务器的BIOS打开按钮
Semantic Search Engine
本周主要进展:了解了文本分类的经典算法,对CNN和textCNN进行了着重了解,并在网络上面下载的数据集上做了测试。
下周计划:1.更深入了解textCNN 2.对服务器上的原始数据进行批处理
存在的困难:1.服务器上python3可以配置出来,但是cmd命令行pip报错(待解决) 2.服务器上的原始数据规模太大,训练模型难度较大
Patent Mining
本周主要进展:进行LDA算法的改进,了解专利地图。
下周计划:继续改进LDA算法。
存在的困难:无。