深度学习入门过程 - ouyuming/AiLearn GitHub Wiki
第一轮汇报结果
任务一:用python切割voc数据集的图片,根据其中的坐标切成一张张图片,每一张图片对应一个标签
一、参考内容
(一)OpenCV—Python图像指定区域裁剪(思路有误,最后采取了PIL)
https://blog.csdn.net/wsp_1138886114/article/details/82778409
(二)Python读取xml中的数据(未能成功切割图片,怀疑读取xml出现bug)
https://www.w3cschool.cn/python/python-xml.html
备注:xml.dom解析xml无误,保存图片的路径出现问题
(三)python图片剪裁(图片按xml中四个点坐标剪裁)
https://blog.csdn.net/qq_21997625/article/details/81453690
(四)Python裁剪voc数据集目标区域图片
https://blog.csdn.net/along1617188/article/details/103071653
(五)Python:批量按xml标注将目标crop剪切图片并按类保存到相应文件夹
https://blog.csdn.net/qq_41277822/article/details/104132926
(六)Python读取xml数据,cv2裁剪图片实例(用处不大)
https://www.jb51.net/article/182314.htm
(七)pillow模块Image.crop()函数切割图片方法,参数说明
https://www.cnblogs.com/zrmw/archive/2019/09/05/11467046.html
(八)PIL参考文档(切割图片的重要突破口)
https://www.osgeo.cn/pillow/reference/Image.html
二、汇报总结
(一)程序bug:切割后图片数少于未切割图片数 (1)解决方案:更换数据集测试 (2)下载链接:https://blog.csdn.net/aaronmorgan/article/details/100634418
(二)假设原因:xml的数量与未切割图片数量不对应 假设成立,2012中xml注解数量少于图片数量,导致切割出来的图片数量少于对应图片数量
(三)待补充功能:要生成一个文件,能够对应标注图片的类型(已基本完成) 结果:1xxxx.jpg:狗 备注:文件类型不限!
(四)任务二:切完的数据集(人,狗,猫),合并(图片和标签)文件,能用程序【拆开,与合并】
第二轮汇报内容
一、任务
(一)调试bug(完成)
(二)补充功能(未完成)
(1)生成txt文件,保存图片路径和图片类型,如下图所示
参考链接:python创建一个txt文件
https://blog.csdn.net/ljlchrr/article/details/84000908
(2)将图片的类型和图片的绝对路径存入txt文件中 1.疑问:### 图片的路径是存绝对路径还是相对路径? 2.执行步骤如下,将对应的参数直接写入txt文件即可 1)将一张图片切割为多张 2)将每一张图片的名称、类型、存储的绝对路径存入txt文件中 3)在txt_create方法中,接收参数, 是切完一个图片,就将图片类型和存储绝对路径保存一次好?(已实现,但是有bug) 1)取到图片类型名与存储的绝对路径 2)如果没有名为txt的文件,则创建一个新的文件
如果存在该文件,则将图片类型名与存储的绝对路径存入 备注:将生成的文件放到voc文件的目录下会更好
还是用list保存所有的图片类型和存储绝对路径,再一次性传入txt_creat方法中,最后一次性存入txt文件中?
(三)完成任务二 任务描述:切完的数据集(人,狗,猫),合并(图片和标签)文件,能用程序【拆开,与合并】
- 1.合并切割后的图片与生成的txt标签文件
- 合并成啥文件?
- 如何合并文件?
- 参考链接如下:
- (图像分类任务)读取文件夹所有图片并保存txt,并将图片保存为imdb格式 https://blog.csdn.net/u011376607/article/details/80784084
- Caffe:如何将图片数据转换成lmdb文件 https://www.cnblogs.com/gongdiwudu/p/6367433.html
- Pytorch中Tensor与各种图像格式的相互转化 https://blog.csdn.net/qq_36955294/article/details/82888443
二、第二轮汇报
- (一)VOC2012的数据集中的XML有缺失,换回2007后,得出的结果正常。
- (二)已经将图片的存储路径和图片类型按照格式存入txt文本中。
- (三)在突破将图片和txt文件压缩成imdb格式文件。
三、第三轮待整合
一、学术框架:Kaggle猫狗识别Pytorch详细搭建过程 备注:谨慎使用tensorflow,不适合学术
二、会议论文 ICCV CVPR2020(有,6) ECCV2020
三、文章看顶级会议,不看期刊 备注:看有代码的文章
1.看看公司用什么框架 2.使用服务器 全靠自己!
四、搜索论文技巧,用拼音 百度学术:ZhouFeng