Anotação de Imagens - edgebr/huawei-smart-cities-wiki GitHub Wiki
Nesse projeto anotou-se três tipos de objetos nas imagens:
- Pessoas;
- Armas;
- Capacetes de moto.
Buscou-se encontrar vídeos e imagens que continham os objetos requeridos, principalmente no contexto de câmeras de segurança. Assim, as imagens utilizadas no projeto foram coletadas de datasets de código aberto e de vídeos encontrados na internet (youtube, twitter, dailymontion, etc.). No caso dos vídeos, foi-se necessário a extração de frames de cada um deles e para isso utilizou-se um [código em python (https://github.com/edgebr/huawei-smart-cities-wiki/blob/main/ai/scripts/process_dcssas.py).
Utilizou-se duas ferramentas para a anotação das imagens, o EVA: Video Annotation Tool e o LabelImg.
EVA é uma ferramenta web para anotação de vídeos e sequências de imagens. A anotação é feita desenhando caixas delimitadoras (bounding boxes) de uma classe de objetos definidas pelo usuário. Por fim, essas anotações podem ser exportadas no formato YOLO ou Pascal VOC.
O grande diferencial dessa ferramenta para as demais é sua capacidade de rastrear um mesmo objeto em imagens/frames posteriores. Com isso, é possível poupar bastante tempo no processo de anotação, mas é preciso tomar cuidado ao utilizar esse rastreio para uma quantidade muito grande de objetos, pois isso pode fazer com que o desempenho geral do programa piore.
LabelImg é uma ferramenta gráfica de anotação de imagens. A anotação é feita desenhando caixas delimitadoras (bounding boxes) de uma classe de objetos definidas pelo usuário e podem ser salvas como arquivos XML no formato PASCAL VOC, YOLO ou CreateML.
Em comparação com o EVA, ele apresenta um desempenho um pouco melhor e possui a capacidade de dar zoom nas imagens. No entanto, não possui a capacidade de rastrear objetos.
Em todo o processo de anotação de imagens nesse projeto utilizou-se o formato YOLO. Esse formato consiste de um arquivo .txt
para cada imagem, contendo a classe, as coordenadas x e y, a altura e a largura de cada objeto.
<object-class> <x> <y> <width> <height>
Assim, devido a seu texto resumido, de fácil leitura e entendimento, o formato YOLO foi escolhido como o padrão do projeto.
O processo de anotação das imagens feito nesse projeto seguiu as seguintes etapas:
- Escolher o programa para anotação de preferência;
- Selecionar as imagens a serem anotadas e definir o formato de anotação para YOLO;
- Desenhar as caixas delimitadoras para cada pessoa, armas e capacetes nas imagens de forma mais precisa possível;
- Revisar se todos os objetos foram anotados e se foram anotados com as classes corretas;
- Exportar as imagens e anotações, checando se cada imagem tem seu respectivo arquivo de anotação.