Anotação de Imagens - edgebr/huawei-smart-cities-wiki GitHub Wiki

Objetos anotados

Nesse projeto anotou-se três tipos de objetos nas imagens:

  1. Pessoas;
  2. Armas;
  3. Capacetes de moto.

Coleta das imagens

Buscou-se encontrar vídeos e imagens que continham os objetos requeridos, principalmente no contexto de câmeras de segurança. Assim, as imagens utilizadas no projeto foram coletadas de datasets de código aberto e de vídeos encontrados na internet (youtube, twitter, dailymontion, etc.). No caso dos vídeos, foi-se necessário a extração de frames de cada um deles e para isso utilizou-se um [código em python (https://github.com/edgebr/huawei-smart-cities-wiki/blob/main/ai/scripts/process_dcssas.py).

Datasets

Ferramentas para anotação

Utilizou-se duas ferramentas para a anotação das imagens, o EVA: Video Annotation Tool e o LabelImg.

EVA é uma ferramenta web para anotação de vídeos e sequências de imagens. A anotação é feita desenhando caixas delimitadoras (bounding boxes) de uma classe de objetos definidas pelo usuário. Por fim, essas anotações podem ser exportadas no formato YOLO ou Pascal VOC.

O grande diferencial dessa ferramenta para as demais é sua capacidade de rastrear um mesmo objeto em imagens/frames posteriores. Com isso, é possível poupar bastante tempo no processo de anotação, mas é preciso tomar cuidado ao utilizar esse rastreio para uma quantidade muito grande de objetos, pois isso pode fazer com que o desempenho geral do programa piore.

LabelImg é uma ferramenta gráfica de anotação de imagens. A anotação é feita desenhando caixas delimitadoras (bounding boxes) de uma classe de objetos definidas pelo usuário e podem ser salvas como arquivos XML no formato PASCAL VOC, YOLO ou CreateML.

Em comparação com o EVA, ele apresenta um desempenho um pouco melhor e possui a capacidade de dar zoom nas imagens. No entanto, não possui a capacidade de rastrear objetos.

Formato de anotação

Em todo o processo de anotação de imagens nesse projeto utilizou-se o formato YOLO. Esse formato consiste de um arquivo .txt para cada imagem, contendo a classe, as coordenadas x e y, a altura e a largura de cada objeto.

<object-class> <x> <y> <width> <height>

Assim, devido a seu texto resumido, de fácil leitura e entendimento, o formato YOLO foi escolhido como o padrão do projeto.

Processo de anotação

O processo de anotação das imagens feito nesse projeto seguiu as seguintes etapas:

  1. Escolher o programa para anotação de preferência;
  2. Selecionar as imagens a serem anotadas e definir o formato de anotação para YOLO;
  3. Desenhar as caixas delimitadoras para cada pessoa, armas e capacetes nas imagens de forma mais precisa possível;
  4. Revisar se todos os objetos foram anotados e se foram anotados com as classes corretas;
  5. Exportar as imagens e anotações, checando se cada imagem tem seu respectivo arquivo de anotação.
⚠️ **GitHub.com Fallback** ⚠️