Chama-se de extração de características todo o conjunto de operações de processamento e análise de imagens realizadas com a finalidade de obter valores numéricos que caracterizam as imagens ou partes delas. Este artigo fala do universo de características que podemos extrair das imagens, e de como encontrar o conjunto delas que vai ser importante para cada situação.
Este texto aqui (baseado nos conceitos desenvolvidos em um trabalho de Rodenacker e Bengtsson (2003)) eu tenho copiado/colado em vários outros trabalhos depois que escrevi para a minha dissertação de mestrado. O alto nível de reciclagem indica que ele é extremamente útil, por isso resolvi publicá-lo aqui (com as devidas adaptações).
Extração de Características
Rodenacker e Bengtsson (2003) publicaram um estudo sobre técnicas de extração de características que, embora tenha sido motivado pela pesquisa em citologia, serve como referência para quaisquer aplicações de análise de imagens. Nele os autores apresentam um sistema de taxonomia para as características que podem ser extraídas das imagens digitais. O sistema usa padrões claros de nomenclatura e definição de características, e eu acabei adotando de modo generalizado.
As características são agrupadas em quatro grandes categorias:
a) Características Morfológicas
São as medidas da forma dos objetos que compõem a imagem. Elas não levam em conta a intensidade dos pixels e podem ser calculadas sobre imagens binárias que resultam do processamento das imagens coloridas.
Circularidade, área, largura, etc.
b) Características Cromáticas
São as que descrevem a cor, ou composição espectral da radiação emitida ou refletida dos objetos, quantificada pela intensidade dos pixels em diferentes bandas espectrais (que significa… cor).
Medidas estatísticas das intensidades, como média, mediana, desvio-padrão, e outras, são usadas para caracterizar os pixels pertencentes a cada objeto. Estas características podem ser extraídas diretamente de cada banda que compõe a imagem.
c) Características Texturais
São medidas que caracterizam a variabilidade local das intensidades dos pixels. Dentre as várias formas de medir texturas, há os métodos que utilizam a de matriz de co-ocorrência, dos quais já falei aqui no blog.
d) Características Estruturais ou Contextuais
Estes descrevem a relação entre um ou mais objetos que compõem a imagem, com por exemplo, a posição do núcleo de uma célula com relação à sua membrana. Lembro que este conceito foi o mais difícil de entender quando tive esta aula, mas pode ser que um exemplo sirva para amenizar a confusão.
No post da semana passada, que analisava um caso de segmentação em uma imagem de um pino em um dente, precisamos segmentar apenas as áreas que estavam dentro de uma camada. Para isso precisamos identificar a camada em questão e as áreas de cor branca. Eram necessários dados de duas regiões para decidir se uma delas seria incluída na amostra – isto marca uma característica estrutural.
Na prática
Na prática percebi que esta classificação não tem só o sentido semântico bem organizado – ela ajuda na implementação da classificação também.
C. Morfológicas podem ser obtidas usando só o perímetro de uma área; as Cromáticas precisam das 3 bandas da imagem; Texturais são normalmente de processamento mais lento (só use-as quando nada mais funcionar); e as Estruturais usam informações já calculadas dentro dos outros grupos de características.
Referência:
Rodenacker K, & Bengtsson E (2003). A feature set for cytometry on digitized microscopic images. Analytical cellular pathology : the journal of the European Society for Analytical Cellular Pathology, 25 (1), 1-36 PMID: 12590175


