Segmentação de Imagens incluindo Contexto em Redes Neurais Convolucionais |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
19/12/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Orientando(s) |
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Lucas Prado Osco
- Wesley Nunes Goncalves
|
Resumo |
Existe uma demanda significativa para a automação da localização e reconhecimento dos objetos e pessoas, desde a automação da agricultura até sistemas de mensuração automática do nível da água em rios, tudo realizado por sistemas de visão computacional. A atribuição dessas marcações ou rotulações é realizada atualmente em nível de pixel, técnica chamada de segmentação semântica. Porém, em uma única imagem podem existir várias classes, e frequentemente essas classes são muito parecidas, se tornando um desafio complexo a ser trabalhado. Recentemente, métodos baseados em Redes Neurais Convolucionais (CNN) alcançaram um sucesso impressionante em tarefas de segmentação semântica. Esse sucesso deve-se, entre outros fatores, à inclusão de algum contexto para auxiliar a rede, como por exemplo a informação que uma classe é mais frequente que a outra e/ou; a informação de que o dataset possui imagens com um alto nível de incerteza na rotulação dos pixels presentes nas bordas. Contudo, esses dois pontos mencionados, tanto o desequilíbrio das classes quanto à incerteza de rotulação de pixels, podem ser melhores explorados. Apresentamos uma abordagem que calcula e atribui um peso para o pixel, considerando sua classe e a incerteza durante o processo de rotulação. Os pesos dos pixels são usados durante o treinamento para aumentar ou diminuir a importância dos pixels. Alguns trabalhos são apresentados demonstrando a utilização de técnicas de segmentação semântica com inclusão de contexto, com resultados significativos em comparação com os métodos mais relevantes. Além disso, também apresentamos um método para a reconstrução da área do objeto de interesse, permitindo a reconstrução das bordas desse objeto. As técnicas aqui apresentadas podem ser utilizadas em uma ampla variedade de métodos de segmentação, melhorarando sua robustez. |
|
Counting and locating high-density objects using convolutional neural network |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
06/09/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Orientando(s) |
- Mauro dos Santos de Arruda
|
Banca |
- Bruno Brandoli Machado
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Keiller Nogueira
- Lucas Prado Osco
- Wesley Nunes Goncalves
|
Resumo |
Contagem e detecção automática de objetos são essenciais em diferentes tipos de aplicações pois permitem melhorias desempenhos na execução das tarefas manuais. Métodos de aprendizado profundo estão se destacando cada vez mais nesse tipo de aplicação pois conseguem realizar boas caracterizações dos objetos. Entretanto, desafios como a sobreposição, oclusão, diferentes de escalas e alta densidade de objetos atrapalham o desempenho desses métodos, fazendo com que esse problema permaneça aberto. Tais métodos normalmente usam anotações por caixas delimitadoras, o que prejudica seu desempenho em cenas de alta densidade com adjacência de objetos. Para superar tais limitações, avançando o estado da arte, nós propomos um método de contagem e detecção de objetos usando mapas de confiança. A primeira aplicação permitiu definir um método baseado em redes neurais convolucionais que recebem como entrada uma imagem multiespectral e detecta os objetos a partir de picos no mapa de confiança. Em uma segunda aplicação, nós inserimos informações de contexto global e local através do módulo PPM, para a detecção de objetos em diferentes escalas. Além disso, melhoramos o refinamento sucessivo do mapa de confiança com múltiplos valores de sigma na fase MSS. Na terceira aplicação do método, nós propomos um módulo de seleção de bandas para trabalhar com imagens hiperespectrais. Em uma quarta aplicação, nós avaliamos o método proposto em imagens RGB de alta densidade de objetos e comparamos com métodos do estado da arte: YOLO, Faster R-CNN e RetinaNet. Por último, expandimos o método propondo uma arquitetura de duas ramificações permitindo a troca de informações entre eles. Essa melhoria permite que o método detecte simultaneamente plantas e linhas de plantio em diferentes conjuntos de dados. Os resultados descritos nesta tese mostram que a utilização de redes neurais convolucionais e mapas de confiança para a detecção e contagem de objetos permite alto desempenho. As contribuições descritas aqui, devem suportar avanços significativos nas áreas de detecção de objetos e aprendizado profundo. |
|
Multi-task Learning Applied to Computer Vision Problems |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
28/03/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Orientando(s) |
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Lucas Prado Osco
- Paulo Eduardo Teodoro
- Vanessa Aparecida de Moraes Weber
|
Resumo |
O aprendizado profundo tem sido amplamente estudado, principalmente para resolver problemas considerados complexos. De forma geral, esses problemas podem ser descritos e divididos em um conjunto de tarefas. Essas tarefas são intrínsecas ao problema geral, ou seja, são definidas de forma natural por fazer parte da essência do problema. Além disso, elas podem ser aprendidas de forma isolada porém estão relacionadas para solução do problema geral. Outro fator importante é que para um problema maior de visão computacional, realizar as tarefas distintas individualmente se torna muito custoso em memória e tempo de inferência. Para solucionar esses problemas uma abordagem chamada Aprendizado Multitarefa (MTL) foi proposta. A ideia é simular o aprendizado humano, em que pessoas podem aprender novas tarefas através de experiências obtidas no aprendizado de tarefas similares. Essa abordagem permite o aprendizado das tarefas do problema de maneira simultânea, construindo uma relação entre elas. A partir desses direcionamentos, este trabalho na forma de coleção de artigos apresenta abordagens MTL para a resolução de problemas de visão computacional. Inicialmente, dois problemas foram abordados: detecção de linhas de plantação no primeiro artigo e detecção de alevinos no segundo. Na detecção de linhas de plantação a ideia é dividir o problema em identificar as plantas individualmente e detectar as linhas de plantação. Na detecção de alevinos as tarefas são divididas em detectar o alevino e identificar a direção desse alevino nos quadros subsequentes. Para ambos os problemas, um método foi proposto com um backbone que extrai as características iniciais para todas as tarefas. Tendo como entrada as características iniciais, ramos independentes aprendem a solução de cada tarefa. A troca de informações entre as tarefas ocorre por meio da concatenação das características extraídas em pontos específicos de cada ramo. Os resultados mostraram que o compartilhamento entre as tarefas é importante para a solução, alcançando resultados superiores ao estado-da-arte. Além das duas propostas, um novo método de segmentação semântica usando MTL e mecanismo de atenção foi proposto. O principal avanço foi o uso de pesos aprendidos por Transformers para indicar a importância de uma tarefa nas demais. Assim, apenas regiões da imagem consideradas relevantes influenciam em outras tarefas. Os resultados em dois problemas, segmentação de linhas e falhas de plantação, e segmentação da folha e desfolha, mostraram a eficácia da abordagem frente ao estado-da-arte. |
Download |
|
|
Braces minimais e suas propriedades |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
27/10/2021 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Marcelo Henriques de Carvalho
|
Orientando(s) |
|
Banca |
- Alberto Alexandre Assis Miranda
- Fabio Henrique Viduani Martinez
- Francisco Eloi Soares de Araujo
- José Coelho de Pina Junior
- Marcelo Henriques de Carvalho
|
Resumo |
McCuaig provou um teorema de geração para braces e o usou como uma ferramenta de indução
para obter uma caracterização estrutural de braces Pfaffianos.
Um brace é minimal se a remoção de qualquer aresta resulta em grafo que não é brace. A partir
do teorema de geração de braces de McCuaig, nós provamos nosso teorema principal que pode ser visto
como uma ferramenta de indução para braces minimais. Como uma aplicação, nós provamos que um
brace minimal de ordem 2n (n ≥ 6) tem no máximo 5n − 10 arestas e apresentamos uma caracterização
completa dos braces minimais para os quais esse limite superior ocorre com igualdade.
Um trabalho similar foi realizado no contexto de bricks minimais por Norine-Thomas em que
eles deduzem o resultado principal do teorema de geração de bricks provado pelos mesmos autores.
No final deste trabalho, apresentamos um teorema único para a construção de bricks e braces minimais
combinando uma prova alternativa do teorema de Norine-Thomas com o nosso teorema principal. |
Download |
|
|
Cubo de Fluxos para Exploração Visual de Hierarquia de Dados Espaço-Temporais |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
14/02/2020 |
Área |
METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO |
Orientador(es) |
|
Orientando(s) |
|
Banca |
- Afonso Paiva Neto
- Douglas Cedrim Oliveira
- Edson Takashi Matsubara
- Fabiano Petronetto do Carmo
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Wallace Correa de Oliveira Casaca
|
Resumo |
|
|
Distance and Similarity Measures in Comparative Genomics |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
18/12/2019 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Fabio Henrique Viduani Martinez
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Fabio Henrique Viduani Martinez
- Francisco Eloi Soares de Araujo
- Jens Stoye
- João Meidanis
- Luis Antonio Brasil Kowada
- Zanoni Dias
|
Resumo |
|
Download |
|
|