Trabalhos Disponíveis

TRABALHO Ações
Deep Learning Approaches to Segment Eucalyptus Tree Images
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 17/02/2023
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Wesley Nunes Goncalves
Coorientador(es)
    Orientando(s)
    • Mário de Araújo Carvalho
    Banca
    • Camilo Carromeu
    • Celso Soares Costa
    • Jose Marcato Junior
    • Wesley Nunes Goncalves
    Resumo O agronegócio é uma das principais fontes de riqueza e emprego do Brasil, representando uma parcela significativa do Produto Interno Bruto (PIB) nacional. Em 2021, o setor do agronegócio atingiu 27,4% do PIB brasileiro, a maior participação desde 2004, quando atingiu 27,53%. A indústria de base florestal é um importante segmento do agronegócio, pois fornece insumos vitais para diversos setores industriais, como produtos de madeira, móveis e papel. As florestas plantadas desempenham um papel essencial na captura de carbono e outros serviços ecossistêmicos, sendo o eucalipto a árvore mais utilizada, com 7,3 milhões de hectares de florestas de eucalipto em 2021. O mapeamento de árvores é vital para a economia e o meio ambiente, e as soluções baseadas em inteligência artificial são valiosas ferramentas de apoio à decisão em agricultura e mapeamento de árvores. Consequentemente, há um forte incentivo para buscar soluções mais abrangentes que utilizem tecnologias avançadas de aprendizado profundo para essa área. Assim, este trabalho tem como objetivo avaliar redes neurais convolucionais de aprendizado profundo eficientes para segmentação de imagens de troncos de eucalipto e apresentar uma proposta de segmentação específica para troncos de eucalipto que pode beneficiar aplicações agrícolas ou ferramentas de apoio à decisão para mapeamento de árvores. Este trabalho foi dividido em duas etapas principais para avaliar as redes de segmentação e criar uma técnica de pós-processamento. A primeira etapa deste estudo avaliou a eficiência de redes de aprendizado profundo na segmentação semântica de troncos de eucalipto em imagens panorâmicas em cores RGB capturadas no nível do solo. As redes de aprendizado profundo FCN, GCNet, ANN e PointRend foram avaliadas nesta etapa para segmentação de imagens de troncos de eucalipto. O treinamento e a avaliação das redes foram realizados usando uma abordagem de validação cruzada de cinco etapas, usando um conjunto de dados composto por imagens anotadas manualmente de uma floresta de eucalipto. O conjunto de dados inicial foi criado usando um campo de visão esférico da câmera. Ele incluiu uma variedade de eucaliptos com características distintas, como variações nas distâncias entre os troncos e mudanças na curvatura, tamanhos e diâmetros dos troncos, que representam desafios significativos para métodos de aprendizado profundo em tarefas de segmentação semântica. Para a primeira etapa deste estudo, o modelo FCN apresentou o melhor desempenho, com precisão de pixel de 78,87% e mIoU de 70,06%, além de obter um bom tempo de inferência. As redes GCNet e ANN também tiveram desempenho semelhante ao FCN, mas com impactos negativos em sua capacidade de generalizar tarefas em contextos específicos. O estudo conclui que o FCN foi o mais robusto, dentre os métodos avaliados, para segmentação semântica de imagens de árvores em imagens panorâmicas. Essa avaliação das redes de segmentação pode ser um passo crucial para o desenvolvimento de outras ferramentas relevantes no manejo florestal, como a estimativa de altura e diâmetro do tronco. A segunda etapa deste trabalho foi criar e avaliar uma técnica de pós-processamento de imagens RGB-D para melhorar os resultados das redes semânticas atuais para segmentação em imagens de eucalipto. Criamos uma nova imagem de conjunto de dados a partir de imagens obtidas de uma câmera estéreo, que capturou não apenas as informações de cor (RGB), mas também as informações de profundidade, o que permitiu uma visão ainda mais completa da floresta de eucalipto. Após a construção do novo banco de imagens, sua anotação foi realizada por especialistas. A próxima etapa deste estudo foi a avaliação de seis redes de segmentação semântica de imagens e a comparação com os resultados antes e depois da aplicação da técnica de pós-processamento. Treinamos, avaliamos e testamos as redes FCN, ANN, GCNet, SETR, SegFormer e DPT nas imagens anotadas. A técnica de pós-processamento melhorou significativamente os resultados das redes de segmentação de imagens testadas, com um ganho significativo de 24,13% em IoU e 13,11% em F1-score para redes baseadas em convolução e 12,49% para IoU e 6,56% em F1-score para redes baseadas em transformadores. A rede SegFormer obteve os melhores resultados em todos os testes antes e após a aplicação da técnica. A técnica também corrigiu com eficácia falhas de segmentação, erosão e erros de dilatação, resultando em bordas mais precisas e troncos mais bem delimitados. O custo computacional médio da técnica foi de 0,019 segundos, indicando que ela pode ser aplicada em redes de segmentação sem comprometer o desempenho. Os resultados obtidos pela aplicação da técnica de pós-processamento propõem uma abordagem inovadora com baixo custo computacional e melhorias significativas para as redes de segmentação existentes.
    Simulação de fluidos com PIC usando RBF-FD e grades adaptativas balanceadas
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 10/02/2023
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Paulo Aristarco Pagliosa
    Coorientador(es)
      Orientando(s)
      • Bianca Namie Sakiyama
      Banca
      • Afonso Paiva Neto
      • Anderson Vicoso de Araujo
      • Marcio Artacho Peres
      • Paulo Aristarco Pagliosa
      Resumo Em animações baseadas em física, a simulação de fluido por métodos híbridos, ou seja, empregando tanto uma discretização material quanto espacial, é normalmente baseada na subdivisão do espaço por uma grade regular. Essa abordagem, a depender da resolução adotada, pode gerar um grande número de células que não contém fluido e não precisam ser processadas, mas que ainda assim serão visitadas. Com o intuito de contornar esse problema, grades adaptativas foram introduzidas para eliminar células vazias. Nas grades regulares, o cálculo dos operadores diferenciais, que é necessário para a resolver a simulação, pode ser feito pelo método das diferenças finitas. O método aproxima o valor da derivada em um ponto com base em seus vizinhos --- que devem estar alinhados ao ponto em relação aos eixos do domínio e a uma distância do ponto sendo avaliado --- e essa vizinhança é chamada de estêncil. Como nas grades adaptativas os tamanhos das células podem ser diferentes, os estênceis gerados não são aptos para o uso do método das diferenças finitas como na grade regular. Uma alternativa para calcular os operadores diferenciais em uma grade adaptativa é o uso do método de diferenças finitas baseada em funções de base radial (RBF-FD), mas esse método é mais complexo e computacionalmente extensivo que o usado nas grades regulares. A fim de manter os benefícios de uma grade adaptativa e acelerar o cálculo dos operadores diferenciais com RBF-FD, este trabalho propõe o uso de grades adaptativas balanceadas, ou seja, grades em que a diferença de nível entre duas células vizinhas não seja maior que um. O objetivo é, uma vez identificado os estênceis gerados com tal condição, definir um dicionário cujas entradas contém funções que permitem o cálculo acelerado do RBF-FD para cada um desses estênceis possíveis.
      Download
      Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão
      Curso Doutorado em Ciência da Computação
      Tipo Tese
      Data 23/12/2022
      Área CIÊNCIA DA COMPUTAÇÃO
      Orientador(es)
        Coorientador(es)
        Orientando(s)
          Banca
          • Afonso Paiva Neto
          • Douglas Cedrim Oliveira
          • Eraldo Luis Rezende Fernandes
          • Hemerson Pistori
          • Paulo Aristarco Pagliosa
          • Renato Porfirio Ishii
          • Thales Miranda de Almeida Vieira
          • Thiago Oliveira dos Santos
          Resumo Na área de processamento geométrico, diversas técnicas propostas na literatura
          requerem que sejam estabelecidos pares de pontos de correspondência entre duas ou
          mais superfícies, isto é, dado um ponto sobre uma superfície fonte, é preciso associar
          qual é o ponto sobre uma superfície alvo que corresponde ao ponto dado. As aplicações
          incluem reconstrução de superfícies, parametrização cruzada, transferência de pose,
          transferência de texturas ou animações, reconhecimento e busca de formas, entre outras. A definição de uma função de mapeamento entre duas formas, mesmo para um número discreto de pontos característicos, nem sempre envolve somente relações geométricas ou estruturais, mas também relações semânticas. Uma vez que tal mapeamento em geral não pode ser diretamente expresso por abordagens puramente axiomáticas, em vários métodos de processamento geométrico a indicação de um conjunto inicial de pontos de correspondência é efetuada manualmente, através de processos que podem ser laboriosos e sujeitos a erros. De fato, descobrir relações semânticas entre formas quaisquer sem qualquer interação do usuário tratava-se de um problema ainda em aberto. Modelos de aprendizagem de máquina, em especial aprendizagem profunda, têm evoluído por sua capacidade de utilizar grandes conjuntos de dados para estimar a solução de problemas em diversas áreas do conhecimento, inclusive processamento geométrico. Este trabalho apresenta um método que utiliza aprendizagem multivisão profunda como parte do processamento responsável por encontrar automaticamente, isto é, sem a intervenção direta do usuário, pontos de correspondência entre superfícies de formas 3D, representadas por malhas de triângulos. O método é dividido em dois componentes: treinamento e correspondência. O primeiro trata-se de um treinamento multivisão que aprende, com o auxílio de uma CNN, a detectar pontos de interesse em imagens 2D oriundas de malhas de triângulos dos conjuntos de treinamento. O último, utiliza o resultado do treinamento para inferir correspondências semânticas com pontos de interesse (vértices) em formas 3D. A descoberta desses pontos não requer novo treinamento e nem interação humana durante o pipeline de correspondência.
          Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão
          Curso Doutorado em Ciência da Computação
          Tipo Tese
          Data 23/12/2022
          Área CIÊNCIA DA COMPUTAÇÃO
          Orientador(es)
          • Paulo Aristarco Pagliosa
          Coorientador(es)
          • Eraldo Luis Rezende Fernandes
          Orientando(s)
          • Alexandre Soares da Silva
          Banca
          • Afonso Paiva Neto
          • Douglas Cedrim Oliveira
          • Eraldo Luis Rezende Fernandes
          • Hemerson Pistori
          • Paulo Aristarco Pagliosa
          • Renato Porfirio Ishii
          • Thales Miranda de Almeida Vieira
          • Thiago Oliveira dos Santos
          Resumo Na área de processamento geométrico, diversas técnicas propostas na literatura requerem que sejam estabelecidos pares de pontos de correspondência entre duas ou mais superfícies, isto é, dado um ponto sobre uma superfície fonte, é preciso associar qual é o ponto sobre uma superfície alvo que corresponde ao ponto dado. As aplicações incluem reconstrução de superfícies, parametrização cruzada, transferência de pose, transferência de texturas ou animações, reconhecimento e busca de formas, entre outras. A definição de uma função de mapeamento entre duas formas, mesmo para um número discreto de pontos característicos, nem sempre envolve somente relações geométricas ou estruturais, mas também relações semânticas. Uma vez que tal mapeamento em geral não pode ser diretamente expresso por abordagens puramente axiomáticas, em vários métodos de processamento geométrico a indicação de um conjunto inicial de pontos de correspondência é efetuada manualmente, através de processos que podem ser laboriosos e sujeitos a erros. De fato, descobrir relações semânticas entre formas quaisquer sem qualquer interação do usuário tratava-se de um problema ainda em aberto. Modelos de aprendizagem de máquina, em especial aprendizagem profunda, têm evoluído por sua capacidade de utilizar grandes conjuntos de dados para estimar a solução de problemas em diversas áreas do conhecimento, inclusive processamento geométrico. Este trabalho apresenta um método que utiliza aprendizagem multivisão profunda como parte do processamento responsável por encontrar automaticamente, isto é, sem a intervenção direta do usuário, pontos de correspondência entre superfícies de formas 3D, representadas por malhas de triângulos. O método é dividido em dois componentes: treinamento e correspondência. O primeiro trata-se de um treinamento multivisão que aprende, com o auxílio de uma CNN, a detectar pontos de interesse em imagens 2D oriundas de malhas de triângulos dos conjuntos de treinamento. O último, utiliza o resultado do treinamento para inferir correspondências semânticas com pontos de interesse (vértices) em formas 3D. A descoberta desses pontos não requer novo treinamento e nem interação humana durante o pipeline de correspondência.
          Download
          Segmentação de Imagens incluindo Contexto em Redes Neurais Convolucionais
          Curso Doutorado em Ciência da Computação
          Tipo Tese
          Data 19/12/2022
          Área CIÊNCIA DA COMPUTAÇÃO
          Orientador(es)
          • Wesley Nunes Goncalves
          Coorientador(es)
            Orientando(s)
            • Patrik Olã Bressan
            Banca
            • Hemerson Pistori
            • Jonathan de Andrade Silva
            • Jose Marcato Junior
            • Lucas Prado Osco
            • Wesley Nunes Goncalves
            Resumo Existe uma demanda significativa para a automação da localização e reconhecimento dos objetos e pessoas, desde a automação da agricultura até sistemas de mensuração automática do nível da água em rios, tudo realizado por sistemas de visão computacional. A atribuição dessas marcações ou rotulações é realizada atualmente em nível de pixel, técnica chamada de segmentação semântica. Porém, em uma única imagem podem existir várias classes, e frequentemente essas classes são muito parecidas, se tornando um desafio complexo a ser trabalhado. Recentemente, métodos baseados em Redes Neurais Convolucionais (CNN) alcançaram um sucesso impressionante em tarefas de segmentação semântica. Esse sucesso deve-se, entre outros fatores, à inclusão de algum contexto para auxiliar a rede, como por exemplo a informação que uma classe é mais frequente que a outra e/ou; a informação de que o dataset possui imagens com um alto nível de incerteza na rotulação dos pixels presentes nas bordas. Contudo, esses dois pontos mencionados, tanto o desequilíbrio das classes quanto à incerteza de rotulação de pixels, podem ser melhores explorados. Apresentamos uma abordagem que calcula e atribui um peso para o pixel, considerando sua classe e a incerteza durante o processo de rotulação. Os pesos dos pixels são usados durante o treinamento para aumentar ou diminuir a importância dos pixels. Alguns trabalhos são apresentados demonstrando a utilização de técnicas de segmentação semântica com inclusão de contexto, com resultados significativos em comparação com os métodos mais relevantes. Além disso, também apresentamos um método para a reconstrução da área do objeto de interesse, permitindo a reconstrução das bordas desse objeto. As técnicas aqui apresentadas podem ser utilizadas em uma ampla variedade de métodos de segmentação, melhorarando sua robustez.
            Mineração de Textos usando Word Embeddings com Contexto Geográfico
            Curso Mestrado em Ciência da Computação
            Tipo Dissertação
            Data 27/10/2022
            Área CIÊNCIA DA COMPUTAÇÃO
            Orientador(es)
            • Ricardo Marcondes Marcacini
            Coorientador(es)
              Orientando(s)
              • Antônio Ronaldo da Silva
              Banca
              • Bruno Magalhaes Nogueira
              • Camila Vaccari Sundermann
              • Diego Furtado Silva
              • Rafael Geraldeli Rossi
              • Ricardo Marcondes Marcacini
              Resumo Muitos fenômenos importantes estão relacionados a um contexto geográfico, como eventos extraídos de bases textuais na área da economia, saúde pública, violência urbana e questões sociais. A análise de eventos de maneira manual seria impraticável considerando a sua grande quantidade e as diversas formas nas quais os dados são encontrados. Assim, passou-se a ter a necessidade de processos baseados em métodos computacionais inteligentes como a Mineração de Textos que, por meio das suas etapas, torna capaz a exploração do conteúdo textual com informação geográfica e retorna padrões que não seriam encontrados por modelos tradicionais. O modelo tradicional para analisar a relação entre termos e regiões é o de calcular a probabilidade de um termo ser utilizado em textos associados a uma região, em geral, por meio da frequência de termos em regiões. No entanto, é reconhecido que essa abordagem falha para novos termos apresentados a um modelo, bem como para textos com termos ambíguos. Nesse contexto, modelos baseados em Word Embeddings são reconhecidos por melhorar a identificação das relações entre uma palavra e o possível local associado. Nesse sentido, neste projeto são investigadas representações textuais baseadas em Word Embeddings do modelo BERT (Bidirectional Encoder Representations from Transformers) em um processo de ajuste fino, na qual as informações georreferenciadas dos textos são utilizadas como contexto, culminando na proposta deste trabalho denominada GeoTransformers Language Model. Um dos diferenciais da proposta é automaticamente identificar macrorregiões e microrregiões a partir dos eventos e utilizá-las como contexto para ajuste fino de um modelo de linguagem. Os resultados gerados pelo modelo GeoTransformers, em comparação com outros modelos da literatura, apresentaram maiores valores para métricas de precisão, revocação, F1-Score. Além disso, o modelo proposto foi o único capaz de lidar com regiões com menor quantidade de eventos e difíceis de classificar.
              Download
              Acelerando Florestas de Decisão Paralelas em Processadores Gráficos para a Classificação de Texto
              Curso Doutorado em Ciência da Computação
              Tipo Tese
              Data 12/09/2022
              Área CIÊNCIA DA COMPUTAÇÃO
              Orientador(es)
              • Wellington Santos Martins
              Coorientador(es)
                Orientando(s)
                • Julio Cesar Batista Pires
                Banca
                • Fabrizzio Alphonsus Alves de Melo Nunes Soares
                • Júnio César de Lima
                • SÁVIO SALVARINO TELES DE OLIVEIRA
                • Wellington Santos Martins
                Resumo
                Download
                  Modelagem e Desenvolvimento de Algoritmo para o Problema de Roteamento Dinâmico de Veículos
                  Curso Mestrado em Ciência da Computação
                  Tipo Dissertação
                  Data 09/09/2022
                  Área CIÊNCIA DA COMPUTAÇÃO
                  Orientador(es)
                  • Ricardo Ribeiro dos Santos
                  Coorientador(es)
                    Orientando(s)
                    • Wilton Gustavo Gomes da Costa
                    Banca
                    • Bianca de Almeida Dantas
                    • Fillipe Goulart Silva Mendes
                    • Ricardo Ribeiro dos Santos
                    • Willy Alves de Oliveira Soler
                    Resumo Encontrar rotas eficientes para uma frota de forma a minimizar a distância percorrida e o tempo de viagem e maximizar o lucro do serviço são alguns objetivos almejados na resolução do Problema de Roteamento de Veículos (PRV). O PRV e suas variantes são amplamente estudados na literatura técnica especializada, com diversas propostas de modelos, algoritmos e técnicas (métodos) de resolução. Neste trabalho de mestrado, o objetivo é resolver a variante do PRV, denominada Problema de Roteamento Dinâmico de Veículos (PRDV). O PRDV considera que os itens a serem entregues não são conhecidos a priori e podem aparecer para o roteamento de maneira dinâmica. Este é um problema atual e de interesse das empresas de logística, especialmente aquelas com enfoque em marketplace, que precisam lidar com milhares de itens de produtos para entregas ao longo do dia e possuem limitações de frotas de veículos e de horários para entrega. Neste trabalho foram desenvolvidos um algoritmo dinâmico, denominado Dynamic Search per Neighbors Routes (DSNR), e um algoritmo estático, denominado Kmeans, Relax-and-Fix and Optimizations (K-RFO). O cenário para o problema consiste em explorar o roteamento dinâmico a partir de lotes de pacotes para serem entregues em uma jornada de trabalho do mesmo dia. A técnica implementada no algoritmo DSNR é baseada em busca local associada a uma implementação de uma heurística denominada 2-Opt**, visando re-otimizar rotas vizinhas. Quando comparada com os algoritmos dinâmicos QRP-Sweep (QRPS) e Kmeans-Greedy (KG), disponibilizados no repositório Loggibud, observaram-se economias de 17% nos custos de transporte e operacionais, ao utilizar a técnica DSNR.
                    Counting and locating high-density objects using convolutional neural network
                    Curso Doutorado em Ciência da Computação
                    Tipo Tese
                    Data 06/09/2022
                    Área CIÊNCIA DA COMPUTAÇÃO
                    Orientador(es)
                    • Wesley Nunes Goncalves
                    Coorientador(es)
                      Orientando(s)
                      • Mauro dos Santos de Arruda
                      Banca
                      • Bruno Brandoli Machado
                      • Jonathan de Andrade Silva
                      • Jose Marcato Junior
                      • Keiller Nogueira
                      • Lucas Prado Osco
                      • Wesley Nunes Goncalves
                      Resumo Contagem e detecção automática de objetos são essenciais em diferentes tipos de aplicações pois permitem melhorias desempenhos na execução das tarefas manuais. Métodos de aprendizado profundo estão se destacando cada vez mais nesse tipo de aplicação pois conseguem realizar boas caracterizações dos objetos. Entretanto, desafios como a sobreposição, oclusão, diferentes de escalas e alta densidade de objetos atrapalham o desempenho desses métodos, fazendo com que esse problema permaneça aberto. Tais métodos normalmente usam anotações por caixas delimitadoras, o que prejudica seu desempenho em cenas de alta densidade com adjacência de objetos. Para superar tais limitações, avançando o estado da arte, nós propomos um método de contagem e detecção de objetos usando mapas de confiança. A primeira aplicação permitiu definir um método baseado em redes neurais convolucionais que recebem como entrada uma imagem multiespectral e detecta os objetos a partir de picos no mapa de confiança. Em uma segunda aplicação, nós inserimos informações de contexto global e local através do módulo PPM, para a detecção de objetos em diferentes escalas. Além disso, melhoramos o refinamento sucessivo do mapa de confiança com múltiplos valores de sigma na fase MSS. Na terceira aplicação do método, nós propomos um módulo de seleção de bandas para trabalhar com imagens hiperespectrais. Em uma quarta aplicação, nós avaliamos o método proposto em imagens RGB de alta densidade de objetos e comparamos com métodos do estado da arte: YOLO, Faster R-CNN e RetinaNet. Por último, expandimos o método propondo uma arquitetura de duas ramificações permitindo a troca de informações entre eles. Essa melhoria permite que o método detecte simultaneamente plantas e linhas de plantio em diferentes conjuntos de dados. Os resultados descritos nesta tese mostram que a utilização de redes neurais convolucionais e mapas de confiança para a detecção e contagem de objetos permite alto desempenho. As contribuições descritas aqui, devem suportar avanços significativos nas áreas de detecção de objetos e aprendizado profundo.
                      Exploring code samples characteristics and their impacts on software ecosystems
                      Curso Mestrado em Ciência da Computação
                      Tipo Dissertação
                      Data 23/08/2022
                      Área CIÊNCIA DA COMPUTAÇÃO
                      Orientador(es)
                      • Bruno Barbieri de Pontes Cafeo
                      Coorientador(es)
                      • Andre Cavalcante Hora
                      Orientando(s)
                      • Gabriel Santana de Menezes
                      Banca
                      • Andre Cavalcante Hora
                      • Awdren de Lima Fontao
                      • Bruno Barbieri de Pontes Cafeo
                      • Davy de Medeiros Baía
                      • Eiji Adachi Medeiros Barbosa
                      • Hudson Silva Borges
                      Resumo Os sistemas de software modernos são geralmente construídos sobre frameworks, bibliotecas e APIs (plataformas).
                      Ambientes onde existem relações entre as organizações que mantêm essas plataformas
                      e os clientes que utilizam recursos dessas plataformas são conhecidos como Ecossistema de Software.
                      Nesse contexto, as organizações desenvolvem code samples para ajudar seus clientes com as barreiras de aprendizado.
                      Code samples são pequenos projetos de software, com fins educacionais, e ensinam como usar os recursos da plataforma.
                      No entanto, sabemos pouco sobre as características de code samples e sua relação com organizações e clientes.
                      Neste trabalho, pretendemos preencher essas lacunas avaliando quatro aspectos diferentes. Primeiro, comparando code samples com projetos convencionais através de seu código-fonte. Segundo, explorando o uso de code samples via Stack Overflow e GitHub. Terceiro, avaliando o perfil dos atores que interagem com code samples. Quarto, manutenção de code samples e seu impacto nos clientes.
                      Descobrimos que os code samples são menores e mais simples do que os projetos convencionais. Também descobrimos que code samples mudam com menos frequência, mas atualiza mais rapidamente para novas versões de plataforma do que os projetos convencionais. Em relação ao uso de code samples, descobrimos que a abordagem copiar/colar é pouco utilizada pelos clientes. Além disso, notamos que o problema mais comum enfrentado pelos clientes é quando eles tentam modificar a code samples e as melhorias são a necessidade mais comum dos clientes. Em relação aos atores em torno dos code samples, descobrimos que o público-alvo dos code samples pode variar de clientes inexperientes a clientes experientes. Além disso, notamos que plataformas de diferentes organizações parecem ter diferentes públicos-alvo. Além disso, os mantenedores de code samples são antigos e impopulares no GitHub.
                      Por fim, sobre a manutenção de code samples, descobrimos que a modificação de código é a atividade de manutenção mais comum de code samples, mas o gerenciamento de Pull Rquests desempenha um papel essencial no tempo de manutenção. Também descobrimos que os code samples se tornam menos complexas, mas maiores e menos legíveis ao longo do tempo.
                      Towards an expertise-related metric to preprocessor-based configurable software systems
                      Curso Mestrado em Ciência da Computação
                      Tipo Dissertação
                      Data 22/08/2022
                      Área CIÊNCIA DA COMPUTAÇÃO
                      Orientador(es)
                      • Bruno Barbieri de Pontes Cafeo
                      Coorientador(es)
                        Orientando(s)
                        • Karolina Martins Milano Neves
                        Banca
                        • Awdren de Lima Fontao
                        • Bruno Barbieri de Pontes Cafeo
                        • Elder José Reioli Cirilo
                        • Hudson Silva Borges
                        • Maria Istela Cagnin Machado
                        Resumo Contexto: Métricas relacionadas à experiência dos desenvolvedores nos permitem encontrar os melhores desenvolvedores para uma tarefa específica em
                        um arquivo. Sistemas configuráveis usam a variabilidade de código como
                        unidade de abstração para gerar diferentes membros de uma família de programas. Esse desalinhamento entre os arquivos usados pelas métricas relacionadas à experiência e as variabilidades usadas pelos sistemas configuráveis pode impossibilitar o uso conjunto delas.
                        Objetivo: O objetivo é duplo. O primeiro é explorar como o trabalho em código mandatório e variável é dividido entre os desenvolvedores e se as métricas
                        relacionadas à expertise podem indicar um desenvolvedor com expertise para
                        uma tarefa envolvendo código variável. O segundo é propor uma métrica relacionada à experiência com conhecimento em variabilidades para indicar desenvolvedores com experiência em código variável.
                        Método: Foram investigados 49 sistemas configuráveis baseados em pré-processadores, sendo analisadas como as mudanças nas variabilidades são dstribuídas entre os desenvolvedores, e se esses desenvolvedores seriam os principais desenvolvedores indicados por métricas relacionadas a experiência do desenvolvedor em arquivos de código. Foram utilizadas técnicas de feature selection e regressão linear múltipla para propor uma métrica relacionada a experiência
                        do desenvolvedor em relação ao conhecimento de variabilidades de código. A métrica proposta foi validada comparando-a com duas métricas já conhecidas.
                        Resultados: Poucos desenvolvedores são especialistas em código variável. Foi identificado que poucos desenvolvedores concentram a maioria das alterações
                        em código variável. Os resultados também sugerem que que a expertise relacionada a métricas já conhecidas não são um bom ajuste para indicar experts em relação ao código variável. Foi proposta uma métrica relacionada a experiência dos desenvolvedores em relação às variabilidades e foi mostrado que a métrica proposta superou métricas relacionadas a experiência em relação a arquivos de código, já conhecidas.
                        Conclusão: Embora os resultados mostrem que um número considerável de desenvolvedores realizou alterações no código variável durante o histórico de
                        desenvolvimento, tais alterações são apenas ocasionais. Há uma concentração
                        de trabalho entre alguns desenvolvedores quando se trata de código variável.
                        Esta divisão desigual pode causar um esforço de manutenção desnecessário.
                        Também concluímos que as métricas relacionadas à experiência em relação ao conhecimento das variabilidades podem apoiar melhor a identificação de
                        especialistas em sistemas configuráveis quando comparadas às métricas existentes
                        Uma Análise Exploratória da Influência dos Projetos Pedagógicos dos Cursos Superiores no Resultado do Enade por meio de Mineração de Textos e Aprendizado de Máquina
                        Curso Mestrado em Ciência da Computação
                        Tipo Dissertação
                        Data 11/08/2022
                        Área CIÊNCIA DA COMPUTAÇÃO
                        Orientador(es)
                        • Liana Dessandre Duenha Garanhani
                        Coorientador(es)
                        • Bruno Magalhaes Nogueira
                        Orientando(s)
                        • Charles Andre Profilio dos Santos
                        Banca
                        • Anderson Vicoso de Araujo
                        • Bruno Magalhaes Nogueira
                        • Edson Norberto Caceres
                        • Liana Dessandre Duenha Garanhani
                        Resumo Um curso de ensino superior é orientado pelo Projeto Pedagógico do Curso (PPC), que orienta a formação esperada para o egresso do curso, tanto no aspecto profissional quanto humanístico, de acordo com as diretrizes curriculares nacionais vigentes. Para avaliar os cursos de graduação e as instituições de ensino superior, o Ministério da Educação (MEC) utiliza alguns indicadores de qualidade, como o Exame Nacional de Desempenho dos Estudantes (Enade), sendo uma avaliação aplicada a cada três anos aos estudantes egressos de cada curso, que visa avaliar a qualidade do ensino de graduação no país por meio da atribuição de um conceito a cada curso avaliado. Tal conceito e os demais relatórios de avaliação resultantes do Enade auxiliam os gestores das instituições de ensino superior, coordenadores de curso e professores atuarem para a melhoria de seus projetos pedagógicos, infraestrutura física, recursos humanos e demais aspectos que impactem na formação do aluno. Este trabalho propõe uma análise dos projetos pedagógicos de cursos utilizando aprendizado de máquina, para auxiliar na compreensão de como o seu conteúdo impacta na avaliação dos cursos, mais especificamente, nos conceitos Enade Faixa e Enade Contínuo dos cursos. A análise foi aplicada sobre projetos pedagógicos dos cursos de Ciência da Computação e Sistemas de Informação, porém a metodologia é aplicável para outros cursos, medi- ante replicação do método sobre novos dados de treinamento. Os resultados experimentais demonstraram que é possível predizer o Conceito Enade Faixa com acurácia de ≈ 80% e o Conceito Enade Contínuo com erro percentual absoluto médio de ≈ 11%.
                        Download
                        Exploração do Espaço de Projetos de Sistemas Heterogêneos Aplicada ao Problema de Alocação de Recursos em Nuvem
                        Curso Mestrado em Ciência da Computação
                        Tipo Dissertação
                        Data 01/07/2022
                        Área CIÊNCIA DA COMPUTAÇÃO
                        Orientador(es)
                        • Ricardo Ribeiro dos Santos
                        Coorientador(es)
                          Orientando(s)
                          • Danillo Christi Almeida Arigoni
                          Banca
                          • César Augusto Fonticielha De Rose
                          • Liana Dessandre Duenha Garanhani
                          • Renato Porfirio Ishii
                          • Ricardo Ribeiro dos Santos
                          Resumo Os serviços de computação em nuvem oferecem uma gama de recursos computacionais disponíveis sob demanda. Contudo, encontrar a melhor configuração de recursos que reduza custos e atenda as exigências do usuário tornou-se um grande desafio. Este desafio compartilha características essenciais com um problema da área de arquitetura de computadores, a exploração de espaço de projetos - Design Space Exploration (DSE). Em DSE, o foco é escolher, dentre uma grande quantidade de soluções arquiteturais, qual a mais indicada para uma determinada demanda, buscando atender objetivos e cumprindo as restrições de projeto. Diante disso, este trabalho propõe a aplicação de técnicas de exploração de espaço de projeto como potencial solução para o problema de alocação de recursos em nuvem. Este trabalho projetou e desenvolveu a ferramenta MultiExplorer-VM, uma extensão da ferramenta de DSE MultiExplorer. Essa extensão possui um fluxo de execução adaptado para a resolução do problema de alocação de recursos em nuvem, utilizando e adaptando algoritmos e técnicas de exploração de espaço de projeto.
                          Experimentos foram realizados visando a validação estatística e comparação com outro trabalho existente na literatura da área que utiliza a técnica Paramount Interation (PI). Os resultados mostram que MultiExplorer-VM possibilita alcançar configurações de recursos com melhorias significativas em relação a técnica de PI. Seguindo as restrições de um modelo de otimização, para algumas aplicações, as soluções obtidas por MultiExplorer-VM são similares às configurações ótimas obtidas por uma ferramenta de busca exaustiva de soluções aplicada ao mesmo problema.
                          Download
                          Exploração do Espaço de Projetos de Sistemas GP-GPU ciente de Dark Silicon
                          Curso Mestrado em Ciência da Computação
                          Tipo Dissertação
                          Data 30/06/2022
                          Área CIÊNCIA DA COMPUTAÇÃO
                          Orientador(es)
                          • Liana Dessandre Duenha Garanhani
                          Coorientador(es)
                            Orientando(s)
                            • Rhayssa de Almeida Sonohata
                            Banca
                            • Eraldo Luis Rezende Fernandes
                            • Jonathan de Andrade Silva
                            • Liana Dessandre Duenha Garanhani
                            • Ricardo Ribeiro dos Santos
                            Resumo O alto potencial de paralelismo e de largura de banda oferecidos pelas GPUs, aliados à popularização das linguagens de programação CUDA e OpenCL, fizeram com que as unidades de processamento gráfico fossem utilizadas em aplicações distintas daquelas para as quais foram originalmente criadas, consolidando, assim, o conceito de GP-GPU ou Unidades de Processamento Gráfico para computação de propósito geral. A partir do crescente uso de sistemas que unem CPUs e GPUs para processamento de forma colaborativa, foram desenvolvidas ferramentas para explorar o desempenho e o consumo dos diversos parâmetros arquiteturais dos projetos de computação heterogênea. Entretanto, essas ferramentas são escassas, limitadas, computacionalmente custo-
                            sas e precisam de parâmetros arquiteturais de difícil obtenção. Isso posto, este trabalho propõe o desenvolvimento e avaliação de modelos de predição de desempenho de sistemas heterogêneos GP-GPU usando técnicas de aprendizado de máquina, com objetivo de alcançar alta acurácia e substituir o custoso processo de simulação. Tais preditores foram validados a partir da integração a uma ferramenta de exploração de espaço de projeto ciente de dark-silicon,denominada MultiExplorer, que realiza a avaliação de alternativas arquiteturais para um projeto-base, buscando alcançar objetivos pré-estabelecidos como maximização de desempenho e minimização de área em dark-silicon, obedecendo restrições de área e consumo energético. Dependendo do espaço de projeto, tal ferramenta avalia centenas de milhares de alternativas arquiteturais e, portanto, os preditores de desempenho com baixo custo computacional e acurácia são essenciais.
                            Medianas em genômica comparativa
                            Curso Mestrado em Ciência da Computação
                            Tipo Dissertação
                            Data 27/05/2022
                            Área CIÊNCIA DA COMPUTAÇÃO
                            Orientador(es)
                            • Fabio Henrique Viduani Martinez
                            Coorientador(es)
                              Orientando(s)
                              • Helmuth Ossinaga Martines da Silva
                              Banca
                              • Carlos Henrique Aguena Higa
                              • Diego Padilha Rubert
                              • Fabio Henrique Viduani Martinez
                              • Francisco Eloi Soares de Araujo
                              • José Coelho de Pina Junior
                              • Marco Aurelio Stefanes
                              Resumo A inferência de genomas ancestrais é uma tarefa clássica em genômica comparativa. Aqui, estudamos o problema da mediana de genomas tal que, dado um conjunto de três ou mais genomas, queremos encontrar um novo genoma que minimize a soma das distâncias par a par entre esse e os genomas dados. A distância representa a quantidade de evolução observada no nível do genoma, para a qual determinamos o número mínimo de operações de rearranjos necessárias para transformar um genoma em outro. Para quase todas as operações de rearranjo conhecidas, o problema da mediana é NP-difícil, com exceção da operação single-cut-or-join (SCJ) que pode ser resolvido eficientemente para genomas multicromossomais circulares e mistos. Neste projeto, estudamos o problema da mediana sob uma medida de rearranjo restrita chamada distância-c4, que é estreitamente relacionada à distância SCJ e à DCJ (double-cut-and-join). Identificamos limitantes precisos e decomposers da mediana-c4 e implementamos algoritmos para a sua construção, dois algoritmo exatos baseados em PLI (Programação Linear Inteira) e três heurísticas combinatórias. Posteriormente, realizamos experimentos com conjunto de dados simulados. Nossos resultados sugerem que a distância-c4 é útil para estudo do problema da mediana de genomas, de perspectiva teórica e prática.
                              Multi-task Learning Applied to Computer Vision Problems
                              Curso Doutorado em Ciência da Computação
                              Tipo Tese
                              Data 28/03/2022
                              Área CIÊNCIA DA COMPUTAÇÃO
                              Orientador(es)
                              • Hemerson Pistori
                              Coorientador(es)
                                Orientando(s)
                                • Diogo Nunes Gonçalves
                                Banca
                                • Hemerson Pistori
                                • Jonathan de Andrade Silva
                                • Jose Marcato Junior
                                • Lucas Prado Osco
                                • Paulo Eduardo Teodoro
                                • Vanessa Aparecida de Moraes Weber
                                Resumo O aprendizado profundo tem sido amplamente estudado, principalmente para resolver problemas considerados complexos. De forma geral, esses problemas podem ser descritos e divididos em um conjunto de tarefas. Essas tarefas são intrínsecas ao problema geral, ou seja, são definidas de forma natural por fazer parte da essência do problema. Além disso, elas podem ser aprendidas de forma isolada porém estão relacionadas para solução do problema geral. Outro fator importante é que para um problema maior de visão computacional, realizar as tarefas distintas individualmente se torna muito custoso em memória e tempo de inferência. Para solucionar esses problemas uma abordagem chamada Aprendizado Multitarefa (MTL) foi proposta. A ideia é simular o aprendizado humano, em que pessoas podem aprender novas tarefas através de experiências obtidas no aprendizado de tarefas similares. Essa abordagem permite o aprendizado das tarefas do problema de maneira simultânea, construindo uma relação entre elas. A partir desses direcionamentos, este trabalho na forma de coleção de artigos apresenta abordagens MTL para a resolução de problemas de visão computacional. Inicialmente, dois problemas foram abordados: detecção de linhas de plantação no primeiro artigo e detecção de alevinos no segundo. Na detecção de linhas de plantação a ideia é dividir o problema em identificar as plantas individualmente e detectar as linhas de plantação. Na detecção de alevinos as tarefas são divididas em detectar o alevino e identificar a direção desse alevino nos quadros subsequentes. Para ambos os problemas, um método foi proposto com um backbone que extrai as características iniciais para todas as tarefas. Tendo como entrada as características iniciais, ramos independentes aprendem a solução de cada tarefa. A troca de informações entre as tarefas ocorre por meio da concatenação das características extraídas em pontos específicos de cada ramo. Os resultados mostraram que o compartilhamento entre as tarefas é importante para a solução, alcançando resultados superiores ao estado-da-arte. Além das duas propostas, um novo método de segmentação semântica usando MTL e mecanismo de atenção foi proposto. O principal avanço foi o uso de pesos aprendidos por Transformers para indicar a importância de uma tarefa nas demais. Assim, apenas regiões da imagem consideradas relevantes influenciam em outras tarefas. Os resultados em dois problemas, segmentação de linhas e falhas de plantação, e segmentação da folha e desfolha, mostraram a eficácia da abordagem frente ao estado-da-arte.
                                Download
                                Predição de nível de rios da Região Hidrográfica do Rio Paraguai utilizando algoritmos de Aprendizado de Máquina
                                Curso Mestrado em Ciência da Computação
                                Tipo Dissertação
                                Data 25/02/2022
                                Área CIÊNCIA DA COMPUTAÇÃO
                                Orientador(es)
                                • Renato Porfirio Ishii
                                Coorientador(es)
                                  Orientando(s)
                                  • Rogério Alves dos Santos Antoniassi
                                  Banca
                                  • Bruno Magalhaes Nogueira
                                  • Carlos Roberto Padovani
                                  • Edson Takashi Matsubara
                                  • Omar Andres Carmona Cortes
                                  • Renato Porfirio Ishii
                                  Resumo O Pantanal faz parte da Região Hidrográfica do Rio Paraguai (RH-Paraguai) e possui, como característica, a inundação de uma parcela de sua área em determinadas épocas do ano. Essa inundação gera uma série de problemas socioeconômicos à população que vive em seu entorno. Problemas estes que podem ser mitigados quando há previsão de sua ocorrência com antecedência. Nesse sentido, este trabalho investiga a aplicação de técnicas de Aprendizado de Máquina (AM) para a predição de níveis dos rios da RH-Paraguai, utilizando dados diários de estações a montante para previsão do nível de estações a jusante. Nessa perspectiva, a modelagem com técnicas de AM demonstra-se eficaz nas predições, na medida que trabalhos similares aparecem na literatura correlata. Dessa maneira, é utilizada uma fonte de dados com valores de níveis diários, sendo selecionada uma amostra de três estações. Em seguida, foi retirada a defasagem do tempo entre o pico de cheia de uma estação e outra, pesquisados os hiperparâmetros ideais para as redes Long Short Term Memory (LSTM), Gated Recurrent Unit (GRU) e Bidirectional Long Short Term Memory (BiLSTM) e submetidos ao processo de treinamento. Posteriormente, foram selecionados os modelos de melhores resultados de cada algoritmo, os quais foram comparados com a técnica de Regressão utilizada atualmente. Os resultados mostram que os três modelos testados podem ser utilizados para a tarefa de predição, em que, os três apresentam melhorias em relação ao modelo atual. O modelo com o algoritmo GRU se destacou por apresentar as menores taxas de erro e por ser 23,84% mais preciso que o modelo de Regressão, já LSTM e BiLSTM são, respectivamente, 18,09% e 19,16% mais precisos que o modelo de Regressão. Os modelos de LSTM e BiLSTM se aproximam mais do valor real nos picos de níveis máximos e mínimos, quando comparados ao de Regressão e ao GRU.
                                  Download
                                  Problema de roteamento em anéis de dois níveis
                                  Curso Mestrado em Ciência da Computação
                                  Tipo Dissertação
                                  Data 16/12/2021
                                  Área CIÊNCIA DA COMPUTAÇÃO
                                  Orientador(es)
                                  • Edna Ayako Hoshino
                                  Coorientador(es)
                                    Orientando(s)
                                    • Cecília Lescano Osório
                                    Banca
                                    • Edna Ayako Hoshino
                                    • Fabio Henrique Viduani Martinez
                                    • Fábio Luiz Usberti
                                    • Francisco Eloi Soares de Araujo
                                    • Henrique Mongelli
                                    • Vagner Pedrotti
                                    Resumo Nesta dissertação de mestrado estudamos o problema do roteamento em anéis de dois níveis, que consiste em, dado um grafo e custos associados às arestas, projetar uma rede hierárquica em dois níveis em que ambos os níveis são anéis. Apresentamos um modelo em programação linear inteira para o problema e propomos um algoritmo exato branch-and-price para resolvê-lo. Uma vez que o modelo proposto faz uso de um número exponencial de variáveis, utilizamos o método da geração de colunas para resolver a relaxação linear do modelo. Propomos também uma relaxação para a geração de colunas e heurísticas para melhorar o desempenho do algoritmo proposto.
                                    Download
                                    Desenvolvimento e Avaliação de Métodos de Interação com Dispositivos e Ambientes Inteligentes Utilizando Smartwatches: Uma Abordagem com Reconhecimento Contínuo de Gestos
                                    Curso Doutorado em Ciência da Computação
                                    Tipo Tese
                                    Data 06/12/2021
                                    Área CIÊNCIA DA COMPUTAÇÃO
                                    Orientador(es)
                                    • Fabrizzio Alphonsus Alves de Melo Nunes Soares
                                    Coorientador(es)
                                      Orientando(s)
                                      • Thamer Horbylon Nascimento
                                      Banca
                                      • Alexandre Cardoso
                                      • Deborah Silva Alves Fernandes
                                      • Fabrizzio Alphonsus Alves de Melo Nunes Soares
                                      • Fátima de Lourdes dos Santos Nunes Marques
                                      • Gélson da Cruz Júnior
                                      • Renato de Freitas Bulcão Neto
                                      • Ronaldo Martins da Costa
                                      Resumo
                                      Download
                                        Braces minimais e suas propriedades
                                        Curso Doutorado em Ciência da Computação
                                        Tipo Tese
                                        Data 27/10/2021
                                        Área CIÊNCIA DA COMPUTAÇÃO
                                        Orientador(es)
                                        • Marcelo Henriques de Carvalho
                                        Coorientador(es)
                                          Orientando(s)
                                          • Phelipe Araujo Fabres
                                          Banca
                                          • Alberto Alexandre Assis Miranda
                                          • Fabio Henrique Viduani Martinez
                                          • Francisco Eloi Soares de Araujo
                                          • José Coelho de Pina Junior
                                          • Marcelo Henriques de Carvalho
                                          Resumo McCuaig provou um teorema de geração para braces e o usou como uma ferramenta de indução
                                          para obter uma caracterização estrutural de braces Pfaffianos.
                                          Um brace é minimal se a remoção de qualquer aresta resulta em grafo que não é brace. A partir
                                          do teorema de geração de braces de McCuaig, nós provamos nosso teorema principal que pode ser visto
                                          como uma ferramenta de indução para braces minimais. Como uma aplicação, nós provamos que um
                                          brace minimal de ordem 2n (n ≥ 6) tem no máximo 5n − 10 arestas e apresentamos uma caracterização
                                          completa dos braces minimais para os quais esse limite superior ocorre com igualdade.
                                          Um trabalho similar foi realizado no contexto de bricks minimais por Norine-Thomas em que
                                          eles deduzem o resultado principal do teorema de geração de bricks provado pelos mesmos autores.
                                          No final deste trabalho, apresentamos um teorema único para a construção de bricks e braces minimais
                                          combinando uma prova alternativa do teorema de Norine-Thomas com o nosso teorema principal.
                                          Download
                                          Página 3 de 15 (20 de 295 registros).