Scaling Stateful Network Services on Multicore Architectures |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
07/11/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Fabricio Barbosa de Carvalho
|
Banca |
|
Resumo |
Nos últimos anos, as velocidades de rede aumentaram enquanto as velocidades de CPU se estabilizaram, tornando as pilhas de rede baseadas em kernel cada vez mais impraticáveis, particularmente para servidores multicore em datacenters. Consequentemente, pilhas de rede de sistemas de kernel-bypass e aplicações multicore se tornaram necessárias para acompanhar redes de datacenter mais rápidas. Um grande número de aplicações ainda requer TCP para interoperabilidade com aplicações legadas. No entanto, o processamento TCP consome muitos recursos em comparação com aplicações em escala de microssegundos, e seu estado por conexão complica o escalonamento em arquiteturas multicore. A interação entre a pilha de rede e o escalonamento de aplicações, seja em trabalhadores compartilhados ou não (por exemplo, núcleos), impacta fortemente o desempenho ao afetar o uso do cache, a eficiência do pipeline da CPU e os padrões de acesso à memória. Dadas as demandas de redes de alta velocidade, otimizar essas arquiteturas é essencial, mas muitos sistemas existentes falham em abordar o desempenho do TCP e suas interações com a aplicação em condições do mundo real.
Um dos objetivos desta tese é investigar o escalonamento efetivo de uma pilha TCP juntamente com aplicações em arquiteturas multicore, enfatizando as compensações envolvidas na alocação de trabalhadores para processamento TCP e de aplicações. Esta tese analisa com base em princípios a relação entre um protocolo de rede com estado e garantias fortes para escalonamento de tal pilha com aplicações multicore. Para permitir comparações justas, projetamos e implementamos o Demieagle, um framework de benchmark que inclui (i) uma pilha TCP flexível, com kernel-bypass e em escala de microssegundos que escalona o processamento de rede e as solicitações de aplicações com diferentes arquiteturas multicore e (ii) um conjunto de benchmark com cargas de trabalho em uma variedade de características que enfatizam diferentes compensações no escalonamento multicore. O Demieagle permite a execução de experimentos comparáveis para descobrir as compensações de diferentes políticas e arquiteturas de escalonamento multicore; assim, orientando os programadores de aplicações em direção a uma política de escalonamento ideal para sua carga de trabalho.
Nesta tese, também abordamos a complexidade do dimensionamento de funções de rede. A Virtualização de Funções de Rede (NFV) promete melhor utilização de recursos computacionais ao dimensionar dinamicamente os recursos sob demanda. No entanto, a maioria das funções de rede são com estados e exigem atualizações de estado por pacote. Durante uma operação de dimensionamento, os trabalhadores precisam sincronizar o acesso a um estado compartilhado para evitar condições de corrida e garantir que as funções de rede processem os pacotes na ordem de chegada. Infelizmente, a abordagem clássica para controlar o acesso simultâneo a um estado compartilhado com locks não é escalável para os requisitos de taxa de transferência e latência atuais. Para abordar esses desafios, projetamos, implementamos e avaliamos o Dyssect, um sistema que permite o dimensionamento dinâmico de funções de rede com estados ao desagregar seus estados. Ao coordenar cuidadosamente as ações entre os trabalhadores e um controlador central, o Dyssect migra fragmentos e fluxos entre os trabalhadores para balanceamento de carga ou priorização de tráfego sem usar locks ou reordenar pacotes. Além disso, a desagregação de estado do Dyssect permite o offloading de funções de rede com estado para NICs programáveis e torna mais fácil explorar compensações de hardware-software que se adaptam melhor a funções de rede específicas e cargas de tráfego. Nossa avaliação experimental mostra que o Dyssect reduz a latência de cauda em até 32,04% e aumenta o vazão em até 19,36% em comparação com soluções estado da arte. |
|
Automatic Inference of BGP Community Semantics |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
24/09/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
- Ítalo Fernando Scotá Cunha
|
Orientando(s) |
- Brivaldo Alves da Silva Junior
|
Banca |
- Antonio Marinho Pilla Barcellos
- Carlos Alberto da Silva
- Edmundo Albuquerque de Souza e Silva
- Ítalo Fernando Scotá Cunha
- Pedro de Botelho Marcos
- Ronaldo Alves Ferreira
|
Resumo |
O Border Gateway Protocol (BGP) orquestra as comunicações de Internet entre Sistemas Autônomos (ASes). A flexibilidade do BGP permite que os operadores expressem políticas complexas e implantem sistemas avançados de engenharia de tráfego. Um mecanismo essencial para essa flexibilidade é marcar anúncios de rota com comunidades BGP, que têm semântica arbitrária definida pelo operador, para passar informações ou solicitações de roteador para roteador. Os usos típicos das comunidades BGP incluem anexar metadados a anúncios de rota, como onde uma rota foi aprendida ou se foi recebida de um cliente, e controlar a propagação de rota, por exemplo, para direcionar o tráfego para caminhos preferenciais ou bloquear ataques DDoS usando comunidades de blackhole. No entanto, não há um padrão para especificar a semântica nem um repositório centralizado que catalogue o significado das comunidades BGP. A falta de padrões e repositórios centrais dificulta o uso de comunidades pelo operador e comunidades de pesquisa.
O principal objetivo desta tese é desenvolver técnicas para inferir a semântica das comunidades BGP usando dados disponíveis publicamente por coletores BGP. Primeiro, propomos um conjunto de técnicas para inferir comunidades de localização. Nossas técnicas inferem comunidades relacionadas às entidades ou locais por onde uma rota atravessa correlacionando comunidades com os AS-path. Também propomos um conjunto de heurísticas para filtrar inferências incorretas introduzidas por redes com comportamento inadequado, compartilhamento de comunidades BGP entre sistemas autônomos siblings e dumps BGP inconsistentes. Aplicamos nossas técnicas a bilhões de registros de roteamento de coletores BGP públicos e disponibilizamos um banco de dados público com mais de 15 mil comunidades de localização. Nossa comparação com bancos de dados construídos manualmente mostra que nossas técnicas fornecem alta precisão (93%), melhor cobertura (81% de recall) e atualizações dinâmicas, complementando a compreensão dos operadores e pesquisadores de sobre a semântica das comunidades BGP.
Também projetamos e avaliamos algoritmos para descobrir automaticamente comunidades BGP de ação e ASes que violam práticas padrão usando consistentemente as comunidades de informação de outros ASes, revelando relacionamentos não documentados entre eles (ex: siblings). Nossa avaliação experimental com bilhões de anúncios de rotas de coletores de rotas BGP públicos de 2018 a 2023 revela relacionamentos entre ASes que eram desconhecidos e mostra que nosso algoritmo para identificar comunidades de ação atinge precisão média e recall de 92,5% e 86,5%, respectivamente. |
Download |
|
|
Unsupervised Domain Adaptation applied to Agriculture and Urban Forests using Transformers, GANs and Diffusion Models |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
30/08/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Alessandro dos Santos Ferreira
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- LUCAS CORREIA RIBAS
- Lucas Prado Osco
- Wesley Nunes Goncalves
|
Resumo |
Arquiteturas de aprendizado profundo, como Redes Neurais Convolucionais, representaram um enorme avanço na área de aprendizado de máquina e vèm continuamente quebrando recordes em inúmeras áreas da inteligência artificial como o reconhecimento de imagens. Todavia, o sucesso dessas arquiteturas é dependente de uma grande quantidade de dados rotulados. Essa anotação dos dados de treinamento consiste em um processo dispendioso e frequentemente realizado de forma manual. Nos problemas relacionados à agricultura e florestas urbanas,devido a diferenças nas condições de aquisição das imagens, por fatores como altura de captura, diferentes sensores, condição do solo, estágios da cultura e iluminação, é comum que os modelos precisem ser novamente treinados a medida que são realizadas novas capturas. Nesse contexto, a adaptação de domínio se apresenta como uma alternativa promissora para lidar com esse problema. A adaptação de domínio consiste em adaptar o conhecimento aprendido em um domínio de origem para aplicá-lo a um domínio destino diferente mas relacionado ao original. O objetivo desse trabalho é utilizar a abordagem de adaptação de domínio para encontrar soluções que lidem com problemas que necessitam de grandes quantidades de dados anotados. Nosso foco consiste em problemas relacionados à agricultura e florestas urbanas, utilizando recentes arquiteturas usadas na adaptação de domínio não supervisionada como as Redes Adversárias Generativas e Vision Transformers e Diffusion Models. Neste trabalho, propomos uma abordagem para resolver o problema de detecção de faixas de plantação e falhas em lavouras, usando dilatação para gerar mapas de segmentação aproximados a partir de linhas anotadas com um pixel de largura. Utilizamos DAFormer, um modelo baseado em transformers, para avaliar a capacidade de transferir o conhecimento aprendido em conjuntos de dados de origem para conjuntos de dados de destino. Além disso, propomos um método para segmentação de árvores que integra adaptação de domínio com modelos de tradução de imagem para imagem e redes de super-resolução para melhorar a qualidade de imagens aéreas de baixa resolução. Nosso método também visa enfrentar o desafio da limitação de dados rotulados, empregando aumento de dados para gerar amostras adicionais de treinamento em alta resolução a partir dos dados rotulados existentes, melhorando assim o desempenho do modelo e reduzindo a necessidade de processos custosos de rotulagem. |
Download |
|
|
O Problema do Mapeamento de Sequências em Grafos de De Bruijn |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
06/08/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
- Francisco Eloi Soares de Araujo
|
Orientando(s) |
|
Banca |
- Diego Padilha Rubert
- Fabio Henrique Viduani Martinez
- Felipe Alves da Louza
- Francisco Eloi Soares de Araujo
- Guilherme Pimentel Telles
- Luis Antonio Brasil Kowada
- Luiz Carlos da Silva Rozante
- Said Sadique Adi
|
Resumo |
Um problema relevante na Biologia Computacional consiste na tarefa de mapear uma sequência em outra, visando a comparação entre elas. Normalmente, esse processo utiliza uma sequência de referência de alta qualidade construída a partir de um conjunto específico de sequências. No entanto, a limitação dessa abordagem é evidente, pois a sequência de referência tende a ser enviesada, representando apenas um conjunto restrito de sequências e sendo incapaz de abranger todas as possibilidades. Para contornar esse viés, uma boa estratégia é representar múltiplas sequências por meio de estruturas mais robustas, como o grafo de sequências ou o grafo de De Bruijn, e mapear sequências nesses grafos. O grafo de sequência é um grafo na qual cada vértice é rotulado com um ou mais caracteres. No grafo de De Bruijn, de ordem k, cada vértice é rotulado com uma sequência distinta de comprimento k e há uma arco de um vértice para outro vértice se e somente se existe uma sobreposição de comprimento k-1 do sufixo do primeiro vértice com o prefixo do segundo vértice. Dadas como entrada uma sequência s e um grafo de sequência (ou De Bruijn) G, mapear s em G consiste em encontrar um percurso p em G tal que a sequência induzia s' por p seja a mais semelhante possível a s. Essa definição dá origem aos problemas abordados nesta tese, a saber o Problema do Mapeamento de Sequências em Grafos de Sequência -- PMSG e o Problema do Mapeamento de Sequências em Grafos de De Bruijn - PMSB. Ambos os problemas admitem três variantes: 1) mudanças apenas na sequência, 2) mudanças no grafo e 3) mudanças na sequência e no grafo. Apresentamos neste trabalho uma análise aprofundada do PMSB. Para a variante 1, temos a implementação e avaliação de algoritmos exatos que a resolvem. Propomos, ainda, heurísticas para o PMSB e conduzimos testes comparativos entre os algoritmos exatos, nossas heurísticas e aquelas encontradas na literatura. Além disso, realizamos um estudo demonstrando que é possível converter um grafo de De Bruijn em um grafo de sequência simples, de tal forma que todas as sequências do grafo de De Bruijn também são induzidas no grafo de sequência simples. No que diz respeito à variante 2, abordamos o problema considerando a capacidade de induzir novos arcos quando um k-mer é modificado no grafo de De Bruijn. Essa abordagem torna o problema mais fácil, permitindo-nos apresentar uma solução polinomial exata para essa variante. |
Download |
|
|
Buriti: um framework para apoiar a tomada de decisão a partir de dados educacionais públicos na Educação Básica |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
26/03/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Amaury Antonio de Castro Junior
- Edson Norberto Caceres
- Nalvo Franco de Almeida Junior
- Vanessa Araujo Borges
- Wellington Santos Martins
|
Resumo |
A Educação Básica é o período de ensino obrigatório para os cidadãos brasileiros entre 4 e 17 anos e os conhecimentos aprendidos em suas três etapas (Educação Infantil, Ensino Fundamental e Ensino Médio) repercutem pela vida dos educandos e por toda a sociedade. Assim, analisar os dados disponíveis sobre a Educação Básica, especialmente aqueles relacionados à qualidade dessa educação, podem oferecer informações importantes para apoiar a tomada de decisão. Por isso, utilizando os dados educacionais públicos, e outras bases de dados, analisou-se algumas etapas da educação nacional em busca de padrões, anomalias e tendências. Para isso, foi criado o framework Buriti, inspirado em modelos de referência de Learning Analytics e de modelagem de dimensional de dados, e um framework de apoio a tomada de decisão na educação. O Buriti foi utilizado, neste trabalho, para analisar os dados de desempenho do SAEB, em seus valores nacional, comparativamente por Unidade da Federação, detalhadamente para o Estado de Mato Grosso do Sul e para um conjunto de escolas. Estas análises, conduzidas em cinco estudos de caso, comprovaram haver problemas de proficiência na Educação Básica que causam uma involução no aprendizado, especialmente entre o 5º e o 9º anos do Ensino Fundamental, que não são sanados no Ensino Médio e têm impacto o ingresso dos jovens no Ensino Superior. Também verificou-se que há uma relação forte entre o desempenho no SAEB e o nível socioeconômico, uma relação mais fraca entre o desempenho no SAEB e a formação dos professores. Assim, este trabalho contribuiu com a identificação de problemas na Educação Básica, a criação do Buriti e com a ampliação da aplicação dos processos de Learning Analytics. |
|
An IoT Architectural Framework for Dynamic Cattle Supplementation |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
21/03/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Ricardo Ribeiro dos Santos
|
Coorientador(es) |
|
Orientando(s) |
- Guilherme Augusto Defalque
|
Banca |
- Davi Jose Bungenstab
- Gumercindo Loriano Franco
- Mário Manuel de Miranda Furtado Campos Cunha
- Paulo Sérgio Lopes de Souza
- Renato Porfirio Ishii
- Ricardo Ribeiro dos Santos
|
Resumo |
O crescimento da população mundial desafia a demanda de produção de carne bovina no mundo. Nesse contexto, há de se considerar o processo de nutrição animal como primordial para alcançar o desempenho desejado de produção do rebanho. Nos maiores países produtores e exportadores de carne bovina do mundo, embora a forragem seja a principal fonte de nutrição dos animais, a degradação das pastagens obriga pecuaristas a fornecerem ao rebanho a suplementação como fonte complementar à nutrição animal. Além de ser um processo que necessita de grande carga de trabalho e tempo, a atividade de suplementação bovina é impactada pelas perdas ocasionadas por dosagens incorretas oriundas de programas nutricionais imprecisos. Implementos agrícolas vêm sendo utilizados por pecuaristas para auxiliar no processo de suplementação, como os Alimentadores Automáticos Programados (Programmable Automatic Feeders - PAFs), que têm a função de fornecer doses pré-determinadas de ração ao rebanho de maneira programada, diminuindo a mão de obra que seria empregada no trato. Apesar de todo aparato tecnológico que PAFs podem possuir, como antenas de rádio frequência para identificação (RFID) dos animais, sensores de chuva, para evitar que o suplemento seja fornecido em períodos chuvosos, etc, PAFs atualmente não possuem integração com sistemas de apoio à decisão (Decision Support Systems - DSS) e com tecnologias que levem em consideração as características dos animais, o desempenho da pastagem, e os parâmetros ambientais para auxiliar no processo de tomada de decisão otimizada para suplementação. Observa-se uma lacuna tecnológica sobre a automação e dinamização do processo de tomada de decisão sobre a suplementação bovina. Tendo em vista tais aspectos, o objetivo deste trabalho é propor um arcabouço de arquiteturas IoT capaz de integrar tecnologias de monitoramento do bem-estar animal (colares de bioacústica, acelerômetros, etc), tecnologias de monitoramento de condições da pastagem (sensores espectrais), e sensores ambientais (sensores de temperatura e umidade, por exemplo), e programas nutricionais com o intuito de desenvolver o processo de suplementação dinâmica em rebanhos de bovinos. Essa tese é composta por uma coletânea de cinco artigos acadêmicos, onde: Capítulos 1 e 2, propõem um conjunto de conteúdos de referência para motivação do desenvolvimento do trabalho; Capítulo 3 apresenta um artigo de revisão de literatura, que detalha as principais técnicas e tecnologias existentes que contribuem para o aprimoramento do processo de suplementação e demonstra o primeiro projeto de uma arquitetura IoT para o processo de suplementação dinâmica; Capítulo 4 apresenta dois artigos, sendo que o primeiro detalha o projeto e desenvolvimento de modelos de aprendizado de máquina para predição de condições da forragem e o segundo, demonstra como foi o processo de coleta de dados para criação de um dataset para validação da proposição das arquiteturas IoT projetadas nas seções posteriores; Capítulo 5 consolida e valida projetos de arquiteturas IoT para suplementação dinâmica de bovinos por meio de dois artigos; e Capítulo 6 apresenta as conclusões e contribuições desta tese. |
|
Rede neural com conexões densas para previsão de séries temporais de longo prazo |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
02/02/2024 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- André Quintiliano Bezerra Silva
|
Banca |
- Bruno Magalhaes Nogueira
- Diego Furtado Silva
- Edson Takashi Matsubara
- Jonathan de Andrade Silva
- Wesley Nunes Goncalves
|
Resumo |
Previsões de séries temporais são essenciais para compreender e antecipar padrões em dados que variam ao longo do tempo. Essas previsões aplicam-se em uma variedade de campos, desde a meteorologia, onde são usadas para prever condições climáticas futuras, até o mercado financeiro, para antecipar movimentos de ações e moedas. Esta tese detalha a inovação trazida pela integração de redes densas, que visa melhorar tanto a modelagem quanto a precisão das previsões. Superando o modelo SCINet, que já era reconhecido por seus bons resultados em séries temporais univariadas e multivariadas, o estudo introduz o DESCINet. Este novo modelo resolve problemas identificados no SCINet, particularmente aqueles decorrentes do uso de downsampling, uma técnica que, apesar de útil, podia levar à perda de informações críticas e dependia fortemente do ajuste fino de hiperparâmetros. Além disso, a tese aborda a dificuldade do SCINet em manter a precisão em previsões de longo prazo devido à sua limitada capacidade de capturar padrões complexos em várias escalas temporais. O DESCINet, com sua abordagem de conexões residuais densas, promete superar essas barreiras, preservando informações detalhadas e aprimorando a capacidade de modelar dependências temporais complexas. Essa abordagem inovadora permite ao modelo manter um desempenho consistente ao longo de horizontes de previsão estendidos. A aplicação prática do DESCINet foi testada em uma ampla gama de conjuntos de dados, como ETT, Weather, Electricity, Illness, Traffic, and Exchange Rate. Em todos esses casos, o DESCINet demonstrou superioridade em relação ao SCINet, validando sua eficácia em contextos variados e complexos. A seleção desses conjuntos de dados ilustra a diversidade dos desafios inerentes à previsão de séries temporais e destaca a adaptabilidade e robustez do DESCINet. Este estudo adiciona uma contribuição para o campo de séries temporais ao explorar o potencial ainda pouco aproveitado das redes densas. A integração dessas redes em modelos de previsão de séries temporais abre caminho para avanços importantes, tanto em termos acadêmicos quanto em aplicações práticas. A proposta do DESCINet indica uma direção promissora para futuras pesquisas, sugerindo que a superação de limitações atuais na previsão de séries temporais está ao alcance. Ao concluir, esta tese oferece uma melhor compreensão sobre o impacto das conexões densas na previsão de séries temporais, encorajando a comunidade científica a investigar mais profundamente o DESCINet. Espera-se que o trabalho estimule pesquisas contínuas nesta área, pavimentando o caminho para novas inovações e práticas que aprimorem a modelagem de séries temporais, tornando-as mais eficazes e precisas. |
Download |
|
|
Preditor Híbrido de Estruturas Terciárias de Proteínas |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
10/08/2023 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Telma Woerle de Lima Soares
|
Coorientador(es) |
|
Orientando(s) |
- Alexandre Barbosa de Almeida
|
Banca |
|
Resumo |
|
|
Opinion Mining for App Reviews: Identifying and Prioritizing Emerging Issues for Software Maintenance and Evolution |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
14/07/2023 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Ricardo Marcondes Marcacini
|
Coorientador(es) |
|
Orientando(s) |
- Vitor Mesaque Alves de Lima
|
Banca |
- Bruno Magalhaes Nogueira
- Fabio Manoel Franca Lobato
- Jacson Rodrigues Barbosa
- Marcelo Augusto Santos Turine
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
- Solange Oliveira Rezende
|
Resumo |
A mineração de opinião para avaliações de aplicativos tem como objetivo analisar os comentários dos usuários nas lojas de aplicativos para apoiar as atividades de engenharia de software, principalmente a manutenção e evolução de software. Identificar prontamente problemas emergentes, como bugs, é um dos principais desafios na manutenção da qualidade do software. No entanto, analisar manualmente esses comentários é um desafio devido à grande quantidade de dados textuais. Métodos baseados em aprendizado de máquina têm sido empregados para automatizar a mineração de opinião e lidar com essa questão. Embora métodos recentes tenham alcançado resultados promissores na extração e categorização de problemas a partir das opiniões dos usuários, os estudos existentes concentram-se principalmente em auxiliar os engenheiros de software a explorar o comportamento histórico dos usuários em relação às funcionalidades do aplicativo e não exploram mecanismos de deteção de tendências e classificação de risco de problemas emergentes. Além disso, os estudos anteriores não abrangem o processo completo de análise de problemas e riscos por meio de uma abordagem não supervisionada. Este projeto de doutorado avança o estado da arte na mineração de opinião para reviews de aplicativos, propondo uma abordagem não supervisionada para identificar e priorizar problemas emergentes. Nosso objetivo é minimizar o tempo entre a ocorrência de um problema e sua correção, permitindo uma rápida identificação do problema. Propomos duas novas abordagens que (i) identifica possíveis requisitos de software defeituosos e treina modelos preditivos para antecipar requisitos com maior probabilidade de avaliação negativa e (ii) detecta problemas a partir de avaliações, classifica-os em uma matriz de risco com níveis de priorização e monitora sua evolução ao longo do tempo. Adicionalmente, apresentamos uma abordagem de construção da matriz de risco usando os recentes Large Language Models (LLMs). Processamos mais de 6.6 milhões de comentários de usuários para avaliar nossa proposta, identificando e classificando o risco associado a quase 270.000 problemas. Os resultados demonstram a competitividade de nossa abordagem não supervisionada em comparação com modelos supervisionados existentes. Comprovamos que as opiniões extraídas dos comentários dos usuários fornecem percepções importantes sobre os problemas e riscos associados aos aplicativos, que podem ser detectados antecipadamente para mitigar seu impacto. Nosso processo de mineração de opinião implementa a análise automatizada de problemas, com priorização baseada em risco e monitoramento temporal.
|
Download |
|
|
Abordagens Multimodais com Fusão de Dados em Aprendizado Profundo |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
16/06/2023 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Diego Furtado Silva
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Gustavo Enrique de Almeida Prado Alves Batista
- Ricardo Marcondes Marcacini
|
Resumo |
As redes neurais profundas, especialmente os modelos de linguagem e visão, têm sido amplamente utilizados em problemas reais nos últimos anos. Geralmente modelos aplicam o uso de apenas um tipo de dado/informação (texto, imagem, vídeo, áudio) em problemas de aprendizado, também chamados de modelos unimodais. No entanto, dada a quantidade crescente de informações não estruturadas e a variedade de formatos de dados existentes, novas abordagens têm sido desenvolvidas com o objetivo de estabelecer estratégias que viabilizem a utilização de múltiplos dados em um mesmo modelo de aprendizado. Este trabalho explora a fusão de dados em modelos de Aprendizado de Máquina Multimodal (AM). A proposta desta tese explora uma estratégia simples que utiliza operações matemáticas para fundir os diversos tipos de dados entre as camadas da arquitetura multimodal, mecanismos de atenção e conexões residuais. Uma outra proposta explora o uso da destilação de conhecimento multimodal para otimizar o desempenho de modelos de aprendizado profundo, transferindo conhecimento entre modalidades de um mesmo domínio. O principal avanço deste trabalho foi usar as operações aritméticas, mecanismos de atenção e conexões residuais em abordagens multimodais com a fusão de dados. Isso permitiu obter representações complementares sobre as modalidades, o que levou a uma melhor convergência sem diferença significativa com o estado-da-arte. |
Download |
|
|
Investigation of machine learning techniques to aid in the diagnosis of neurodegenerative diseases |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
20/03/2023 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Hugo Alexandre Dantas do Nascimento
|
Coorientador(es) |
- Nilza Nascimento Guimarães
|
Orientando(s) |
|
Banca |
- Hugo Alexandre Dantas do Nascimento
- Nilza Nascimento Guimarães
- Renato de Freitas Bulcão Neto
- Rogerio Lopes Salvini
- Ronaldo Martins da Costa
- Sérgio Teixeira De Carvalho
|
Resumo |
Doenças neurodegenerativas (DND), como a Doença de Parkinson (DP), Doença de Huntington (DH) e Esclerose Lateral Amiotrófica (ELA) causam, entre outros sintomas, movimentos involuntários, fraqueza muscular e dificuldade em manter uma marcha estável. Em estágios avançados, essas doenças podem levar à morte. As DNDs não têm cura e diagnosticá-las é uma tarefa difícil porque muitas delas não possuem um único teste definitivo que permita confirmar a doença. Um diagnóstico precoce é ainda mais complexo dada a presença de sintomas comuns a muitas outras doenças, o que posterga intervenções precoces de tratamento e favorece a progressão dos processos degenerativos. Nesta tese, investigamos o uso de técnicas de aprendizado de máquina para auxiliar no diagnóstico e diferenciação de pacientes com DP, DH, ELA e indivíduos saudáveis a partir da marcha. Métodos computacionais alternativos, rápidos, e de baixo custo, são propostos para auxiliar nesta tarefa. Os métodos propostos inovam ao investigar, pela primeira vez na literatura, características obtidas a partir da distorção harmônica da série da marcha, além de prover uma análise detalhada do efeito dos parâmetros da marcha para a classificação desses sinais. Além disso, uma abordagem inovadora é proposta para priorizar os pacientes, reduzindo a quantidade de esforço físico necessário para o exame. Assim, propomos e investigamos a viabilidade de adotar intervalos de caminhada mais curtos, como um único minuto de caminhada, tendo em vista que pacientes com DNNs podem ter dificuldades em caminhar continuamente, mesmo por curtos períodos de tempo, e durante os estágios iniciais da doença. Os métodos propostos são validados com bases de dados públicas de marcha, coletadas por meio de sensores de força alocados nos pés de pessoas com DP, DH, ELA, e também de indivíduos saudáveis durante uma caminhada livre. Os resultados são comparados a estudos de estado da arte, e é possível observar a eficácia e eficiência dos métodos propostos, confirmando seu potencial para auxiliar no diagnóstico de DNDs e serem explorados na prática. |
|
Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
23/12/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Afonso Paiva Neto
- Douglas Cedrim Oliveira
- Eraldo Luis Rezende Fernandes
- Hemerson Pistori
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Thales Miranda de Almeida Vieira
- Thiago Oliveira dos Santos
|
Resumo |
Na área de processamento geométrico, diversas técnicas propostas na literatura
requerem que sejam estabelecidos pares de pontos de correspondência entre duas ou
mais superfícies, isto é, dado um ponto sobre uma superfície fonte, é preciso associar
qual é o ponto sobre uma superfície alvo que corresponde ao ponto dado. As aplicações
incluem reconstrução de superfícies, parametrização cruzada, transferência de pose,
transferência de texturas ou animações, reconhecimento e busca de formas, entre outras. A definição de uma função de mapeamento entre duas formas, mesmo para um número discreto de pontos característicos, nem sempre envolve somente relações geométricas ou estruturais, mas também relações semânticas. Uma vez que tal mapeamento em geral não pode ser diretamente expresso por abordagens puramente axiomáticas, em vários métodos de processamento geométrico a indicação de um conjunto inicial de pontos de correspondência é efetuada manualmente, através de processos que podem ser laboriosos e sujeitos a erros. De fato, descobrir relações semânticas entre formas quaisquer sem qualquer interação do usuário tratava-se de um problema ainda em aberto. Modelos de aprendizagem de máquina, em especial aprendizagem profunda, têm evoluído por sua capacidade de utilizar grandes conjuntos de dados para estimar a solução de problemas em diversas áreas do conhecimento, inclusive processamento geométrico. Este trabalho apresenta um método que utiliza aprendizagem multivisão profunda como parte do processamento responsável por encontrar automaticamente, isto é, sem a intervenção direta do usuário, pontos de correspondência entre superfícies de formas 3D, representadas por malhas de triângulos. O método é dividido em dois componentes: treinamento e correspondência. O primeiro trata-se de um treinamento multivisão que aprende, com o auxílio de uma CNN, a detectar pontos de interesse em imagens 2D oriundas de malhas de triângulos dos conjuntos de treinamento. O último, utiliza o resultado do treinamento para inferir correspondências semânticas com pontos de interesse (vértices) em formas 3D. A descoberta desses pontos não requer novo treinamento e nem interação humana durante o pipeline de correspondência. |
|
Correspondência de Pontos em Formas 3D Baseada em Aprendizagem Profunda Multivisão |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
23/12/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
- Eraldo Luis Rezende Fernandes
|
Orientando(s) |
- Alexandre Soares da Silva
|
Banca |
- Afonso Paiva Neto
- Douglas Cedrim Oliveira
- Eraldo Luis Rezende Fernandes
- Hemerson Pistori
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Thales Miranda de Almeida Vieira
- Thiago Oliveira dos Santos
|
Resumo |
Na área de processamento geométrico, diversas técnicas propostas na literatura requerem que sejam estabelecidos pares de pontos de correspondência entre duas ou mais superfícies, isto é, dado um ponto sobre uma superfície fonte, é preciso associar qual é o ponto sobre uma superfície alvo que corresponde ao ponto dado. As aplicações incluem reconstrução de superfícies, parametrização cruzada, transferência de pose, transferência de texturas ou animações, reconhecimento e busca de formas, entre outras. A definição de uma função de mapeamento entre duas formas, mesmo para um número discreto de pontos característicos, nem sempre envolve somente relações geométricas ou estruturais, mas também relações semânticas. Uma vez que tal mapeamento em geral não pode ser diretamente expresso por abordagens puramente axiomáticas, em vários métodos de processamento geométrico a indicação de um conjunto inicial de pontos de correspondência é efetuada manualmente, através de processos que podem ser laboriosos e sujeitos a erros. De fato, descobrir relações semânticas entre formas quaisquer sem qualquer interação do usuário tratava-se de um problema ainda em aberto. Modelos de aprendizagem de máquina, em especial aprendizagem profunda, têm evoluído por sua capacidade de utilizar grandes conjuntos de dados para estimar a solução de problemas em diversas áreas do conhecimento, inclusive processamento geométrico. Este trabalho apresenta um método que utiliza aprendizagem multivisão profunda como parte do processamento responsável por encontrar automaticamente, isto é, sem a intervenção direta do usuário, pontos de correspondência entre superfícies de formas 3D, representadas por malhas de triângulos. O método é dividido em dois componentes: treinamento e correspondência. O primeiro trata-se de um treinamento multivisão que aprende, com o auxílio de uma CNN, a detectar pontos de interesse em imagens 2D oriundas de malhas de triângulos dos conjuntos de treinamento. O último, utiliza o resultado do treinamento para inferir correspondências semânticas com pontos de interesse (vértices) em formas 3D. A descoberta desses pontos não requer novo treinamento e nem interação humana durante o pipeline de correspondência. |
Download |
|
|
Segmentação de Imagens incluindo Contexto em Redes Neurais Convolucionais |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
19/12/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Lucas Prado Osco
- Wesley Nunes Goncalves
|
Resumo |
Existe uma demanda significativa para a automação da localização e reconhecimento dos objetos e pessoas, desde a automação da agricultura até sistemas de mensuração automática do nível da água em rios, tudo realizado por sistemas de visão computacional. A atribuição dessas marcações ou rotulações é realizada atualmente em nível de pixel, técnica chamada de segmentação semântica. Porém, em uma única imagem podem existir várias classes, e frequentemente essas classes são muito parecidas, se tornando um desafio complexo a ser trabalhado. Recentemente, métodos baseados em Redes Neurais Convolucionais (CNN) alcançaram um sucesso impressionante em tarefas de segmentação semântica. Esse sucesso deve-se, entre outros fatores, à inclusão de algum contexto para auxiliar a rede, como por exemplo a informação que uma classe é mais frequente que a outra e/ou; a informação de que o dataset possui imagens com um alto nível de incerteza na rotulação dos pixels presentes nas bordas. Contudo, esses dois pontos mencionados, tanto o desequilíbrio das classes quanto à incerteza de rotulação de pixels, podem ser melhores explorados. Apresentamos uma abordagem que calcula e atribui um peso para o pixel, considerando sua classe e a incerteza durante o processo de rotulação. Os pesos dos pixels são usados durante o treinamento para aumentar ou diminuir a importância dos pixels. Alguns trabalhos são apresentados demonstrando a utilização de técnicas de segmentação semântica com inclusão de contexto, com resultados significativos em comparação com os métodos mais relevantes. Além disso, também apresentamos um método para a reconstrução da área do objeto de interesse, permitindo a reconstrução das bordas desse objeto. As técnicas aqui apresentadas podem ser utilizadas em uma ampla variedade de métodos de segmentação, melhorarando sua robustez. |
|
Acelerando Florestas de Decisão Paralelas em Processadores Gráficos para a Classificação de Texto |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
12/09/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Wellington Santos Martins
|
Coorientador(es) |
|
Orientando(s) |
- Julio Cesar Batista Pires
|
Banca |
- Fabrizzio Alphonsus Alves de Melo Nunes Soares
- Júnio César de Lima
- SÁVIO SALVARINO TELES DE OLIVEIRA
- Wellington Santos Martins
|
Resumo |
|
Download |
|
|
Counting and locating high-density objects using convolutional neural network |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
06/09/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Mauro dos Santos de Arruda
|
Banca |
- Bruno Brandoli Machado
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Keiller Nogueira
- Lucas Prado Osco
- Wesley Nunes Goncalves
|
Resumo |
Contagem e detecção automática de objetos são essenciais em diferentes tipos de aplicações pois permitem melhorias desempenhos na execução das tarefas manuais. Métodos de aprendizado profundo estão se destacando cada vez mais nesse tipo de aplicação pois conseguem realizar boas caracterizações dos objetos. Entretanto, desafios como a sobreposição, oclusão, diferentes de escalas e alta densidade de objetos atrapalham o desempenho desses métodos, fazendo com que esse problema permaneça aberto. Tais métodos normalmente usam anotações por caixas delimitadoras, o que prejudica seu desempenho em cenas de alta densidade com adjacência de objetos. Para superar tais limitações, avançando o estado da arte, nós propomos um método de contagem e detecção de objetos usando mapas de confiança. A primeira aplicação permitiu definir um método baseado em redes neurais convolucionais que recebem como entrada uma imagem multiespectral e detecta os objetos a partir de picos no mapa de confiança. Em uma segunda aplicação, nós inserimos informações de contexto global e local através do módulo PPM, para a detecção de objetos em diferentes escalas. Além disso, melhoramos o refinamento sucessivo do mapa de confiança com múltiplos valores de sigma na fase MSS. Na terceira aplicação do método, nós propomos um módulo de seleção de bandas para trabalhar com imagens hiperespectrais. Em uma quarta aplicação, nós avaliamos o método proposto em imagens RGB de alta densidade de objetos e comparamos com métodos do estado da arte: YOLO, Faster R-CNN e RetinaNet. Por último, expandimos o método propondo uma arquitetura de duas ramificações permitindo a troca de informações entre eles. Essa melhoria permite que o método detecte simultaneamente plantas e linhas de plantio em diferentes conjuntos de dados. Os resultados descritos nesta tese mostram que a utilização de redes neurais convolucionais e mapas de confiança para a detecção e contagem de objetos permite alto desempenho. As contribuições descritas aqui, devem suportar avanços significativos nas áreas de detecção de objetos e aprendizado profundo. |
|
Multi-task Learning Applied to Computer Vision Problems |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
28/03/2022 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Lucas Prado Osco
- Paulo Eduardo Teodoro
- Vanessa Aparecida de Moraes Weber
|
Resumo |
O aprendizado profundo tem sido amplamente estudado, principalmente para resolver problemas considerados complexos. De forma geral, esses problemas podem ser descritos e divididos em um conjunto de tarefas. Essas tarefas são intrínsecas ao problema geral, ou seja, são definidas de forma natural por fazer parte da essência do problema. Além disso, elas podem ser aprendidas de forma isolada porém estão relacionadas para solução do problema geral. Outro fator importante é que para um problema maior de visão computacional, realizar as tarefas distintas individualmente se torna muito custoso em memória e tempo de inferência. Para solucionar esses problemas uma abordagem chamada Aprendizado Multitarefa (MTL) foi proposta. A ideia é simular o aprendizado humano, em que pessoas podem aprender novas tarefas através de experiências obtidas no aprendizado de tarefas similares. Essa abordagem permite o aprendizado das tarefas do problema de maneira simultânea, construindo uma relação entre elas. A partir desses direcionamentos, este trabalho na forma de coleção de artigos apresenta abordagens MTL para a resolução de problemas de visão computacional. Inicialmente, dois problemas foram abordados: detecção de linhas de plantação no primeiro artigo e detecção de alevinos no segundo. Na detecção de linhas de plantação a ideia é dividir o problema em identificar as plantas individualmente e detectar as linhas de plantação. Na detecção de alevinos as tarefas são divididas em detectar o alevino e identificar a direção desse alevino nos quadros subsequentes. Para ambos os problemas, um método foi proposto com um backbone que extrai as características iniciais para todas as tarefas. Tendo como entrada as características iniciais, ramos independentes aprendem a solução de cada tarefa. A troca de informações entre as tarefas ocorre por meio da concatenação das características extraídas em pontos específicos de cada ramo. Os resultados mostraram que o compartilhamento entre as tarefas é importante para a solução, alcançando resultados superiores ao estado-da-arte. Além das duas propostas, um novo método de segmentação semântica usando MTL e mecanismo de atenção foi proposto. O principal avanço foi o uso de pesos aprendidos por Transformers para indicar a importância de uma tarefa nas demais. Assim, apenas regiões da imagem consideradas relevantes influenciam em outras tarefas. Os resultados em dois problemas, segmentação de linhas e falhas de plantação, e segmentação da folha e desfolha, mostraram a eficácia da abordagem frente ao estado-da-arte. |
Download |
|
|
Desenvolvimento e Avaliação de Métodos de Interação com Dispositivos e Ambientes Inteligentes Utilizando Smartwatches: Uma Abordagem com Reconhecimento Contínuo de Gestos |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
06/12/2021 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Fabrizzio Alphonsus Alves de Melo Nunes Soares
|
Coorientador(es) |
|
Orientando(s) |
- Thamer Horbylon Nascimento
|
Banca |
- Alexandre Cardoso
- Deborah Silva Alves Fernandes
- Fabrizzio Alphonsus Alves de Melo Nunes Soares
- Fátima de Lourdes dos Santos Nunes Marques
- Gélson da Cruz Júnior
- Renato de Freitas Bulcão Neto
- Ronaldo Martins da Costa
|
Resumo |
|
Download |
|
|
Braces minimais e suas propriedades |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
27/10/2021 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Marcelo Henriques de Carvalho
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Alberto Alexandre Assis Miranda
- Fabio Henrique Viduani Martinez
- Francisco Eloi Soares de Araujo
- José Coelho de Pina Junior
- Marcelo Henriques de Carvalho
|
Resumo |
McCuaig provou um teorema de geração para braces e o usou como uma ferramenta de indução
para obter uma caracterização estrutural de braces Pfaffianos.
Um brace é minimal se a remoção de qualquer aresta resulta em grafo que não é brace. A partir
do teorema de geração de braces de McCuaig, nós provamos nosso teorema principal que pode ser visto
como uma ferramenta de indução para braces minimais. Como uma aplicação, nós provamos que um
brace minimal de ordem 2n (n ≥ 6) tem no máximo 5n − 10 arestas e apresentamos uma caracterização
completa dos braces minimais para os quais esse limite superior ocorre com igualdade.
Um trabalho similar foi realizado no contexto de bricks minimais por Norine-Thomas em que
eles deduzem o resultado principal do teorema de geração de bricks provado pelos mesmos autores.
No final deste trabalho, apresentamos um teorema único para a construção de bricks e braces minimais
combinando uma prova alternativa do teorema de Norine-Thomas com o nosso teorema principal. |
Download |
|
|
String-Recommender: Combining temporal information with Collaborative Filtering using string-comparison measures |
|
Curso |
Doutorado em Ciência da Computação |
Tipo |
Tese |
Data |
17/09/2021 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Hugo Alexandre Dantas do Nascimento
|
Coorientador(es) |
|
Orientando(s) |
- Luiz Mário Lustosa Pascoal
|
Banca |
- Anderson da Silva Soares
- Claudia Lage Rebello da Motta
- Gustavo Post Sabin
- Hugo Alexandre Dantas do Nascimento
- Sílvio César Cazella
- Telma Woerle de Lima Soares
- Thierson Couto Rosa
- Wellington Santos Martins
|
Resumo |
|
Download |
|
|