Mestrado em Ciência da Computação

Atenção! O edital referente ao processo seletivo e arquivos pertinentes ao curso estão disponíveis no site do curso.
Os resultados dos processos seletivos serão divulgados no site do curso.

Trabalhos

Trabalhos Disponíveis

TRABALHO Ações
Classificação de Séries Temporais baseada em Análise de Recorrência e Extração de Características
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 03/08/2016
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Renato Porfirio Ishii
Orientando(s)
  • Angelo Maggioni e Silva
Banca
  • Eraldo Luis Rezende Fernandes
  • Paulo Aristarco Pagliosa
  • Renato Porfirio Ishii
  • Rodrigo Fernandes de Mello
Resumo A identificação de padrões em fluxos de dados contínuos tem despertado o interesse científico, seja na detecção de falhas em sistemas, identificação de operações fraudulentas em transações bancárias, propagação de doenças ou ainda na preservação do meio ambiente. A categorização destes dados, concomitante com a ampliação do sensoriamento e monitoramento de diversos outros domínios, motiva a busca por soluções práticas e eficientes que auxiliem na busca por padrões recorrentes. A extração de conhecimento dos dados, quando dependentes do tempo, exige um tratamento especial e a mineração dos dados apresenta-se como uma atividade valiosa. Neste trabalho, é proposta uma abordagem chamada DSP-Class para classificação de séries temporais utilizando Descritores de Textura aplicados em Gráficos de Recorrência (RP). São utilizados 14 conjuntos de dados reais relacionados a vocalizações de aves, identificação de insetos, categorização de reações químicas, dentre outros. O objetivo desta pesquisa é verificar a utilização das características texturais de RPs em algoritmos de aprendizagem, tais como Support Vector Machine (SVM) e C5:0, aplicando a Decomposição de Modo Empírico (EMD) na classificação de séries temporais. Também é analisada a influência estocástica-determinística presentes nos fluxos. Verifica-se desempenho ruim do algoritmo 1NN, considerado estado-da-arte, em séries predominantemente estocásticas ou determinísticas e desempenho 67:66% superior da abordagem DSP-Class, uma vez que as características texturais distinguem classes de séries temporais mais satisfatoriamente que a busca por similaridade utilizada no algoritmo 1NN nos dados analisados. Verifica-se inclusive, resultados 18;67% superiores àqueles obtidos por pesquisas semelhantes que utilizam outras características presentes em séries temporais.
Download
Problema das pseudo-arborescências capacitadas com a localização de facilidades
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 22/07/2016
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Edna Ayako Hoshino
Orientando(s)
  • Fabio Henrique Noboru Abe
Banca
  • Anderson Vicoso de Araujo
  • Cid Carvalho de Souza
  • Edna Ayako Hoshino
  • Fabio Henrique Viduani Martinez
Resumo Neste trabalho apresentamos o problema das pseudo-arborescências capacitadas com localização de facilidades, um problema novo e relacionado a dois outros problemas clássicos: o problema do roteamento de veículos
capacitado e o problema da localização de facilidade capacitada. O problema estudado é uma generalização do problema da pseudo-arborescência capacitada, em inglês capacitated ring tree problem. Propomos neste estudo duas formulações em programação linear inteira para modelar o problema. A primeira é uma formulação estendida baseada em partição de conjuntos e a segunda é uma formulação compacta baseada em fluxos. Propomos também dois algoritmos exatos para resolver o problema. Um deles utiliza a técnica de branch-and-price com a formulação estendida e o outro é um algoritmo do tipo branch-and-bound baseado na formulação compacta. Implementamos também uma heurística primal e uma heurística de pricing com o objetivo de melhorar o desempenho dos métodos exatos. Experimentos computacionais realizados em um grupo de instâncias testes mostram que a formulação estendida fornece limitantes muito mais apertados do que a formulação compacta. Além disso, as heurísticas foramrelevantes para acelerar os métodos de branch-and-price e branch-and-bound, em especial a heurística primal.
Download
FlexRank: Um Rankeador Lexicográfico Rápido
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 29/06/2016
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Edson Takashi Matsubara
Orientando(s)
  • Lucas de Souza Rodrigues
Banca
  • Anderson Vicoso de Araujo
  • Bruno Magalhaes Nogueira
  • Edson Takashi Matsubara
  • Eraldo Luis Rezende Fernandes
Resumo O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
Download
Uma Abordagem para Classificação de Séries Temporais Baseada em Modelo Autorregressivo e Gráfico de Recorrência
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 25/05/2016
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Renato Porfirio Ishii
Orientando(s)
  • Hudson Fujikawa de Paula
Banca
  • Eraldo Luis Rezende Fernandes
  • Paulo Aristarco Pagliosa
  • Renato Porfirio Ishii
  • Ricardo Araújo Rios
Resumo Atualmente, os estudos sobre o problema da classificação de séries temporais tem se concentrado em elaborar abordagens em dois formatos: baseado em funções de distância entre itens do conjunto de dados, e baseado em um procedimento de dois estágios, onde as séries temporais são transformadas em vetores de características, permitindo o emprego de técnicas de classificação convencionais. Neste contexto, não tem sido notado na literatura
estudos baseados na análise de propriedades intrínsecas do processo gerador da série temporal como, por exemplo, o determinismo. Neste trabalho de mestrado, é proposta uma abordagem para o problema da classificação de séries temporais, projetada em dois estágios e baseada na análise de propriedades intrínsecas de determinismo e de estocasticidade. Primeiramente, cada série temporal é processada pelo modelo autorregressivo (AR) e pelo Gráfico de Recorrências, para modelar as influências estocásticas e determinísticas, presentes nas séries temporais. Posteriormente, são extraídas características, a partir da nova representação, que compõem o novo espaço característico. Para a classificação em si, optou-se pelo SVM em seu formato convencional. Tomou-se como abordagem de referência da literatura, o classificador 1-NN com funções de distâncias Euclidiana, DTW e DTW otimizado por janela de busca. Os experimentos foram executados sobre os conjuntos de dados do repositório UCR. Os resultados finais mostram que o desempenho de classificação é competitivo, ou superior, a melhor configuração 1-NN em 19 de 41 conjuntos de dados. Não obstante, os resultados evidenciam, também, a necessidade de uma investigação mais aprofundada sobre as influências das propriedades intrínsecas, e outras técnicas da área de análise de séries temporais, quando aplicadas na tarefa de classificação.
Download
Atributos de Ponto de Interesse e Casamento de Modelos para Contagem de Insetos-Praga em Cultura de Soja
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 31/03/2016
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Hemerson Pistori
Orientando(s)
  • Diogo Soares da Silva
Banca
  • Denilson de Oliveira Guilherme
  • Edson Takashi Matsubara
  • Hemerson Pistori
  • Lucas Castro Torres
  • Marco Hiroshi Naka
Resumo Neste trabalho é apresentado uma aplicação para a contagem de insetos em plantações de soja, o objetivo desta aplicação é ser uma ferramenta para o auxílio de agrônomos e técnicos agrícolas na inspeção de cultivos de soja. A aplicação utiliza imagens aéreas, capturadas por Veículos Aéreos não Tripulados, para a contagem dos insetos, e com esta informação o especialista pode definir se existe infestação de insetos na plantação ou não, decidindo se é necessária a aplicação de inseticidas. Para a identificação e contageßm dos insetos, técnicas de visão computacional baseadas em Pontos de Interesse foram utilizadas, sendo o Speeded Up Robust Feaure (SURF) a técnica utilizada para a detecção e descrição dos Pontos de Interesse das imagens analisadas. Para a classificação dos insetos, técnicas baseadas em casamento de modelos, em específico técnicas que utilizam os pontos de interesse para definir o casamento entre as imagens, foram utilizadas para definir a semelhança entre a imagem teste com as classes analisadas. Com essa informação três métricas foram utilizadas para definir a classe do inseto, a do ponto com distância mínima, a distância média mínima e o número de casamentos. Nos experimentos realizados foram variados os parâmetros do detector e descritor de pontos de interesse a fim de encontrar os melhores resultados para a classificação. O método proposto foi comparado com três classificadores baseados em Máquina de Vetores de Suporte, K vizinhos mais próximos e árvores de decisão. O método proposto obteve uma medida-F de 0.899 sendo estatisticamente melhor do que o classificador baseado em árvores de decisão e semelhante aos baseados em Máquina de Vetores de Suporte e K vizinhos mais próximos. O módulo de contagem foi comparado com a contagem de um especialista que marcou todas as imagens de teste. Através do teste de hipóteses ANOVA (Análise de variância) foi comprovado que a contagem do método proposto e do especialista não são divergentes, com um nível de significância de 5%, evidenciando o potencial da proposta na automação de avaliações de pragas em campo.
Download
Parametrização Cruzada de Modelos Geométricos 3D em Movimento
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 02/10/2015
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Paulo Aristarco Pagliosa
Orientando(s)
  • Andre Luis Vieira Medalha
Banca
  • Afonso Paiva Neto
  • Edson Takashi Matsubara
  • Paulo Aristarco Pagliosa
  • Renato Porfirio Ishii
Resumo O objetivo geral deste projeto de mestrado é apresentar uma técnica de parametrização cruzada entre modelos geométricos 3D em movimento. Um modelo geométrico de um objeto em movimento é definido por um conjunto de malhas de triângulos, onde cada malha representa uma pose da superfície do objeto em dado instante de tempo. A técnica proposta toma como entrada dois conjuntos de poses, um conjunto fonte e outro alvo. O primeiro passo desta técnica é a determinação da correspondência inicial de cada pose, ação esta que conta com auxílio de um algoritmo de detecção de pontos característicos e um ambiente de teste interativo. Com esse conjunto de correspondência inicial, torna-se possível realizar a parametrização cruzada entre as diversas poses da fonte e do alvo enquanto os respectivos modelos geométricos se movem, permitindo assim aplicações como morphing dinâmico.
Problema do Fluxo Máximo em Redes Utilizando OpenMP e CUDA
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 02/10/2015
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Marco Aurelio Stefanes
Orientando(s)
  • Luiz Fernando Alvino
Banca
  • Carlos Henrique Aguena Higa
  • Fabio Henrique Viduani Martinez
  • José Coelho de Pina Junior
  • Marco Aurelio Stefanes
Resumo O problema do fluxo máximo em redes é um problema fundamental de teoria dos grafos, com muitas aplicações importantes. Os algoritmos para o fluxo máximo baseados no método push-relabel são conhecidos por serem mais efi-
cientes assintoticamente e terem menor tempo de execução na prática. Vários algoritmos paralelos foram propostos, mas poucos deles tiveram tempos de execução menores do que a implementação hipr de Goldberg, baseada em push-relabel. O objetivo geral desta dissertação é discutir as soluções sequenciais e paralelas para o problema do fluxo máximo em redes. Uma contribuição relevante é que propomos um novo algoritmo paralelo híbrido OpenMP-CUDA que explora a paralelização das heurísticas rotulação global e rotulação gap, além de utilizar o processamento em CPU e GPU adaptativamente para maximizar a eficiência de execução. Os resultados dos testes realizados mostram que esse algoritmo é até 5 vezes mais rápido do que a implementação hipr.
Download
Visualização de Projeções Multidimensionais em Dispositivos Móveis
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 01/10/2015
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Paulo Aristarco Pagliosa
Orientando(s)
  • Rafael Jesus Sandim
Banca
  • Afonso Paiva Neto
  • Edson Takashi Matsubara
  • Paulo Aristarco Pagliosa
  • Renato Porfirio Ishii
Resumo
Download
    Determinação de regiões genômicas específicas para seleção de oligonucleotídeos iniciadores usando famílias de proteínas e sequências características
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 30/09/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Nalvo Franco de Almeida Junior
    Orientando(s)
    • Rodrigo Andrade Cardoso
    Banca
    • Flábio Ribeiro de Araújo
    • Luciana Montera Cheung
    • Nalvo Franco de Almeida Junior
    • Said Sadique Adi
    Resumo Com o sequenciamento mais frequente de genomas, várias técnicas de comparação têm sido propostas, com inúmeras aplicações. Este trabalho propõe uma técnica
    computacional baseada em sequências características e na construção de famílias de proteínas para determinar trechos de um genoma que contenham candidatos a oligonucleotídeos iniciadores específicos desse genoma, quando comparado com outros. Os trechos determinados pela metodologia proposta podem ser usados como entrada para ferramentas que encontram oligonucleotídeos iniciadores específicos. Testes revelaram que a metodologia se mostrou muito efetiva para genomas de espécies diferentes.
    Download
    Alinhamento de Várias Sequências Utilizando Arquiteturas Paralelas Híbridas
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 30/09/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Marco Aurelio Stefanes
    Orientando(s)
    • Valter de Oliveira Ferlete
    Banca
    • Luiz Carlos da Silva Rozante
    • Marco Aurelio Stefanes
    • Nahri Balesdent Moreano
    • Renato Porfirio Ishii
    Resumo A comparação de sequências biológicas é uma das principais ferramentas da bioinformática, para auxiliar os biólogos a realizar análise de dados com objetivo de determinar a função ou estrutura das sequências biológicas e inferir informações sobre sua evolução em organismos que estejam em estudo. A resolução deste problema, contudo, envolve grandes dificuldades computacionais e biológicas, levando ao surgimento de diversas aproximações e heurísticas para sua resolução. O objetivo deste trabalho é escrever um algoritmo paralelo em CUDA e MPI, para realizar o alinhamento global de várias sequências biológicas, especificamente de DNA e proteínas, utilizando heurísticas que possam fornecer uma certa qualidade em um tempo razoável. Foi realizado um comparativo dos resultados obtidos, com os dados que as melhores ferramentas da atualidade apresentam.
    Download
    Influência de Regiões Anômalas em Genomas de Referência Utilizados para Montagem Guiada
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 29/09/2015
    Área TEORIA DA COMPUTAÇÃO
    Orientador(es)
    • Luciana Montera Cheung
    Orientando(s)
    • Bárbara Purkott Cezar
    Banca
    • Flábio Ribeiro de Araújo
    • Luciana Montera Cheung
    • Nalvo Franco de Almeida Junior
    • Said Sadique Adi
    Resumo Cepas do complexo Mycobaterium bovis foram analisadas segundo uma estratégia desenvolvida nesse projeto, a qual analisa o quanto características biológicas, como por exemplo, transferência horizontal de genes, regiões de alta frequência CG e regiões variáveis ou repetitivas, influenciam no resultado de um mapeamento de reads. Este trabalho investiga a existência de regiões que potencialmente representam tais características, chamadas regiões anômalas, e sua influência nos resultados deste mapeamento objetivando estabelecer uma relação entre elas e regiões n˜ao mapeadas. O agente M. bovis analisado ´e o causador da tuberculose em bovinos e outros mamíferos, incluindo os seres humanos e ´e uma doença de relevância econômica no contexto da pecuária, já que afeta diretamente a produtividade dos animais. Os resultados mostraram forte rela¸c˜ao entre regiões não mapeadas, ou pouco mapeadas pelos reads e a potencialidade destas serem regiões anômalas, segundo análise feita por uma ferramenta existente para esta finalidade.
    Download
    O Problema do Particionamento de Similaridade Máxima
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 29/09/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Said Sadique Adi
    Orientando(s)
    • Alex Zanella Zaccaron
    Banca
    • Carlos Henrique Aguena Higa
    • Cleber Valgas Gomes Mira
    • Luciana Montera Cheung
    • Said Sadique Adi
    Resumo Neste trabalho, nós propomos um novo problema de otimização combinatória envolvendo sequências de caracteres chamado Problema do Particionamento de Similaridade Máxima. Apresentamos também uma prova de que esse problema é NP-difícil no sentido forte, o que significaca que não existe um algoritmo polinomial e nem pseudo-polinomial que o resolve, a menos que P = NP. Além disso, desenvolvemos e testamos duas heurísticas baseadas na estratégia gulosa que encontram soluções para o Problema do Particionamento de Similaridade Máxima em tempo polinomial. Este trabalho também traz uma aplicação do problema em questão através da modelagem de um problema
    importante da Biologia Computacional chamado problema da reconstrução e quanticação de transcriptoma, modelagem essa pioneira na abordagem desse problema como um problema de otimização combinatória envolvendo sequências.
    Download
    Implementação de um nó sorvedouro de uma RSSF aplicada à pecuária
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 29/09/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Luciano Gonda
    Orientando(s)
    • André Luiz Diniz da Silva
    Banca
    • Hana Karina Salles Rubinsztejn
    • Irineu Sotoma
    • Luciano Gonda
    • Pedro Paulo Pires
    Resumo O uso de Redes de Sensores Sem Fio (RSSF) para monitoramento de dados ambientais e fisiológicos ´e cada vez mais comum na área de pecuária. Além do ambiente hostil, um dos problemas enfrentados é a transmissão dos dados do campo para servidores localizados em escritórios. Este trabalho trata do desenvolvimento de um nó sorvedouro para a coleta de dados de um sistema de monitoramento para pecuária. Estes dados serão coletados por meio dos nós sensores e enviados para o nó sorvedouro, e então ser˜ao transmitidos para um servidor de dados. Estes dados ficarão disponíveis para utilização em estudos de comportamento animal e influência do ambiente na vida animal. Este projeto foi desenvolvido utilizando o protocolo ZigBee e micro-computadores de baixo consumo como o Raspberry Pi.

    Download
    Um Arcabouço Computacional de Apoio à Criação de Linhas de Processos de Negócio
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 08/06/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Maria Istela Cagnin Machado
    Orientando(s)
    • Marcelo Figueiredo Terenciani
    Banca
    • Debora Maria Barroso Paiva
    • Maria Istela Cagnin Machado
    • Rosana Terezinha Vaccare Braga
    • Valter Vieira de Camargo
    Resumo A competividade faz com que as organizações busquem alternativas para evoluir o seu negócio, como é o caso do Business Process Management (BPM). Para isso, é necessário inicialmente modelar os processos de negócio da organização, porém essa atividade é onerosa. Para resolver esse problema, técnicas de reutilização como Linhas de Processos de Negócio (LPN), originadas a partir de conceitos de Linha de Produto de Software (LPS), têm
    sido utilizadas para viabilizar o reúso eficiente de modelos de processos de negócios. Como observado em LPS, o uso de ferramentas computacionais também é importante no contexto de LPN, para facilitar a criação, instanciação e evolução de LPNs, devido principalmente à complexidade e ao dinamismo dos negócios. Sob a perspectiva de criação de LPN, que é de interesse deste trabalho, é importante o apoio computacional na elaboração dos modelos de processos de negócio; na criação do modelo de variabilidades; na confecção do template de modelo de processos de negócio (TMPN); bem como na obtenção do mapeamento entre o modelo de variabilidades e o TMPN. Neste sentido, foi selecionado um conjunto de notações adequadas para representar cada artefato que compõe uma LPN, como a notação Business Process Model and Notation (BPMN) e o modelo de features. Como não há consenso de notação para a representação do TMPN, é proposta neste trabalho a notação BPMN*, que é uma extensão da notação BPMN para representar variabilidades em modelos de processos de negócio. Essa notação é avaliada por meio de um estudo empírico no qual observou-se ser mais indicada quando comparada a notação variant-rich BPMN (vrBPMN), pois a notação proposta possibilita a elaboração de TMPN com menos erros, e o tempo de elaboração mantem-se praticamente o mesmo. Além disso, neste trabalho é desenvolvido um plug-in para Eclipse que apoia a criação e a documentação de LPNs de acordo com a abordagem de Gestão de Linha de Processos de Negócio (GLPN), levando em consideração as notações selecionadas. O BPL-Framework é avaliado com base em requisitos de avaliação, definidos a partir das subcaracterísticas acurácia, facilidade de aprendizado, facilidade de uso, atratividade, portabilidade, adaptabilidade e instalabilidade da norma ISO/IEC 25010. Os resultados da avaliação indicam que o BPL-Framework atende aos requisitos avaliados e fornece os artefatos da LPNs com a acurácia desejada.
    Download
    Identificação de Espécies de Peixe Utilizando Histogramas de Palavras Visuais em Imagens Coloridas
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 26/03/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Hemerson Pistori
    Orientando(s)
    • Uéliton de Paula Freitas
    Banca
    • Edson Takashi Matsubara
    • Hemerson Pistori
    • José Sabino
    • Wesley Nunes Goncalves
    Resumo Neste trabalho é apresentada uma aplicação voltada para dispositivos móveis cujo objetivo é classificar espécies de peixes por meio de técnicas de Visão Computacional e Inteligência Artificial utilizando imagens. A aplicação foi desenvolvida para smartphones Android e conta com o auxílio da biblioteca de Visão Computacional OpenCV tanto na fase de classificação quanto de treinamento. As técnicas empregadas na descrição das imagens são baseadas em Histogramas de Palavras Visuais aplicados em imagens coloridas. São elas: Histograma de Palavras Visuais (Bag of Visual Words - BoVW), Histograma de Atributos e Cores (Bag of Features and Colors), Histograma de Cores de Wengert (Bag of Colors - BoC), Histograma de Palavras Coloridas (Bag of Colored Words - BoCW) e Histogramas de Cores nos espaços de cores RGB e HSV. Para a classificação das espécies, foram utilizados três tipos de classificadores: Máquina de Vetores de Suporte (Support Vector Machine - SVM), Árvore de Decisão e os K vizinhos mais próximos (K-NN). Nos experimentos foram variados os parâmetros de todos os classificadores a fim de encontrar os melhores resultados para a classificação. Para comparar o desempenho das técnicas de extração de atributos, assim como dos classificadores, foi utilizada a métrica Medida-F
    (F-Score) como métrica principal e Área Sobre a Curva (AUC) como métrica auxiliar. A técnica com melhor resultado foi a BoC, baseada somente em informações de cores, obteve Medida-F igual a 0:9 e AUC 0:98 utilizando o classificador SVM.
    Download
    Identificação de Viabilidade de Leveduras utilizando Histogramas de Palavras Visuais em Imagens Coloridas
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 11/02/2015
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Hemerson Pistori
    Orientando(s)
    • Junior Silva Souza
    Banca
    • Hemerson Pistori
    • Marney Pascoli Cereda
    • Valguima Victoria Viana Aguiar Odakura
    • Wesley Nunes Goncalves
    Resumo Neste trabalho é apresentado um sistema para automatizar o processo de identificação de leveduras viáveis que são importantes na produção do etanol. A produção do etanol depende das leveduras viáveis, responsáveis pelo
    processo de fermentação do caldo da cana. Esta fermentação transforma o caldo da cana em etanol e gás carbônico. Portanto, manter um controle da população das leveduras viáveis é uma tarefa crucial no processo de produção do etanol, e para isto, são feitas análises para identificar e contar as leveduras. Apesar da importância dessa etapa, a identificação e contagem é feita por visão humana em um microscópio, sendo uma tarefa repetitiva e suscetível a erros.
    Neste trabalho, técnicas de visão computacional e aprendizagem supervisionada foram avaliadas para automatizar a identificação destas leveduras. A principal técnica de visão computacional estudada foi o histograma de palavras visuais (Bag-of-Visual-Words), que é aplicado em imagens em tons de cinza. Além desta técnica utilizamos variantes que adicionam a informação de cor, como: CCV (Color Coherence Vectors), CM (Color Moments), BoC (Bagof-Color) e o OpC (Opponent Color). Os atributos extraídos através destes algoritmos e suas variantes, foram utilizados para o teste e treinamento dos classificadores obtidos de técnicas de aprendizagem supervisionada. Entre as técnicas, utilizamos o Naive Bayes, KNN, J48 e SVM que estão disponíveis no ambiente Weka. A avaliação de desempenho, por meio da porcentagem de classificação correta, foi realizada através dos testes de hipótese ANOVA e Friedman.
    Foi utilizado o banco de imagens do projeto BioViC1 que foi proposto para a identificação de leveduras. Este banco possui um conjunto de imagens de leveduras capturadas em laboratório através de microscópio. A câmera de Neubauer foi utilizada para auxiliar a contagem das leveduras, de modo que, 6 repetições com 4 quadrantes nas concentrações de Brix 3, 6 e 12 foram 1http://biovic.weebly.com/bancos-de-imagens.htmlix definidas para análise. As imagens obtidas com Brix 03 foram recortadas separando as imagens das leveduras viáveis, inviáveis e também o fundo que corresponde toda região que não possui leveduras viáveis ou inviáveis. O total de imagens obtidas e separadas em três classes (viável, inviável e fundo da imagem) foram 2614, utilizadas para o treinamento e identificação.
    Os resultados foram analisados através do software R, que na análise de variância ANOVA apresentou um valor-p igual a 2e􀀀16 indicando uma diferença significativa entre as técnicas utilizadas, descartando a hipótese nula. A técnica OpC com o classificador SMO apresentou o maior desempenho, em torno de 95% em relação a outras técnicas analisadas. Na validação do software BioViC a técnica detecção de contornos em conjunto com a técnica SMOOpC apresentaram uma contagem de leveduras que não diferenciou da contagem manual realizada por um especialista.
    Download
    Uma abordagem colaborativa bioinspirada para localização e mapeamento simultâneos de agentes móveis utilizando visão monocular.
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 19/12/2014
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Renato Porfirio Ishii
    Orientando(s)
    • Evandro Luís Souza Falleiros
    Banca
    • Edson Takashi Matsubara
    • Paulo Aristarco Pagliosa
    • Renato Porfirio Ishii
    • Rodrigo Calvo
    Resumo Aplicações com múltiplos robôs vem sendo discutidas exaustivamente nos últimos anos e são consideradas problemas fundamentais na robótica móvel. Entretanto, o desenvolvimento de aplicações em tempo-real com múltiplos robôs é geralmente uma tarefa difícil, uma vez que existe a necessidade de se construir um ambiente robusto que suporta tal cenário de implementação. Esta dissertação propõe um sistema bio-inspirado, denominado PheroSLAM, que adota uma versão estendida da abordagem Colônia de Formigas para coordenar múltiplos robôs em tarefas de exploração e vigilância de ambientes. No PheroSLAM, cada robô deposita feromônio artificial repulsivo ao seu redor, criando uma trilha repulsiva. Essa trilha deve ser evitada pelos demais robôs, uma vez que denotam áreas que foram recentemente visitadas. Um algoritmo SLAM baseado em visão, denominado MonoSLAM, também é utilizado para prover informações de odometria visual para múltiplos robôs. O MonoSLAM constrói mapas tridimensionais baseados em features, considerando que cada robô deve ser capaz de se localizar no ambiente explorado. O sistema proposto é uma contribuição relevante considerando aplicações para múltiplos robôs, como a construção de mapas ou a exploração e vigilância de ambientes. Evidências empíricas mostraram que o PheroSLAM apresenta boa dispersibilidade, o que promove o aumento da cobertura de ambientes. Os resultados experimentais mostraram que a estratégia de coordenação é eficiente e satisfatória para o cumprimento de tarefas de exploração e vigilância.
    Download
    Algoritmos Genéticos e o Problema da Montagem de Reads
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 05/11/2014
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Luciana Montera Cheung
    Orientando(s)
    • Joelmo Silva Fraga
    Banca
    • Francisco Eloi Soares de Araujo
    • Luciana Montera Cheung
    • Said Sadique Adi
    Resumo O problema de montagem de reads é um problema da Bioinformática considerado de grande complexidade devido à sua característica combinatória e ao fato de ser um problema dependente das tecnologias de sequenciamento. Reads são fragmentos de DNA e o processo de montagem consiste, idealmente, na obtenção de uma única sequência de DNA a partir deste conjunto de fragmentos. São encontradas na literatura diferentes abordagens para a
    realização da montagem. Dentre elas destacam-se aquelas baseadas em grafos de sobreposição e de Bruijn e as estratégias gulosas. Heurísticas estão sendo exploradas, tais como Simulated annealing (arrefecimento simulado), Scartter search (busca tabu) e Algoritmo Genético (GA). Este trabalho apresenta um modelo e uma implementação para o problema de montagem de reads através de um algoritmo genético. Os resultados mostram que este modelo é capaz de realizar a montagem e demonstram como o modelo se comporta mediantes os parâmetros estabelecido para sua execução.
    Download
    Uma 3-aproximação e uma Formulação de PLI para o Problema do Alinhamento Spliced Múltiplo
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 30/10/2014
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Said Sadique Adi
    Orientando(s)
    • Regina Beretta Mazaro
    Banca
    • Edna Ayako Hoshino
    • Luiz Carlos da Silva Rozante
    • Said Sadique Adi
    Resumo Com os avanços recentes em áreas específicas da Ciência da Computação como a Biologia Computacional, vários problemas novos envolvendo sequências vêm surgindo, enquanto que problemas tradicionais tornam-se mais difíceis dada a expressiva quantidade de dados gerada nos últimos anos. O interesse aqui é no estudo de um problema específico que envolve sequências denominado Problema do Alinhamento Spliced Múltiplo, estendendo um trabalho anteriormente realizado por Kishi e Adi em cima desse mesmo problema. Enquanto que nesse estudo prévio mostrou-se que o Problema do Alinhamento Spliced Múltiplo é NP-completo e foram propostas heurísticas para o problema, o presente trabalho visa sugerir um algoritmo de aproximação e uma formulação de programação linear inteira para ele, possibilitando confrontar essas novas abordagens com as heurísticas já desenvolvidas para o Problema do Alinhamento Spliced Múltiplo. Para isso, foram executados testes com instâncias artificiais e reais, sendo essas ´ultimas instâncias de um problema tradicional da Bioinformática denominado Problema da Identificaçãao de Genes.
    Download
    Comparação Sequência-Família em GPU
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 24/10/2014
    Área CIÊNCIA DA COMPUTAÇÃO
    Orientador(es)
    • Nahri Balesdent Moreano
    Orientando(s)
    • Alcides Carneiro de Araújo Neto
    Banca
    • Marco Aurelio Stefanes
    • Nahri Balesdent Moreano
    • Wellington Santos Martins
    Resumo Durante as últimas décadas o volume de informações biológicas em algumas bases
    de dados cresceu em um ritmo quase exponencial. Ferramentas como o HMMER
    podem encontrar sequências biológicas homólogas a uma família de sequências
    modelada estatisticamente por um profile HMM utilizando o algoritmo de Viterbi.
    Dada a complexidade quadrática desse algoritmo, esse procedimento pode consumir
    longos tempos de execução dependendo da quantidade de sequências, do tamanho
    do profile HMM e do hardware utilizado. Esse trabalho descreve o desenvolvimento
    de uma solução em GPU, de alto desempenho, para o problema de determinar se
    uma nova sequência biológica é homóloga a uma família de sequências conhecida. A
    solução implementada alcançou desempenho compatível ou superior ao HMMER.
    Download
    Página 5 de 11 (20 de 204 registros).