Inferência de redes de regulação gênica a partir de dados de expressão gênica e conhecimento biológico a priori |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
23/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Carlos Henrique Aguena Higa
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Leonardo Rippel Salgado
- Renato Porfirio Ishii
- Said Sadique Adi
|
Resumo |
Neste trabalho, nós estudamos um problema comum na Biologia Sistêmica, o qual é a inferência ou engenharia reversa da rede de regulação gênica a partir de dados de expressão gênica. Nós endereçamos este problema usando o formalismo Booleano, onde a expressão de um gene é representado apenas por dois possíveis valores: 0 (não expressado) ou 1 (expressado). Além disso, nossa metodologia é baseada na abordagem de seleção de característica e utilizamos um algoritmo chamado IFFS - improved forward floating selection. Realizamos experimentos para comparar 2 medidas de interação gênica usada na função critério do algoritmo, o coeficiente de determinação e a informação mútua computada através da entropia de Shannon e de Tsallis. Também incorporamos uma fonte de conhecimento biológico a priori das interações dos genes a partir de um banco de
dados chamado STRING. Para validar a metodologia, utilizamos dados das competições DREAM e um conjunto de dados de um estudo do ciclo-celular da levedura. Os resultados mostraram que, geralmente, a informação mútua desempenha um resultado levemente melhor do que o coeficiente de determinação, e que incorporando o conhecimento biológico melhora os resultados. Todo esse conjunto de algoritmos estão implementados na linguagem R e futuram estarão completamente disponível como o pacote Measures_GRN do R em https://github.com/camila-koike/Measure_GRN. |
Download |
|
|
Seleção de Instâncias Baseado em Aprendizado de Métricas para K Vizinhos Mais Próximos |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
22/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Eduardo Zárate Guerreiro Max
|
Banca |
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
|
Resumo |
A seleção de instâncias, em aprendizado de máquina, procura identificar instâncias relevantes e remover as instâncias que são redundantes ou prejudiciais do conjunto original. Classificadores baseados em instâncias, como o K Vizinhos Mais Próximos (k-NN), são fortemente beneficiados com esta seleção, podendo prover uma classificação mais rápida, uma diminuição nos requisitos de armazenamento e uma diminuição na sensibilidade ao ruído. Um fundamento essencial a esses algoritmos são as métricas de distância entre os exemplos. Nesse trabalho de mestrado, é proposto um algoritmo de seleção de instâncias com aprendizado de métricas denominado Seleção de Instância sobre Aprendizado de Métrica (Instance Selection on Metric Learning, ISML) para o Classificador K Vizinhos Mais Próximos. O método de aprendizado de métricas, chamado de k-Neighborhood Components Analysis (kNCA), é aplicado ao conjunto de dados para melhorar a seleção e reduzir a relação de compromisso (trade-off ) entre número de instâncias de treino e acurácia. Foram realizados experimentos para comparar métodos tradicionais da literatura de seleção de instâncias. Os resultados são promissores principalmente em cenários de redução extrema de exemplos, redução maior que 50% dos dados originais, onde a proposta ISML obtém melhor ROC AUC em 11 dos 12 conjunto de dados quando comparado com outros três métodos de seleção de instância.
|
Download |
|
|
Histograma de Palavras Visuais para Caracterização de Texturas e Cenas Dinâmicas |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
17/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Wesley Eiji Sanches Kanashiro
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Wesley Nunes Goncalves
|
Resumo |
A caracterização de vídeos vem sendo pesquisada cada vez mais na área de visão computacional por ser um tema desafiador. Caracterizar vídeos não é uma tarefa trivial, pois é preciso levar em consideração tanto a informação espacial (aparência), quanto a informação temporal (movimento). As texturas dinâmicas são um caso particular de vídeos, que podem ser definidas como movimentos de padrões que apresentam propriedades estacionárias ao longo do espaço e tempo. Exemplos de textura dinâmica podem ser encontrados em situações do dia-a-dia como por exemplo, em sequências de imagens de ondas do mar, fumaça, fogo, escada rolante, entre outras. Outro caso particular de vídeos são as cenas dinâmicas, que são composições de uma ou mais texturas dinâmicas, mas com um local ou cenário caracterizando-as. Este trabalho tem por objetivo estender o Histograma de Palavras Visuais (BoVW) para caracterização de texturas e cenas dinâmicas. O BoVW é aplicado em três planos ortogonais do vídeo para que sejam obtidas informações espaciais e de movimento, melhorando assim, a caracterização de vídeos. Para avaliar a proposta deste trabalho, experimentos foram realizados em duas bases de vídeos: tráfego de carros e cenas dinâmicas. Os resultados foram comparados com os obtidos por métodos da literatura e em ambas as bases de vídeos, o método proposto apresentou resultados promissores. Na base de cenas dinâmicas, pode-se concluir que a inclusão da informação de movimento para caracterização dos vídeos aumentou consideravelmente a taxa de classificação correta. Enquanto que na base de tráfego de carros, a informação temporal não influenciou de forma tão considerável a taxa de classificação correta, apesar de contribuir de certa forma na caracterização dos vídeos.
|
Download |
|
|
Classificação de Séries Temporais baseada em Análise de Recorrência e Extração de Características |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
03/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Eraldo Luis Rezende Fernandes
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Rodrigo Fernandes de Mello
|
Resumo |
A identificação de padrões em fluxos de dados contínuos tem despertado o interesse científico, seja na detecção de falhas em sistemas, identificação de operações fraudulentas em transações bancárias, propagação de doenças ou ainda na preservação do meio ambiente. A categorização destes dados, concomitante com a ampliação do sensoriamento e monitoramento de diversos outros domínios, motiva a busca por soluções práticas e eficientes que auxiliem na busca por padrões recorrentes. A extração de conhecimento dos dados, quando dependentes do tempo, exige um tratamento especial e a mineração dos dados apresenta-se como uma atividade valiosa. Neste trabalho, é proposta uma abordagem chamada DSP-Class para classificação de séries temporais utilizando Descritores de Textura aplicados em Gráficos de Recorrência (RP). São utilizados 14 conjuntos de dados reais relacionados a vocalizações de aves, identificação de insetos, categorização de reações químicas, dentre outros. O objetivo desta pesquisa é verificar a utilização das características texturais de RPs em algoritmos de aprendizagem, tais como Support Vector Machine (SVM) e C5:0, aplicando a Decomposição de Modo Empírico (EMD) na classificação de séries temporais. Também é analisada a influência estocástica-determinística presentes nos fluxos. Verifica-se desempenho ruim do algoritmo 1NN, considerado estado-da-arte, em séries predominantemente estocásticas ou determinísticas e desempenho 67:66% superior da abordagem DSP-Class, uma vez que as características texturais distinguem classes de séries temporais mais satisfatoriamente que a busca por similaridade utilizada no algoritmo 1NN nos dados analisados. Verifica-se inclusive, resultados 18;67% superiores àqueles obtidos por pesquisas semelhantes que utilizam outras características presentes em séries temporais. |
Download |
|
|
Problema das pseudo-arborescências capacitadas com a localização de facilidades |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
22/07/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Fabio Henrique Noboru Abe
|
Banca |
- Anderson Vicoso de Araujo
- Cid Carvalho de Souza
- Edna Ayako Hoshino
- Fabio Henrique Viduani Martinez
|
Resumo |
Neste trabalho apresentamos o problema das pseudo-arborescências capacitadas com localização de facilidades, um problema novo e relacionado a dois outros problemas clássicos: o problema do roteamento de veículos
capacitado e o problema da localização de facilidade capacitada. O problema estudado é uma generalização do problema da pseudo-arborescência capacitada, em inglês capacitated ring tree problem. Propomos neste estudo duas formulações em programação linear inteira para modelar o problema. A primeira é uma formulação estendida baseada em partição de conjuntos e a segunda é uma formulação compacta baseada em fluxos. Propomos também dois algoritmos exatos para resolver o problema. Um deles utiliza a técnica de branch-and-price com a formulação estendida e o outro é um algoritmo do tipo branch-and-bound baseado na formulação compacta. Implementamos também uma heurística primal e uma heurística de pricing com o objetivo de melhorar o desempenho dos métodos exatos. Experimentos computacionais realizados em um grupo de instâncias testes mostram que a formulação estendida fornece limitantes muito mais apertados do que a formulação compacta. Além disso, as heurísticas foramrelevantes para acelerar os métodos de branch-and-price e branch-and-bound, em especial a heurística primal. |
Download |
|
|
FlexRank: Um Rankeador Lexicográfico Rápido |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/06/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
|
Resumo |
O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
|
Download |
|
|
Uma Abordagem para Classificação de Séries Temporais Baseada em Modelo Autorregressivo e Gráfico de Recorrência |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
25/05/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Eraldo Luis Rezende Fernandes
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Ricardo Araújo Rios
|
Resumo |
Atualmente, os estudos sobre o problema da classificação de séries temporais tem se concentrado em elaborar abordagens em dois formatos: baseado em funções de distância entre itens do conjunto de dados, e baseado em um procedimento de dois estágios, onde as séries temporais são transformadas em vetores de características, permitindo o emprego de técnicas de classificação convencionais. Neste contexto, não tem sido notado na literatura
estudos baseados na análise de propriedades intrínsecas do processo gerador da série temporal como, por exemplo, o determinismo. Neste trabalho de mestrado, é proposta uma abordagem para o problema da classificação de séries temporais, projetada em dois estágios e baseada na análise de propriedades intrínsecas de determinismo e de estocasticidade. Primeiramente, cada série temporal é processada pelo modelo autorregressivo (AR) e pelo Gráfico de Recorrências, para modelar as influências estocásticas e determinísticas, presentes nas séries temporais. Posteriormente, são extraídas características, a partir da nova representação, que compõem o novo espaço característico. Para a classificação em si, optou-se pelo SVM em seu formato convencional. Tomou-se como abordagem de referência da literatura, o classificador 1-NN com funções de distâncias Euclidiana, DTW e DTW otimizado por janela de busca. Os experimentos foram executados sobre os conjuntos de dados do repositório UCR. Os resultados finais mostram que o desempenho de classificação é competitivo, ou superior, a melhor configuração 1-NN em 19 de 41 conjuntos de dados. Não obstante, os resultados evidenciam, também, a necessidade de uma investigação mais aprofundada sobre as influências das propriedades intrínsecas, e outras técnicas da área de análise de séries temporais, quando aplicadas na tarefa de classificação.
|
Download |
|
|
Atributos de Ponto de Interesse e Casamento de Modelos para Contagem de Insetos-Praga em Cultura de Soja |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
31/03/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Denilson de Oliveira Guilherme
- Edson Takashi Matsubara
- Hemerson Pistori
- Lucas Castro Torres
- Marco Hiroshi Naka
|
Resumo |
Neste trabalho é apresentado uma aplicação para a contagem de insetos em plantações de soja, o objetivo desta aplicação é ser uma ferramenta para o auxílio de agrônomos e técnicos agrícolas na inspeção de cultivos de soja. A aplicação utiliza imagens aéreas, capturadas por Veículos Aéreos não Tripulados, para a contagem dos insetos, e com esta informação o especialista pode definir se existe infestação de insetos na plantação ou não, decidindo se é necessária a aplicação de inseticidas. Para a identificação e contageßm dos insetos, técnicas de visão computacional baseadas em Pontos de Interesse foram utilizadas, sendo o Speeded Up Robust Feaure (SURF) a técnica utilizada para a detecção e descrição dos Pontos de Interesse das imagens analisadas. Para a classificação dos insetos, técnicas baseadas em casamento de modelos, em específico técnicas que utilizam os pontos de interesse para definir o casamento entre as imagens, foram utilizadas para definir a semelhança entre a imagem teste com as classes analisadas. Com essa informação três métricas foram utilizadas para definir a classe do inseto, a do ponto com distância mínima, a distância média mínima e o número de casamentos. Nos experimentos realizados foram variados os parâmetros do detector e descritor de pontos de interesse a fim de encontrar os melhores resultados para a classificação. O método proposto foi comparado com três classificadores baseados em Máquina de Vetores de Suporte, K vizinhos mais próximos e árvores de decisão. O método proposto obteve uma medida-F de 0.899 sendo estatisticamente melhor do que o classificador baseado em árvores de decisão e semelhante aos baseados em Máquina de Vetores de Suporte e K vizinhos mais próximos. O módulo de contagem foi comparado com a contagem de um especialista que marcou todas as imagens de teste. Através do teste de hipóteses ANOVA (Análise de variância) foi comprovado que a contagem do método proposto e do especialista não são divergentes, com um nível de significância de 5%, evidenciando o potencial da proposta na automação de avaliações de pragas em campo. |
Download |
|
|
Parametrização Cruzada de Modelos Geométricos 3D em Movimento |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
02/10/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Andre Luis Vieira Medalha
|
Banca |
- Afonso Paiva Neto
- Edson Takashi Matsubara
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
|
Resumo |
O objetivo geral deste projeto de mestrado é apresentar uma técnica de parametrização cruzada entre modelos geométricos 3D em movimento. Um modelo geométrico de um objeto em movimento é definido por um conjunto de malhas de triângulos, onde cada malha representa uma pose da superfície do objeto em dado instante de tempo. A técnica proposta toma como entrada dois conjuntos de poses, um conjunto fonte e outro alvo. O primeiro passo desta técnica é a determinação da correspondência inicial de cada pose, ação esta que conta com auxílio de um algoritmo de detecção de pontos característicos e um ambiente de teste interativo. Com esse conjunto de correspondência inicial, torna-se possível realizar a parametrização cruzada entre as diversas poses da fonte e do alvo enquanto os respectivos modelos geométricos se movem, permitindo assim aplicações como morphing dinâmico. |
|
Problema do Fluxo Máximo em Redes Utilizando OpenMP e CUDA |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
02/10/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Fabio Henrique Viduani Martinez
- José Coelho de Pina Junior
- Marco Aurelio Stefanes
|
Resumo |
O problema do fluxo máximo em redes é um problema fundamental de teoria dos grafos, com muitas aplicações importantes. Os algoritmos para o fluxo máximo baseados no método push-relabel são conhecidos por serem mais efi-
cientes assintoticamente e terem menor tempo de execução na prática. Vários algoritmos paralelos foram propostos, mas poucos deles tiveram tempos de execução menores do que a implementação hipr de Goldberg, baseada em push-relabel. O objetivo geral desta dissertação é discutir as soluções sequenciais e paralelas para o problema do fluxo máximo em redes. Uma contribuição relevante é que propomos um novo algoritmo paralelo híbrido OpenMP-CUDA que explora a paralelização das heurísticas rotulação global e rotulação gap, além de utilizar o processamento em CPU e GPU adaptativamente para maximizar a eficiência de execução. Os resultados dos testes realizados mostram que esse algoritmo é até 5 vezes mais rápido do que a implementação hipr.
|
Download |
|
|
Visualização de Projeções Multidimensionais em Dispositivos Móveis |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
01/10/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Afonso Paiva Neto
- Edson Takashi Matsubara
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
|
Resumo |
|
Download |
|
|
Determinação de regiões genômicas específicas para seleção de oligonucleotídeos iniciadores usando famílias de proteínas e sequências características |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
30/09/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Nalvo Franco de Almeida Junior
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Flábio Ribeiro de Araújo
- Luciana Montera Cheung
- Nalvo Franco de Almeida Junior
- Said Sadique Adi
|
Resumo |
Com o sequenciamento mais frequente de genomas, várias técnicas de comparação têm sido propostas, com inúmeras aplicações. Este trabalho propõe uma técnica
computacional baseada em sequências características e na construção de famílias de proteínas para determinar trechos de um genoma que contenham candidatos a oligonucleotídeos iniciadores específicos desse genoma, quando comparado com outros. Os trechos determinados pela metodologia proposta podem ser usados como entrada para ferramentas que encontram oligonucleotídeos iniciadores específicos. Testes revelaram que a metodologia se mostrou muito efetiva para genomas de espécies diferentes.
|
Download |
|
|
Alinhamento de Várias Sequências Utilizando Arquiteturas Paralelas Híbridas |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
30/09/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Valter de Oliveira Ferlete
|
Banca |
- Luiz Carlos da Silva Rozante
- Marco Aurelio Stefanes
- Nahri Balesdent Moreano
- Renato Porfirio Ishii
|
Resumo |
A comparação de sequências biológicas é uma das principais ferramentas da bioinformática, para auxiliar os biólogos a realizar análise de dados com objetivo de determinar a função ou estrutura das sequências biológicas e inferir informações sobre sua evolução em organismos que estejam em estudo. A resolução deste problema, contudo, envolve grandes dificuldades computacionais e biológicas, levando ao surgimento de diversas aproximações e heurísticas para sua resolução. O objetivo deste trabalho é escrever um algoritmo paralelo em CUDA e MPI, para realizar o alinhamento global de várias sequências biológicas, especificamente de DNA e proteínas, utilizando heurísticas que possam fornecer uma certa qualidade em um tempo razoável. Foi realizado um comparativo dos resultados obtidos, com os dados que as melhores ferramentas da atualidade apresentam. |
Download |
|
|
Influência de Regiões Anômalas em Genomas de Referência Utilizados para Montagem Guiada |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/09/2015 |
Área |
TEORIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Flábio Ribeiro de Araújo
- Luciana Montera Cheung
- Nalvo Franco de Almeida Junior
- Said Sadique Adi
|
Resumo |
Cepas do complexo Mycobaterium bovis foram analisadas segundo uma estratégia desenvolvida nesse projeto, a qual analisa o quanto características biológicas, como por exemplo, transferência horizontal de genes, regiões de alta frequência CG e regiões variáveis ou repetitivas, influenciam no resultado de um mapeamento de reads. Este trabalho investiga a existência de regiões que potencialmente representam tais características, chamadas regiões anômalas, e sua influência nos resultados deste mapeamento objetivando estabelecer uma relação entre elas e regiões n˜ao mapeadas. O agente M. bovis analisado ´e o causador da tuberculose em bovinos e outros mamíferos, incluindo os seres humanos e ´e uma doença de relevância econômica no contexto da pecuária, já que afeta diretamente a produtividade dos animais. Os resultados mostraram forte rela¸c˜ao entre regiões não mapeadas, ou pouco mapeadas pelos reads e a potencialidade destas serem regiões anômalas, segundo análise feita por uma ferramenta existente para esta finalidade. |
Download |
|
|
O Problema do Particionamento de Similaridade Máxima |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/09/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Cleber Valgas Gomes Mira
- Luciana Montera Cheung
- Said Sadique Adi
|
Resumo |
Neste trabalho, nós propomos um novo problema de otimização combinatória envolvendo sequências de caracteres chamado Problema do Particionamento de Similaridade Máxima. Apresentamos também uma prova de que esse problema é NP-difícil no sentido forte, o que significaca que não existe um algoritmo polinomial e nem pseudo-polinomial que o resolve, a menos que P = NP. Além disso, desenvolvemos e testamos duas heurísticas baseadas na estratégia gulosa que encontram soluções para o Problema do Particionamento de Similaridade Máxima em tempo polinomial. Este trabalho também traz uma aplicação do problema em questão através da modelagem de um problema
importante da Biologia Computacional chamado problema da reconstrução e quanticação de transcriptoma, modelagem essa pioneira na abordagem desse problema como um problema de otimização combinatória envolvendo sequências. |
Download |
|
|
Implementação de um nó sorvedouro de uma RSSF aplicada à pecuária |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/09/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- André Luiz Diniz da Silva
|
Banca |
- Hana Karina Salles Rubinsztejn
- Irineu Sotoma
- Luciano Gonda
- Pedro Paulo Pires
|
Resumo |
O uso de Redes de Sensores Sem Fio (RSSF) para monitoramento de dados ambientais e fisiológicos ´e cada vez mais comum na área de pecuária. Além do ambiente hostil, um dos problemas enfrentados é a transmissão dos dados do campo para servidores localizados em escritórios. Este trabalho trata do desenvolvimento de um nó sorvedouro para a coleta de dados de um sistema de monitoramento para pecuária. Estes dados serão coletados por meio dos nós sensores e enviados para o nó sorvedouro, e então ser˜ao transmitidos para um servidor de dados. Estes dados ficarão disponíveis para utilização em estudos de comportamento animal e influência do ambiente na vida animal. Este projeto foi desenvolvido utilizando o protocolo ZigBee e micro-computadores de baixo consumo como o Raspberry Pi.
|
Download |
|
|
Um Arcabouço Computacional de Apoio à Criação de Linhas de Processos de Negócio |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
08/06/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Maria Istela Cagnin Machado
|
Coorientador(es) |
|
Orientando(s) |
- Marcelo Figueiredo Terenciani
|
Banca |
- Debora Maria Barroso Paiva
- Maria Istela Cagnin Machado
- Rosana Terezinha Vaccare Braga
- Valter Vieira de Camargo
|
Resumo |
A competividade faz com que as organizações busquem alternativas para evoluir o seu negócio, como é o caso do Business Process Management (BPM). Para isso, é necessário inicialmente modelar os processos de negócio da organização, porém essa atividade é onerosa. Para resolver esse problema, técnicas de reutilização como Linhas de Processos de Negócio (LPN), originadas a partir de conceitos de Linha de Produto de Software (LPS), têm
sido utilizadas para viabilizar o reúso eficiente de modelos de processos de negócios. Como observado em LPS, o uso de ferramentas computacionais também é importante no contexto de LPN, para facilitar a criação, instanciação e evolução de LPNs, devido principalmente à complexidade e ao dinamismo dos negócios. Sob a perspectiva de criação de LPN, que é de interesse deste trabalho, é importante o apoio computacional na elaboração dos modelos de processos de negócio; na criação do modelo de variabilidades; na confecção do template de modelo de processos de negócio (TMPN); bem como na obtenção do mapeamento entre o modelo de variabilidades e o TMPN. Neste sentido, foi selecionado um conjunto de notações adequadas para representar cada artefato que compõe uma LPN, como a notação Business Process Model and Notation (BPMN) e o modelo de features. Como não há consenso de notação para a representação do TMPN, é proposta neste trabalho a notação BPMN*, que é uma extensão da notação BPMN para representar variabilidades em modelos de processos de negócio. Essa notação é avaliada por meio de um estudo empírico no qual observou-se ser mais indicada quando comparada a notação variant-rich BPMN (vrBPMN), pois a notação proposta possibilita a elaboração de TMPN com menos erros, e o tempo de elaboração mantem-se praticamente o mesmo. Além disso, neste trabalho é desenvolvido um plug-in para Eclipse que apoia a criação e a documentação de LPNs de acordo com a abordagem de Gestão de Linha de Processos de Negócio (GLPN), levando em consideração as notações selecionadas. O BPL-Framework é avaliado com base em requisitos de avaliação, definidos a partir das subcaracterísticas acurácia, facilidade de aprendizado, facilidade de uso, atratividade, portabilidade, adaptabilidade e instalabilidade da norma ISO/IEC 25010. Os resultados da avaliação indicam que o BPL-Framework atende aos requisitos avaliados e fornece os artefatos da LPNs com a acurácia desejada. |
Download |
|
|
Identificação de Espécies de Peixe Utilizando Histogramas de Palavras Visuais em Imagens Coloridas |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
26/03/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Edson Takashi Matsubara
- Hemerson Pistori
- José Sabino
- Wesley Nunes Goncalves
|
Resumo |
Neste trabalho é apresentada uma aplicação voltada para dispositivos móveis cujo objetivo é classificar espécies de peixes por meio de técnicas de Visão Computacional e Inteligência Artificial utilizando imagens. A aplicação foi desenvolvida para smartphones Android e conta com o auxílio da biblioteca de Visão Computacional OpenCV tanto na fase de classificação quanto de treinamento. As técnicas empregadas na descrição das imagens são baseadas em Histogramas de Palavras Visuais aplicados em imagens coloridas. São elas: Histograma de Palavras Visuais (Bag of Visual Words - BoVW), Histograma de Atributos e Cores (Bag of Features and Colors), Histograma de Cores de Wengert (Bag of Colors - BoC), Histograma de Palavras Coloridas (Bag of Colored Words - BoCW) e Histogramas de Cores nos espaços de cores RGB e HSV. Para a classificação das espécies, foram utilizados três tipos de classificadores: Máquina de Vetores de Suporte (Support Vector Machine - SVM), Árvore de Decisão e os K vizinhos mais próximos (K-NN). Nos experimentos foram variados os parâmetros de todos os classificadores a fim de encontrar os melhores resultados para a classificação. Para comparar o desempenho das técnicas de extração de atributos, assim como dos classificadores, foi utilizada a métrica Medida-F
(F-Score) como métrica principal e Área Sobre a Curva (AUC) como métrica auxiliar. A técnica com melhor resultado foi a BoC, baseada somente em informações de cores, obteve Medida-F igual a 0:9 e AUC 0:98 utilizando o classificador SVM. |
Download |
|
|
Identificação de Viabilidade de Leveduras utilizando Histogramas de Palavras Visuais em Imagens Coloridas |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
11/02/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Hemerson Pistori
- Marney Pascoli Cereda
- Valguima Victoria Viana Aguiar Odakura
- Wesley Nunes Goncalves
|
Resumo |
Neste trabalho é apresentado um sistema para automatizar o processo de identificação de leveduras viáveis que são importantes na produção do etanol. A produção do etanol depende das leveduras viáveis, responsáveis pelo
processo de fermentação do caldo da cana. Esta fermentação transforma o caldo da cana em etanol e gás carbônico. Portanto, manter um controle da população das leveduras viáveis é uma tarefa crucial no processo de produção do etanol, e para isto, são feitas análises para identificar e contar as leveduras. Apesar da importância dessa etapa, a identificação e contagem é feita por visão humana em um microscópio, sendo uma tarefa repetitiva e suscetível a erros.
Neste trabalho, técnicas de visão computacional e aprendizagem supervisionada foram avaliadas para automatizar a identificação destas leveduras. A principal técnica de visão computacional estudada foi o histograma de palavras visuais (Bag-of-Visual-Words), que é aplicado em imagens em tons de cinza. Além desta técnica utilizamos variantes que adicionam a informação de cor, como: CCV (Color Coherence Vectors), CM (Color Moments), BoC (Bagof-Color) e o OpC (Opponent Color). Os atributos extraídos através destes algoritmos e suas variantes, foram utilizados para o teste e treinamento dos classificadores obtidos de técnicas de aprendizagem supervisionada. Entre as técnicas, utilizamos o Naive Bayes, KNN, J48 e SVM que estão disponíveis no ambiente Weka. A avaliação de desempenho, por meio da porcentagem de classificação correta, foi realizada através dos testes de hipótese ANOVA e Friedman.
Foi utilizado o banco de imagens do projeto BioViC1 que foi proposto para a identificação de leveduras. Este banco possui um conjunto de imagens de leveduras capturadas em laboratório através de microscópio. A câmera de Neubauer foi utilizada para auxiliar a contagem das leveduras, de modo que, 6 repetições com 4 quadrantes nas concentrações de Brix 3, 6 e 12 foram 1http://biovic.weebly.com/bancos-de-imagens.htmlix definidas para análise. As imagens obtidas com Brix 03 foram recortadas separando as imagens das leveduras viáveis, inviáveis e também o fundo que corresponde toda região que não possui leveduras viáveis ou inviáveis. O total de imagens obtidas e separadas em três classes (viável, inviável e fundo da imagem) foram 2614, utilizadas para o treinamento e identificação.
Os resultados foram analisados através do software R, que na análise de variância ANOVA apresentou um valor-p igual a 2e16 indicando uma diferença significativa entre as técnicas utilizadas, descartando a hipótese nula. A técnica OpC com o classificador SMO apresentou o maior desempenho, em torno de 95% em relação a outras técnicas analisadas. Na validação do software BioViC a técnica detecção de contornos em conjunto com a técnica SMOOpC apresentaram uma contagem de leveduras que não diferenciou da contagem manual realizada por um especialista.
|
Download |
|
|
Uma abordagem colaborativa bioinspirada para localização e mapeamento simultâneos de agentes móveis utilizando visão monocular. |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
19/12/2014 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Evandro Luís Souza Falleiros
|
Banca |
- Edson Takashi Matsubara
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Rodrigo Calvo
|
Resumo |
Aplicações com múltiplos robôs vem sendo discutidas exaustivamente nos últimos anos e são consideradas problemas fundamentais na robótica móvel. Entretanto, o desenvolvimento de aplicações em tempo-real com múltiplos robôs é geralmente uma tarefa difícil, uma vez que existe a necessidade de se construir um ambiente robusto que suporta tal cenário de implementação. Esta dissertação propõe um sistema bio-inspirado, denominado PheroSLAM, que adota uma versão estendida da abordagem Colônia de Formigas para coordenar múltiplos robôs em tarefas de exploração e vigilância de ambientes. No PheroSLAM, cada robô deposita feromônio artificial repulsivo ao seu redor, criando uma trilha repulsiva. Essa trilha deve ser evitada pelos demais robôs, uma vez que denotam áreas que foram recentemente visitadas. Um algoritmo SLAM baseado em visão, denominado MonoSLAM, também é utilizado para prover informações de odometria visual para múltiplos robôs. O MonoSLAM constrói mapas tridimensionais baseados em features, considerando que cada robô deve ser capaz de se localizar no ambiente explorado. O sistema proposto é uma contribuição relevante considerando aplicações para múltiplos robôs, como a construção de mapas ou a exploração e vigilância de ambientes. Evidências empíricas mostraram que o PheroSLAM apresenta boa dispersibilidade, o que promove o aumento da cobertura de ambientes. Os resultados experimentais mostraram que a estratégia de coordenação é eficiente e satisfatória para o cumprimento de tarefas de exploração e vigilância. |
Download |
|
|