Mestrado em Ciência da Computação

Atenção! O edital referente ao processo seletivo e arquivos pertinentes ao curso estão disponíveis no site do curso.
Os resultados dos processos seletivos serão divulgados no site do curso.

Trabalhos

Trabalhos Disponíveis

TRABALHO Ações
Utilização de Técnicas de Integração de Software para Aplicações Web no Contexto de Ferramentas de Acessibilidade
Curso Mestrado em Ciência da Computação
Tipo Dissertação
Data 29/06/2017
Área CIÊNCIA DA COMPUTAÇÃO
Orientador(es)
  • Maria Istela Cagnin Machado
Coorientador(es)
    Orientando(s)
    • Wesley Tessaro Andrade
    Banca
    • Andre Cavalcante Hora
    • Debora Maria Barroso Paiva
    • Maria Istela Cagnin Machado
    • Tiago Guerreiro
    Resumo
    Download
    BovChewing - Ferramenta de segmentação e classificação de comportamento bovino por meio de bioacústica e aprendizado de máquina
    Curso Mestrado em Ciência da Computação
    Tipo Dissertação
    Data 28/04/2017
    Área LÓGICAS E SEMÂNTICA DE PROGRAMAS
    Orientador(es)
    • Claudio Leonardo Lucchesi
    Coorientador(es)
      Orientando(s)
      • Rodrigo Sanches Devigo
      Banca
      • Claudio Leonardo Lucchesi
      • Edson Takashi Matsubara
      • Fabiana Villa Alves
      • Jonathan de Andrade Silva
      • Julio Kuhn da Trindade
      • Marcelo Henriques de Carvalho
      Resumo O uso de métodos da bioacústica para análises comportamentais têm se desenvolvido com intensidade nos últimos anos, por se tratar de métodos não invasivos buscando uma melhora no monitoramento de precisão de rebanhos. Entretanto, a análise desses dados geralmente requer especialistas e muito tempo tornando-se assim uma tarefa geralmente difícil, tendo a necessidade de construir maneiras de automatizar a fase da análise dos dados.
      Existem trabalhos que focam na automatizac~ao da análise dos dados com resultados satisfatórios, mas utilizam de base dados com gravitações feitas em condições controladas e poucos classificam eventos de ruminação. Essa dissertação propõe o BovChewing, uma ferramenta capaz de detectar e classificar eventos ingestivos, baseados em métodos semisupervisionado para a detecção e supervisionado para a classificação, realizando assim a análise dos dados. Experimentos mostraram resultados que a ferramenta é sufi ciente e satisfatória para com a tarefa obtendo uma acurácia de 63% na tarefa de segmentação e 91% na tarefa de classificação. Trabalhos futuros apontam para a melhora do segmentador, integrac~ao com outras ferramentas de análises de comportamentos bovinos e processamento dos dados na nuvem como uma forma de construir um sistema completo.
      Download
      Inferência de Redes de Regulação Gênica usando Computação Paralela Híbrida
      Curso Mestrado em Ciência da Computação
      Tipo Dissertação
      Data 19/04/2017
      Área CIÊNCIA DA COMPUTAÇÃO
      Orientador(es)
      • Marco Aurelio Stefanes
      Coorientador(es)
        Orientando(s)
        • Jean Carlo Wai Keung Ma
        Banca
        • Carlos Henrique Aguena Higa
        • Francisco Eloi Soares de Araujo
        • Luiz Carlos da Silva Rozante
        • Marco Aurelio Stefanes
        Resumo A inferência é o processo de esclarecer as relações formadas entre produtos gênicos/proteínas por meio de um modelo matemático. Conceitualmente este é um problema mal-posto, uma vez que a partir de uma amostra de
        dados de expressão gênica é possível inferir diversas redes consistentes com essa amostra. Dependendo do algoritmo, o processo de inferência pode levar horas e até dias devido ao tamanho da rede e complexidade do algoritmo. O algoritmo sequencial de inferência utilizado neste trabalho baseia-se no paradigma de crescimento da semente e possui dois passos: passo de crescimento da semente e passo de inferência. Neste trabalho, desenvolvemos três versões paralelas desse algoritmo de inferência com as seguintes abordagens: cluster e CPUs, GPU/CUDA e híbrida. Essas versões apresentam custos aceitáveissendo comparadas com o algoritmo sequencial.
        Download
        Redes Neurais Convolucionais Profundas na Detecção de Plantas Daninhas em Cultura de Soja
        Curso Mestrado em Ciência da Computação
        Tipo Dissertação
        Data 16/03/2017
        Área CIÊNCIA DA COMPUTAÇÃO
        Orientador(es)
        • Hemerson Pistori
        Coorientador(es)
          Orientando(s)
          • Alessandro dos Santos Ferreira
          Banca
          • Eraldo Luis Rezende Fernandes
          • Hemerson Pistori
          • Marcelo Theophilo Folhes
          • Marco Hiroshi Naka
          Resumo Ervas daninhas são plantas indesejadas que crescem em culturas agrícolas, como as de soja, competindo por diversos fatores como luz e água e causando prejuízos às lavouras. O objetivo deste trabalho foi utilizar Redes
          Neurais Convolucionais para realizar a detecção de ervas daninhas em imagens de lavouras de soja e classificar essas ervas daninhas entre gramíneas e folhas largas, visando direcionar o herbicida específico ao tipo de erva daninha detectado. Para esse objetivo foi realizada uma plantação de soja em Campo Grande, Mato Grosso do Sul, Brasil e com o uso do drone Phantom DJI 3 Professional foi capturado um grande número de imagens da
          cultura. Com essas fotografias foi construído um banco de imagens contendo mais de quinze mil imagens do solo, soja e ervas daninhas de folhas largas e gramíneas. As Redes Neurais Convolucionais utilizadas representam uma arquitetura de Aprendizado Profundo que vêm alcançando notável destaque no reconhecimento de imagens. Para o treinamento da Rede Neural foi utilizada a arquitetura CaffeNet, disponível no software Caffe, que consiste de uma replicação da conhecida rede AlexNet, que venceu a competição ImageNet LSRVC de 2012. Foi implementado também um software, Pynovisão, que através do uso do segmentador SLIC Superpixel, ajudou na construção de um banco de imagens robusto e na classificação das imagens utilizando o modelo treinado pelo software Caffe. Para comparar os resultados da Rede Neural Convolucional, foram utilizados os algoritmos Máquina de Vetores de Suporte, AdaBoost e Florestas Aleatórias em conjunto com uma coleção de extratores de atributos de forma, cor e textura. Como resultado, utilizando as Redes Neurais Convolucionais, este trabalho obteve precisão acima de 98% na detecção de ervas daninhas de folhas largas e gramíneas em relação ao solo e a soja, com média de precisão entre todas as imagens superior a 99%.
          Download
          Exploração do Espaço de Projetos de Sistemas Multiprocessadores Guiado por Dark Silicon
          Curso Mestrado em Ciência da Computação
          Tipo Dissertação
          Data 03/03/2017
          Área CIÊNCIA DA COMPUTAÇÃO
          Orientador(es)
          • Ricardo Ribeiro dos Santos
          Coorientador(es)
            Orientando(s)
            • Ana Caroline dos Santos Silva
            Banca
            • Edson Takashi Matsubara
            • Liana Dessandre Duenha Garanhani
            • Ricardo Ribeiro dos Santos
            • Sarita Mazzini Bruschi
            Resumo
            Download
            Aprendizado de Representações para Adaptação de Domínio de Etiquetagem Morfossintática
            Curso Mestrado em Ciência da Computação
            Tipo Dissertação
            Data 08/02/2017
            Área CIÊNCIA DA COMPUTAÇÃO
            Orientador(es)
            • Eraldo Luis Rezende Fernandes
            Coorientador(es)
              Orientando(s)
              • Irving Müller Rodrigues
              Banca
              • Bruno Magalhaes Nogueira
              • Eraldo Luis Rezende Fernandes
              • Rafael Geraldeli Rossi
              • Ricardo Marcondes Marcacini
              Resumo
              Download
              Um Arcabouço Computacional de Apoio à Instanciação de Linhas de Processos de Negócios
              Curso Mestrado em Ciência da Computação
              Tipo Dissertação
              Data 08/02/2017
              Área CIÊNCIA DA COMPUTAÇÃO
              Orientador(es)
              • Maria Istela Cagnin Machado
              Coorientador(es)
                Orientando(s)
                • Delacyr Almeida Monteiro Ferreira
                Banca
                • Bruno Barbieri de Pontes Cafeo
                • Debora Maria Barroso Paiva
                • Maria Istela Cagnin Machado
                • Rogéria Cristiane Gratão de Souza
                Resumo A modelagem de processos de negócio possui grande importância no contexto organizacional, pois auxilia a definição de novos processos e o aprimoramento dos existentes para tornar as organizações mais competitivas e eficientes. O uso de técnicas de reúso de software no contexto de processos de negócio é um mecanismo para viabilizar o reúso eficiente de modelos de processos de negócio, como é o caso de Linhas de Processos de Negócio (LPN). O apoio computacional se torna importante no âmbito de LPN pois facilita a construção, instanciação e evolução das linhas, uma vez que os modelos criados são complexos devido às características inerentes ao domínio e ao dinamismo do negócio. Apesar da existência de diversas abordagens de LPN na literatura, há carência de técnicas e ambientes computacionais que apoiem o processo de instanciação de LPNs. O objetivo deste trabalho é aprimorar a abordagem de Gestão de Linhas de Processos de Negócios (GLPN) para tornar a instanciação de LPNs mais eficiente. Esse aprimoramento é alcançado no processo de Engenharia de Domínio do Negócio (EDN) da GLPN possibilitando a criação de um ou mais TMPNs para LPNs com processos de negócio mais complexos, além da substituição do formulário de configuração por um modelo de configuração criado no processo de Engenharia de Processo de Negócio (EPN), facilitando assim a reusabilidade das LPNs. Além disso, o BPL-Framework, ferramenta responsável pela construção de LPNs com base na abordagem GLPN, é evoluído obtendo-se o BPL-Framework 2.0 para contemplar também fases do processo de Engenharia de Processo de Negócio (EPN), responsáveis pela instanciação de LPNs. O BPL-Framework 2.0 é avaliado com base em requisitos de avaliação, definidos a partir da norma ISO/IEC 25000. Os resultados da avaliação indicam que o BPL-Framework 2.0 atende aos requisitos avaliados e propicia a instanciação de LPNs em conformidade com a abordagem GLPN com a acurácia, legibilidade e usabilidade adequadas, contribuindo também para a redução significativa no tempo de instanciação e de erros sintáticos, semânticos e de configuração das instânciasdas LPNs.
                Download
                Solução de problemas em Grafos através da Lógica Monádica de Segunda Ordem e da Decomposição em Árvore
                Curso Mestrado em Ciência da Computação
                Tipo Dissertação
                Data 09/01/2017
                Área TEORIA DA COMPUTAÇÃO
                Orientador(es)
                • Vagner Pedrotti
                Coorientador(es)
                  Orientando(s)
                  • Glasielly Demori Proença
                  Banca
                  • Luciano Gonda
                  • Marcelo Henriques de Carvalho
                  • Sheila Morais de Almeida
                  • Vagner Pedrotti
                  Resumo
                  Download
                  Estimativas de Dark Silicon em Projetos de Sistemas Multicore
                  Curso Mestrado em Ciência da Computação
                  Tipo Dissertação
                  Data 16/09/2016
                  Área CIÊNCIA DA COMPUTAÇÃO
                  Orientador(es)
                  • Ricardo Ribeiro dos Santos
                  Coorientador(es)
                    Orientando(s)
                    • Tony Carlos Bignardi dos Santos
                    Banca
                    • Edson Borin
                    • Fabio Iaione
                    • Liana Dessandre Duenha Garanhani
                    • Ricardo Ribeiro dos Santos
                    Resumo A demanda por computação de alto desempenho continua a crescer de forma significativa. Apesar da indústria entregar aos consumidores sistemas computacionais mais eficientes, limitações físicas e restrições tecnológicas colocam em risco a evolução para as próximas gerações de processadores. O aumento exponencial de dissipação de potência estática devido ao incremento da corrente de fuga em transistores com escala de integração abaixo de 90nm limita a fração de área do circuito que se pode manter ativa no momento da execução O termo dark silicone utilizado para indicar a fração de área do chip que deve ter frequência de clock reduzida para manter restrições térmicas de potência do projeto. Algumas alternativas para contornar a necessidade de subutilizar uma parte da área do chip estão a adoção de hardware especializado e exploração de paralelismo. Essas alternativas possibilitam que uma parte da área do chip seja utilizada para execução de código em frequências menores visando não extrapolar o orçamento de potência. Observa-se assim a necessidade de técnicas e ferramentas para o projeto de sistemas cientes de dark silicon. Este trabalho tem como objetivo identificar e mensurar a área de dark silicon em projetos de sistemas computacionais com tecnologia abaixo de 90nm, utilizando-se de uma metodologia baseada no cálculo da densidade de potência de um projeto base (90nm) e da adoção de um circuito de referência. Experimentos foram realizados considerando projetos de processadores multicore comerciais para estimar o dark silicon presente nesses projetos considerando suas evoluções tecnológicas. Adicionalmente, um experimento de exploração do espaço de projeto foi realizado, com o intuito de validar as estimativas de dark silicon and buscar alternativas para utilização eficiente da área do chip diante das restrições físicas de projeto.
                    Download
                    Uma ferramenta para integração de dados de expressão diferencial e interação funcional
                    Curso Mestrado em Ciência da Computação
                    Tipo Dissertação
                    Data 02/09/2016
                    Área MATEMÁTICA DA COMPUTAÇÃO
                    Orientador(es)
                    • Nalvo Franco de Almeida Junior
                    Coorientador(es)
                      Orientando(s)
                      • Rodolpho Gheleri de Oliveira Lima
                      Banca
                      • Luciana Montera Cheung
                      • Nalvo Franco de Almeida Junior
                      • Said Sadique Adi
                      • Tainá Raiol Alencar
                      Resumo Este trabalho descreve o desenvolvimento de duas ferramentas computacionais: um pipeline para análise de expressão diferencial de genes e outra para a visualização gráfica de resultados de express~ao diferencial, chamada DEPICTViz, que agrega ao resultado da análise de expressão diferencial informacões de interação funcional de proteínas. O pipeline desenvolvido realiza o mapeamento de reads no genoma de referência, a ordenação dos reads mapeados, a construção e união de transcritos e a analise de expressão diferencial. A ferramenta DEPICTViz foi desenvolvida para a visualização de experimentos de expressão diferencial de genes e interação de
                      proteínas. DEPICTViz foi testada com sucesso em vários estudos de caso.
                      Download
                      Inferência de redes de regulação gênica a partir de dados de expressão gênica e conhecimento biológico a priori
                      Curso Mestrado em Ciência da Computação
                      Tipo Dissertação
                      Data 23/08/2016
                      Área CIÊNCIA DA COMPUTAÇÃO
                      Orientador(es)
                      • Carlos Henrique Aguena Higa
                      Coorientador(es)
                        Orientando(s)
                        • Camila Yumi Koike
                        Banca
                        • Carlos Henrique Aguena Higa
                        • Leonardo Rippel Salgado
                        • Renato Porfirio Ishii
                        • Said Sadique Adi
                        Resumo Neste trabalho, nós estudamos um problema comum na Biologia Sistêmica, o qual é a inferência ou engenharia reversa da rede de regulação gênica a partir de dados de expressão gênica. Nós endereçamos este problema usando o formalismo Booleano, onde a expressão de um gene é representado apenas por dois possíveis valores: 0 (não expressado) ou 1 (expressado). Além disso, nossa metodologia é baseada na abordagem de seleção de característica e utilizamos um algoritmo chamado IFFS - improved forward floating selection. Realizamos experimentos para comparar 2 medidas de interação gênica usada na função critério do algoritmo, o coeficiente de determinação e a informação mútua computada através da entropia de Shannon e de Tsallis. Também incorporamos uma fonte de conhecimento biológico a priori das interações dos genes a partir de um banco de
                        dados chamado STRING. Para validar a metodologia, utilizamos dados das competições DREAM e um conjunto de dados de um estudo do ciclo-celular da levedura. Os resultados mostraram que, geralmente, a informação mútua desempenha um resultado levemente melhor do que o coeficiente de determinação, e que incorporando o conhecimento biológico melhora os resultados. Todo esse conjunto de algoritmos estão implementados na linguagem R e futuram estarão completamente disponível como o pacote Measures_GRN do R em https://github.com/camila-koike/Measure_GRN.
                        Download
                        Seleção de Instâncias Baseado em Aprendizado de Métricas para K Vizinhos Mais Próximos
                        Curso Mestrado em Ciência da Computação
                        Tipo Dissertação
                        Data 22/08/2016
                        Área CIÊNCIA DA COMPUTAÇÃO
                        Orientador(es)
                        • Edson Takashi Matsubara
                        Coorientador(es)
                          Orientando(s)
                          • Eduardo Zárate Guerreiro Max
                          Banca
                          • Edson Takashi Matsubara
                          • Eraldo Luis Rezende Fernandes
                          • Rafael Geraldeli Rossi
                          • Ricardo Marcondes Marcacini
                          Resumo A seleção de instâncias, em aprendizado de máquina, procura identificar instâncias relevantes e remover as instâncias que são redundantes ou prejudiciais do conjunto original. Classificadores baseados em instâncias, como o K Vizinhos Mais Próximos (k-NN), são fortemente beneficiados com esta seleção, podendo prover uma classificação mais rápida, uma diminuição nos requisitos de armazenamento e uma diminuição na sensibilidade ao ruído. Um fundamento essencial a esses algoritmos são as métricas de distância entre os exemplos. Nesse trabalho de mestrado, é proposto um algoritmo de seleção de instâncias com aprendizado de métricas denominado Seleção de Instância sobre Aprendizado de Métrica (Instance Selection on Metric Learning, ISML) para o Classificador K Vizinhos Mais Próximos. O método de aprendizado de métricas, chamado de k-Neighborhood Components Analysis (kNCA), é aplicado ao conjunto de dados para melhorar a seleção e reduzir a relação de compromisso (trade-off ) entre número de instâncias de treino e acurácia. Foram realizados experimentos para comparar métodos tradicionais da literatura de seleção de instâncias. Os resultados são promissores principalmente em cenários de redução extrema de exemplos, redução maior que 50% dos dados originais, onde a proposta ISML obtém melhor ROC AUC em 11 dos 12 conjunto de dados quando comparado com outros três métodos de seleção de instância.
                          Download
                          Histograma de Palavras Visuais para Caracterização de Texturas e Cenas Dinâmicas
                          Curso Mestrado em Ciência da Computação
                          Tipo Dissertação
                          Data 17/08/2016
                          Área CIÊNCIA DA COMPUTAÇÃO
                          Orientador(es)
                          • Wesley Nunes Goncalves
                          Coorientador(es)
                            Orientando(s)
                            • Wesley Eiji Sanches Kanashiro
                            Banca
                            • Hemerson Pistori
                            • Jonathan de Andrade Silva
                            • Wesley Nunes Goncalves
                            Resumo A caracterização de vídeos vem sendo pesquisada cada vez mais na área de visão computacional por ser um tema desafiador. Caracterizar vídeos não é uma tarefa trivial, pois é preciso levar em consideração tanto a informação espacial (aparência), quanto a informação temporal (movimento). As texturas dinâmicas são um caso particular de vídeos, que podem ser definidas como movimentos de padrões que apresentam propriedades estacionárias ao longo do espaço e tempo. Exemplos de textura dinâmica podem ser encontrados em situações do dia-a-dia como por exemplo, em sequências de imagens de ondas do mar, fumaça, fogo, escada rolante, entre outras. Outro caso particular de vídeos são as cenas dinâmicas, que são composições de uma ou mais texturas dinâmicas, mas com um local ou cenário caracterizando-as. Este trabalho tem por objetivo estender o Histograma de Palavras Visuais (BoVW) para caracterização de texturas e cenas dinâmicas. O BoVW é aplicado em três planos ortogonais do vídeo para que sejam obtidas informações espaciais e de movimento, melhorando assim, a caracterização de vídeos. Para avaliar a proposta deste trabalho, experimentos foram realizados em duas bases de vídeos: tráfego de carros e cenas dinâmicas. Os resultados foram comparados com os obtidos por métodos da literatura e em ambas as bases de vídeos, o método proposto apresentou resultados promissores. Na base de cenas dinâmicas, pode-se concluir que a inclusão da informação de movimento para caracterização dos vídeos aumentou consideravelmente a taxa de classificação correta. Enquanto que na base de tráfego de carros, a informação temporal não influenciou de forma tão considerável a taxa de classificação correta, apesar de contribuir de certa forma na caracterização dos vídeos.
                            Download
                            Classificação de Séries Temporais baseada em Análise de Recorrência e Extração de Características
                            Curso Mestrado em Ciência da Computação
                            Tipo Dissertação
                            Data 03/08/2016
                            Área CIÊNCIA DA COMPUTAÇÃO
                            Orientador(es)
                            • Renato Porfirio Ishii
                            Coorientador(es)
                              Orientando(s)
                              • Angelo Maggioni e Silva
                              Banca
                              • Eraldo Luis Rezende Fernandes
                              • Paulo Aristarco Pagliosa
                              • Renato Porfirio Ishii
                              • Rodrigo Fernandes de Mello
                              Resumo A identificação de padrões em fluxos de dados contínuos tem despertado o interesse científico, seja na detecção de falhas em sistemas, identificação de operações fraudulentas em transações bancárias, propagação de doenças ou ainda na preservação do meio ambiente. A categorização destes dados, concomitante com a ampliação do sensoriamento e monitoramento de diversos outros domínios, motiva a busca por soluções práticas e eficientes que auxiliem na busca por padrões recorrentes. A extração de conhecimento dos dados, quando dependentes do tempo, exige um tratamento especial e a mineração dos dados apresenta-se como uma atividade valiosa. Neste trabalho, é proposta uma abordagem chamada DSP-Class para classificação de séries temporais utilizando Descritores de Textura aplicados em Gráficos de Recorrência (RP). São utilizados 14 conjuntos de dados reais relacionados a vocalizações de aves, identificação de insetos, categorização de reações químicas, dentre outros. O objetivo desta pesquisa é verificar a utilização das características texturais de RPs em algoritmos de aprendizagem, tais como Support Vector Machine (SVM) e C5:0, aplicando a Decomposição de Modo Empírico (EMD) na classificação de séries temporais. Também é analisada a influência estocástica-determinística presentes nos fluxos. Verifica-se desempenho ruim do algoritmo 1NN, considerado estado-da-arte, em séries predominantemente estocásticas ou determinísticas e desempenho 67:66% superior da abordagem DSP-Class, uma vez que as características texturais distinguem classes de séries temporais mais satisfatoriamente que a busca por similaridade utilizada no algoritmo 1NN nos dados analisados. Verifica-se inclusive, resultados 18;67% superiores àqueles obtidos por pesquisas semelhantes que utilizam outras características presentes em séries temporais.
                              Download
                              Problema das pseudo-arborescências capacitadas com a localização de facilidades
                              Curso Mestrado em Ciência da Computação
                              Tipo Dissertação
                              Data 22/07/2016
                              Área CIÊNCIA DA COMPUTAÇÃO
                              Orientador(es)
                              • Edna Ayako Hoshino
                              Coorientador(es)
                                Orientando(s)
                                • Fabio Henrique Noboru Abe
                                Banca
                                • Anderson Vicoso de Araujo
                                • Cid Carvalho de Souza
                                • Edna Ayako Hoshino
                                • Fabio Henrique Viduani Martinez
                                Resumo Neste trabalho apresentamos o problema das pseudo-arborescências capacitadas com localização de facilidades, um problema novo e relacionado a dois outros problemas clássicos: o problema do roteamento de veículos
                                capacitado e o problema da localização de facilidade capacitada. O problema estudado é uma generalização do problema da pseudo-arborescência capacitada, em inglês capacitated ring tree problem. Propomos neste estudo duas formulações em programação linear inteira para modelar o problema. A primeira é uma formulação estendida baseada em partição de conjuntos e a segunda é uma formulação compacta baseada em fluxos. Propomos também dois algoritmos exatos para resolver o problema. Um deles utiliza a técnica de branch-and-price com a formulação estendida e o outro é um algoritmo do tipo branch-and-bound baseado na formulação compacta. Implementamos também uma heurística primal e uma heurística de pricing com o objetivo de melhorar o desempenho dos métodos exatos. Experimentos computacionais realizados em um grupo de instâncias testes mostram que a formulação estendida fornece limitantes muito mais apertados do que a formulação compacta. Além disso, as heurísticas foramrelevantes para acelerar os métodos de branch-and-price e branch-and-bound, em especial a heurística primal.
                                Download
                                FlexRank: Um Rankeador Lexicográfico Rápido
                                Curso Mestrado em Ciência da Computação
                                Tipo Dissertação
                                Data 29/06/2016
                                Área CIÊNCIA DA COMPUTAÇÃO
                                Orientador(es)
                                • Edson Takashi Matsubara
                                Coorientador(es)
                                  Orientando(s)
                                  • Lucas de Souza Rodrigues
                                  Banca
                                  • Anderson Vicoso de Araujo
                                  • Bruno Magalhaes Nogueira
                                  • Edson Takashi Matsubara
                                  • Eraldo Luis Rezende Fernandes
                                  Resumo O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
                                  Download
                                  Uma Abordagem para Classificação de Séries Temporais Baseada em Modelo Autorregressivo e Gráfico de Recorrência
                                  Curso Mestrado em Ciência da Computação
                                  Tipo Dissertação
                                  Data 25/05/2016
                                  Área CIÊNCIA DA COMPUTAÇÃO
                                  Orientador(es)
                                  • Renato Porfirio Ishii
                                  Coorientador(es)
                                    Orientando(s)
                                    • Hudson Fujikawa de Paula
                                    Banca
                                    • Eraldo Luis Rezende Fernandes
                                    • Paulo Aristarco Pagliosa
                                    • Renato Porfirio Ishii
                                    • Ricardo Araújo Rios
                                    Resumo Atualmente, os estudos sobre o problema da classificação de séries temporais tem se concentrado em elaborar abordagens em dois formatos: baseado em funções de distância entre itens do conjunto de dados, e baseado em um procedimento de dois estágios, onde as séries temporais são transformadas em vetores de características, permitindo o emprego de técnicas de classificação convencionais. Neste contexto, não tem sido notado na literatura
                                    estudos baseados na análise de propriedades intrínsecas do processo gerador da série temporal como, por exemplo, o determinismo. Neste trabalho de mestrado, é proposta uma abordagem para o problema da classificação de séries temporais, projetada em dois estágios e baseada na análise de propriedades intrínsecas de determinismo e de estocasticidade. Primeiramente, cada série temporal é processada pelo modelo autorregressivo (AR) e pelo Gráfico de Recorrências, para modelar as influências estocásticas e determinísticas, presentes nas séries temporais. Posteriormente, são extraídas características, a partir da nova representação, que compõem o novo espaço característico. Para a classificação em si, optou-se pelo SVM em seu formato convencional. Tomou-se como abordagem de referência da literatura, o classificador 1-NN com funções de distâncias Euclidiana, DTW e DTW otimizado por janela de busca. Os experimentos foram executados sobre os conjuntos de dados do repositório UCR. Os resultados finais mostram que o desempenho de classificação é competitivo, ou superior, a melhor configuração 1-NN em 19 de 41 conjuntos de dados. Não obstante, os resultados evidenciam, também, a necessidade de uma investigação mais aprofundada sobre as influências das propriedades intrínsecas, e outras técnicas da área de análise de séries temporais, quando aplicadas na tarefa de classificação.
                                    Download
                                    Atributos de Ponto de Interesse e Casamento de Modelos para Contagem de Insetos-Praga em Cultura de Soja
                                    Curso Mestrado em Ciência da Computação
                                    Tipo Dissertação
                                    Data 31/03/2016
                                    Área CIÊNCIA DA COMPUTAÇÃO
                                    Orientador(es)
                                    • Hemerson Pistori
                                    Coorientador(es)
                                      Orientando(s)
                                      • Diogo Soares da Silva
                                      Banca
                                      • Denilson de Oliveira Guilherme
                                      • Edson Takashi Matsubara
                                      • Hemerson Pistori
                                      • Lucas Castro Torres
                                      • Marco Hiroshi Naka
                                      Resumo Neste trabalho é apresentado uma aplicação para a contagem de insetos em plantações de soja, o objetivo desta aplicação é ser uma ferramenta para o auxílio de agrônomos e técnicos agrícolas na inspeção de cultivos de soja. A aplicação utiliza imagens aéreas, capturadas por Veículos Aéreos não Tripulados, para a contagem dos insetos, e com esta informação o especialista pode definir se existe infestação de insetos na plantação ou não, decidindo se é necessária a aplicação de inseticidas. Para a identificação e contageßm dos insetos, técnicas de visão computacional baseadas em Pontos de Interesse foram utilizadas, sendo o Speeded Up Robust Feaure (SURF) a técnica utilizada para a detecção e descrição dos Pontos de Interesse das imagens analisadas. Para a classificação dos insetos, técnicas baseadas em casamento de modelos, em específico técnicas que utilizam os pontos de interesse para definir o casamento entre as imagens, foram utilizadas para definir a semelhança entre a imagem teste com as classes analisadas. Com essa informação três métricas foram utilizadas para definir a classe do inseto, a do ponto com distância mínima, a distância média mínima e o número de casamentos. Nos experimentos realizados foram variados os parâmetros do detector e descritor de pontos de interesse a fim de encontrar os melhores resultados para a classificação. O método proposto foi comparado com três classificadores baseados em Máquina de Vetores de Suporte, K vizinhos mais próximos e árvores de decisão. O método proposto obteve uma medida-F de 0.899 sendo estatisticamente melhor do que o classificador baseado em árvores de decisão e semelhante aos baseados em Máquina de Vetores de Suporte e K vizinhos mais próximos. O módulo de contagem foi comparado com a contagem de um especialista que marcou todas as imagens de teste. Através do teste de hipóteses ANOVA (Análise de variância) foi comprovado que a contagem do método proposto e do especialista não são divergentes, com um nível de significância de 5%, evidenciando o potencial da proposta na automação de avaliações de pragas em campo.
                                      Download
                                      Parametrização Cruzada de Modelos Geométricos 3D em Movimento
                                      Curso Mestrado em Ciência da Computação
                                      Tipo Dissertação
                                      Data 02/10/2015
                                      Área CIÊNCIA DA COMPUTAÇÃO
                                      Orientador(es)
                                      • Paulo Aristarco Pagliosa
                                      Coorientador(es)
                                        Orientando(s)
                                        • Andre Luis Vieira Medalha
                                        Banca
                                        • Afonso Paiva Neto
                                        • Edson Takashi Matsubara
                                        • Paulo Aristarco Pagliosa
                                        • Renato Porfirio Ishii
                                        Resumo O objetivo geral deste projeto de mestrado é apresentar uma técnica de parametrização cruzada entre modelos geométricos 3D em movimento. Um modelo geométrico de um objeto em movimento é definido por um conjunto de malhas de triângulos, onde cada malha representa uma pose da superfície do objeto em dado instante de tempo. A técnica proposta toma como entrada dois conjuntos de poses, um conjunto fonte e outro alvo. O primeiro passo desta técnica é a determinação da correspondência inicial de cada pose, ação esta que conta com auxílio de um algoritmo de detecção de pontos característicos e um ambiente de teste interativo. Com esse conjunto de correspondência inicial, torna-se possível realizar a parametrização cruzada entre as diversas poses da fonte e do alvo enquanto os respectivos modelos geométricos se movem, permitindo assim aplicações como morphing dinâmico.
                                        Problema do Fluxo Máximo em Redes Utilizando OpenMP e CUDA
                                        Curso Mestrado em Ciência da Computação
                                        Tipo Dissertação
                                        Data 02/10/2015
                                        Área CIÊNCIA DA COMPUTAÇÃO
                                        Orientador(es)
                                        • Marco Aurelio Stefanes
                                        Coorientador(es)
                                          Orientando(s)
                                          • Luiz Fernando Alvino
                                          Banca
                                          • Carlos Henrique Aguena Higa
                                          • Fabio Henrique Viduani Martinez
                                          • José Coelho de Pina Junior
                                          • Marco Aurelio Stefanes
                                          Resumo O problema do fluxo máximo em redes é um problema fundamental de teoria dos grafos, com muitas aplicações importantes. Os algoritmos para o fluxo máximo baseados no método push-relabel são conhecidos por serem mais efi-
                                          cientes assintoticamente e terem menor tempo de execução na prática. Vários algoritmos paralelos foram propostos, mas poucos deles tiveram tempos de execução menores do que a implementação hipr de Goldberg, baseada em push-relabel. O objetivo geral desta dissertação é discutir as soluções sequenciais e paralelas para o problema do fluxo máximo em redes. Uma contribuição relevante é que propomos um novo algoritmo paralelo híbrido OpenMP-CUDA que explora a paralelização das heurísticas rotulação global e rotulação gap, além de utilizar o processamento em CPU e GPU adaptativamente para maximizar a eficiência de execução. Os resultados dos testes realizados mostram que esse algoritmo é até 5 vezes mais rápido do que a implementação hipr.
                                          Download
                                          Página 5 de 11 (20 de 217 registros).