Utilização de Técnicas de Integração de Software para Aplicações Web no Contexto de Ferramentas de Acessibilidade |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/06/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Maria Istela Cagnin Machado
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Andre Cavalcante Hora
- Debora Maria Barroso Paiva
- Maria Istela Cagnin Machado
- Tiago Guerreiro
|
Resumo |
|
Download |
|
|
BovChewing - Ferramenta de segmentação e classificação de comportamento bovino por meio de bioacústica e aprendizado de máquina |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
28/04/2017 |
Área |
LÓGICAS E SEMÂNTICA DE PROGRAMAS |
Orientador(es) |
- Claudio Leonardo Lucchesi
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Claudio Leonardo Lucchesi
- Edson Takashi Matsubara
- Fabiana Villa Alves
- Jonathan de Andrade Silva
- Julio Kuhn da Trindade
- Marcelo Henriques de Carvalho
|
Resumo |
O uso de métodos da bioacústica para análises comportamentais têm se desenvolvido com intensidade nos últimos anos, por se tratar de métodos não invasivos buscando uma melhora no monitoramento de precisão de rebanhos. Entretanto, a análise desses dados geralmente requer especialistas e muito tempo tornando-se assim uma tarefa geralmente difícil, tendo a necessidade de construir maneiras de automatizar a fase da análise dos dados.
Existem trabalhos que focam na automatizac~ao da análise dos dados com resultados satisfatórios, mas utilizam de base dados com gravitações feitas em condições controladas e poucos classificam eventos de ruminação. Essa dissertação propõe o BovChewing, uma ferramenta capaz de detectar e classificar eventos ingestivos, baseados em métodos semisupervisionado para a detecção e supervisionado para a classificação, realizando assim a análise dos dados. Experimentos mostraram resultados que a ferramenta é suficiente e satisfatória para com a tarefa obtendo uma acurácia de 63% na tarefa de segmentação e 91% na tarefa de classificação. Trabalhos futuros apontam para a melhora do segmentador, integrac~ao com outras ferramentas de análises de comportamentos bovinos e processamento dos dados na nuvem como uma forma de construir um sistema completo. |
Download |
|
|
Inferência de Redes de Regulação Gênica usando Computação Paralela Híbrida |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
19/04/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Francisco Eloi Soares de Araujo
- Luiz Carlos da Silva Rozante
- Marco Aurelio Stefanes
|
Resumo |
A inferência é o processo de esclarecer as relações formadas entre produtos gênicos/proteínas por meio de um modelo matemático. Conceitualmente este é um problema mal-posto, uma vez que a partir de uma amostra de
dados de expressão gênica é possível inferir diversas redes consistentes com essa amostra. Dependendo do algoritmo, o processo de inferência pode levar horas e até dias devido ao tamanho da rede e complexidade do algoritmo. O algoritmo sequencial de inferência utilizado neste trabalho baseia-se no paradigma de crescimento da semente e possui dois passos: passo de crescimento da semente e passo de inferência. Neste trabalho, desenvolvemos três versões paralelas desse algoritmo de inferência com as seguintes abordagens: cluster e CPUs, GPU/CUDA e híbrida. Essas versões apresentam custos aceitáveissendo comparadas com o algoritmo sequencial.
|
Download |
|
|
Redes Neurais Convolucionais Profundas na Detecção de Plantas Daninhas em Cultura de Soja |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
16/03/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Alessandro dos Santos Ferreira
|
Banca |
- Eraldo Luis Rezende Fernandes
- Hemerson Pistori
- Marcelo Theophilo Folhes
- Marco Hiroshi Naka
|
Resumo |
Ervas daninhas são plantas indesejadas que crescem em culturas agrícolas, como as de soja, competindo por diversos fatores como luz e água e causando prejuízos às lavouras. O objetivo deste trabalho foi utilizar Redes
Neurais Convolucionais para realizar a detecção de ervas daninhas em imagens de lavouras de soja e classificar essas ervas daninhas entre gramíneas e folhas largas, visando direcionar o herbicida específico ao tipo de erva daninha detectado. Para esse objetivo foi realizada uma plantação de soja em Campo Grande, Mato Grosso do Sul, Brasil e com o uso do drone Phantom DJI 3 Professional foi capturado um grande número de imagens da
cultura. Com essas fotografias foi construído um banco de imagens contendo mais de quinze mil imagens do solo, soja e ervas daninhas de folhas largas e gramíneas. As Redes Neurais Convolucionais utilizadas representam uma arquitetura de Aprendizado Profundo que vêm alcançando notável destaque no reconhecimento de imagens. Para o treinamento da Rede Neural foi utilizada a arquitetura CaffeNet, disponível no software Caffe, que consiste de uma replicação da conhecida rede AlexNet, que venceu a competição ImageNet LSRVC de 2012. Foi implementado também um software, Pynovisão, que através do uso do segmentador SLIC Superpixel, ajudou na construção de um banco de imagens robusto e na classificação das imagens utilizando o modelo treinado pelo software Caffe. Para comparar os resultados da Rede Neural Convolucional, foram utilizados os algoritmos Máquina de Vetores de Suporte, AdaBoost e Florestas Aleatórias em conjunto com uma coleção de extratores de atributos de forma, cor e textura. Como resultado, utilizando as Redes Neurais Convolucionais, este trabalho obteve precisão acima de 98% na detecção de ervas daninhas de folhas largas e gramíneas em relação ao solo e a soja, com média de precisão entre todas as imagens superior a 99%. |
Download |
|
|
Exploração do Espaço de Projetos de Sistemas Multiprocessadores Guiado por Dark Silicon |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
03/03/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Ricardo Ribeiro dos Santos
|
Coorientador(es) |
|
Orientando(s) |
- Ana Caroline dos Santos Silva
|
Banca |
- Edson Takashi Matsubara
- Liana Dessandre Duenha Garanhani
- Ricardo Ribeiro dos Santos
- Sarita Mazzini Bruschi
|
Resumo |
|
Download |
|
|
Aprendizado de Representações para Adaptação de Domínio de Etiquetagem Morfossintática |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
08/02/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Eraldo Luis Rezende Fernandes
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Bruno Magalhaes Nogueira
- Eraldo Luis Rezende Fernandes
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
|
Resumo |
|
Download |
|
|
Um Arcabouço Computacional de Apoio à Instanciação de Linhas de Processos de Negócios |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
08/02/2017 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Maria Istela Cagnin Machado
|
Coorientador(es) |
|
Orientando(s) |
- Delacyr Almeida Monteiro Ferreira
|
Banca |
- Bruno Barbieri de Pontes Cafeo
- Debora Maria Barroso Paiva
- Maria Istela Cagnin Machado
- Rogéria Cristiane Gratão de Souza
|
Resumo |
A modelagem de processos de negócio possui grande importância no contexto organizacional, pois auxilia a definição de novos processos e o aprimoramento dos existentes para tornar as organizações mais competitivas e eficientes. O uso de técnicas de reúso de software no contexto de processos de negócio é um mecanismo para viabilizar o reúso eficiente de modelos de processos de negócio, como é o caso de Linhas de Processos de Negócio (LPN). O apoio computacional se torna importante no âmbito de LPN pois facilita a construção, instanciação e evolução das linhas, uma vez que os modelos criados são complexos devido às características inerentes ao domínio e ao dinamismo do negócio. Apesar da existência de diversas abordagens de LPN na literatura, há carência de técnicas e ambientes computacionais que apoiem o processo de instanciação de LPNs. O objetivo deste trabalho é aprimorar a abordagem de Gestão de Linhas de Processos de Negócios (GLPN) para tornar a instanciação de LPNs mais eficiente. Esse aprimoramento é alcançado no processo de Engenharia de Domínio do Negócio (EDN) da GLPN possibilitando a criação de um ou mais TMPNs para LPNs com processos de negócio mais complexos, além da substituição do formulário de configuração por um modelo de configuração criado no processo de Engenharia de Processo de Negócio (EPN), facilitando assim a reusabilidade das LPNs. Além disso, o BPL-Framework, ferramenta responsável pela construção de LPNs com base na abordagem GLPN, é evoluído obtendo-se o BPL-Framework 2.0 para contemplar também fases do processo de Engenharia de Processo de Negócio (EPN), responsáveis pela instanciação de LPNs. O BPL-Framework 2.0 é avaliado com base em requisitos de avaliação, definidos a partir da norma ISO/IEC 25000. Os resultados da avaliação indicam que o BPL-Framework 2.0 atende aos requisitos avaliados e propicia a instanciação de LPNs em conformidade com a abordagem GLPN com a acurácia, legibilidade e usabilidade adequadas, contribuindo também para a redução significativa no tempo de instanciação e de erros sintáticos, semânticos e de configuração das instânciasdas LPNs. |
Download |
|
|
Solução de problemas em Grafos através da Lógica Monádica de Segunda Ordem e da Decomposição em Árvore |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
09/01/2017 |
Área |
TEORIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Luciano Gonda
- Marcelo Henriques de Carvalho
- Sheila Morais de Almeida
- Vagner Pedrotti
|
Resumo |
|
Download |
|
|
Estimativas de Dark Silicon em Projetos de Sistemas Multicore |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
16/09/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Ricardo Ribeiro dos Santos
|
Coorientador(es) |
|
Orientando(s) |
- Tony Carlos Bignardi dos Santos
|
Banca |
- Edson Borin
- Fabio Iaione
- Liana Dessandre Duenha Garanhani
- Ricardo Ribeiro dos Santos
|
Resumo |
A demanda por computação de alto desempenho continua a crescer de forma significativa. Apesar da indústria entregar aos consumidores sistemas computacionais mais eficientes, limitações físicas e restrições tecnológicas colocam em risco a evolução para as próximas gerações de processadores. O aumento exponencial de dissipação de potência estática devido ao incremento da corrente de fuga em transistores com escala de integração abaixo de 90nm limita a fração de área do circuito que se pode manter ativa no momento da execução O termo dark silicone utilizado para indicar a fração de área do chip que deve ter frequência de clock reduzida para manter restrições térmicas de potência do projeto. Algumas alternativas para contornar a necessidade de subutilizar uma parte da área do chip estão a adoção de hardware especializado e exploração de paralelismo. Essas alternativas possibilitam que uma parte da área do chip seja utilizada para execução de código em frequências menores visando não extrapolar o orçamento de potência. Observa-se assim a necessidade de técnicas e ferramentas para o projeto de sistemas cientes de dark silicon. Este trabalho tem como objetivo identificar e mensurar a área de dark silicon em projetos de sistemas computacionais com tecnologia abaixo de 90nm, utilizando-se de uma metodologia baseada no cálculo da densidade de potência de um projeto base (90nm) e da adoção de um circuito de referência. Experimentos foram realizados considerando projetos de processadores multicore comerciais para estimar o dark silicon presente nesses projetos considerando suas evoluções tecnológicas. Adicionalmente, um experimento de exploração do espaço de projeto foi realizado, com o intuito de validar as estimativas de dark silicon and buscar alternativas para utilização eficiente da área do chip diante das restrições físicas de projeto. |
Download |
|
|
Uma ferramenta para integração de dados de expressão diferencial e interação funcional |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
02/09/2016 |
Área |
MATEMÁTICA DA COMPUTAÇÃO |
Orientador(es) |
- Nalvo Franco de Almeida Junior
|
Coorientador(es) |
|
Orientando(s) |
- Rodolpho Gheleri de Oliveira Lima
|
Banca |
- Luciana Montera Cheung
- Nalvo Franco de Almeida Junior
- Said Sadique Adi
- Tainá Raiol Alencar
|
Resumo |
Este trabalho descreve o desenvolvimento de duas ferramentas computacionais: um pipeline para análise de expressão diferencial de genes e outra para a visualização gráfica de resultados de express~ao diferencial, chamada DEPICTViz, que agrega ao resultado da análise de expressão diferencial informacões de interação funcional de proteínas. O pipeline desenvolvido realiza o mapeamento de reads no genoma de referência, a ordenação dos reads mapeados, a construção e união de transcritos e a analise de expressão diferencial. A ferramenta DEPICTViz foi desenvolvida para a visualização de experimentos de expressão diferencial de genes e interação de
proteínas. DEPICTViz foi testada com sucesso em vários estudos de caso. |
Download |
|
|
Inferência de redes de regulação gênica a partir de dados de expressão gênica e conhecimento biológico a priori |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
23/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
- Carlos Henrique Aguena Higa
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Leonardo Rippel Salgado
- Renato Porfirio Ishii
- Said Sadique Adi
|
Resumo |
Neste trabalho, nós estudamos um problema comum na Biologia Sistêmica, o qual é a inferência ou engenharia reversa da rede de regulação gênica a partir de dados de expressão gênica. Nós endereçamos este problema usando o formalismo Booleano, onde a expressão de um gene é representado apenas por dois possíveis valores: 0 (não expressado) ou 1 (expressado). Além disso, nossa metodologia é baseada na abordagem de seleção de característica e utilizamos um algoritmo chamado IFFS - improved forward floating selection. Realizamos experimentos para comparar 2 medidas de interação gênica usada na função critério do algoritmo, o coeficiente de determinação e a informação mútua computada através da entropia de Shannon e de Tsallis. Também incorporamos uma fonte de conhecimento biológico a priori das interações dos genes a partir de um banco de
dados chamado STRING. Para validar a metodologia, utilizamos dados das competições DREAM e um conjunto de dados de um estudo do ciclo-celular da levedura. Os resultados mostraram que, geralmente, a informação mútua desempenha um resultado levemente melhor do que o coeficiente de determinação, e que incorporando o conhecimento biológico melhora os resultados. Todo esse conjunto de algoritmos estão implementados na linguagem R e futuram estarão completamente disponível como o pacote Measures_GRN do R em https://github.com/camila-koike/Measure_GRN. |
Download |
|
|
Seleção de Instâncias Baseado em Aprendizado de Métricas para K Vizinhos Mais Próximos |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
22/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Eduardo Zárate Guerreiro Max
|
Banca |
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
|
Resumo |
A seleção de instâncias, em aprendizado de máquina, procura identificar instâncias relevantes e remover as instâncias que são redundantes ou prejudiciais do conjunto original. Classificadores baseados em instâncias, como o K Vizinhos Mais Próximos (k-NN), são fortemente beneficiados com esta seleção, podendo prover uma classificação mais rápida, uma diminuição nos requisitos de armazenamento e uma diminuição na sensibilidade ao ruído. Um fundamento essencial a esses algoritmos são as métricas de distância entre os exemplos. Nesse trabalho de mestrado, é proposto um algoritmo de seleção de instâncias com aprendizado de métricas denominado Seleção de Instância sobre Aprendizado de Métrica (Instance Selection on Metric Learning, ISML) para o Classificador K Vizinhos Mais Próximos. O método de aprendizado de métricas, chamado de k-Neighborhood Components Analysis (kNCA), é aplicado ao conjunto de dados para melhorar a seleção e reduzir a relação de compromisso (trade-off ) entre número de instâncias de treino e acurácia. Foram realizados experimentos para comparar métodos tradicionais da literatura de seleção de instâncias. Os resultados são promissores principalmente em cenários de redução extrema de exemplos, redução maior que 50% dos dados originais, onde a proposta ISML obtém melhor ROC AUC em 11 dos 12 conjunto de dados quando comparado com outros três métodos de seleção de instância.
|
Download |
|
|
Histograma de Palavras Visuais para Caracterização de Texturas e Cenas Dinâmicas |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
17/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Wesley Eiji Sanches Kanashiro
|
Banca |
- Hemerson Pistori
- Jonathan de Andrade Silva
- Wesley Nunes Goncalves
|
Resumo |
A caracterização de vídeos vem sendo pesquisada cada vez mais na área de visão computacional por ser um tema desafiador. Caracterizar vídeos não é uma tarefa trivial, pois é preciso levar em consideração tanto a informação espacial (aparência), quanto a informação temporal (movimento). As texturas dinâmicas são um caso particular de vídeos, que podem ser definidas como movimentos de padrões que apresentam propriedades estacionárias ao longo do espaço e tempo. Exemplos de textura dinâmica podem ser encontrados em situações do dia-a-dia como por exemplo, em sequências de imagens de ondas do mar, fumaça, fogo, escada rolante, entre outras. Outro caso particular de vídeos são as cenas dinâmicas, que são composições de uma ou mais texturas dinâmicas, mas com um local ou cenário caracterizando-as. Este trabalho tem por objetivo estender o Histograma de Palavras Visuais (BoVW) para caracterização de texturas e cenas dinâmicas. O BoVW é aplicado em três planos ortogonais do vídeo para que sejam obtidas informações espaciais e de movimento, melhorando assim, a caracterização de vídeos. Para avaliar a proposta deste trabalho, experimentos foram realizados em duas bases de vídeos: tráfego de carros e cenas dinâmicas. Os resultados foram comparados com os obtidos por métodos da literatura e em ambas as bases de vídeos, o método proposto apresentou resultados promissores. Na base de cenas dinâmicas, pode-se concluir que a inclusão da informação de movimento para caracterização dos vídeos aumentou consideravelmente a taxa de classificação correta. Enquanto que na base de tráfego de carros, a informação temporal não influenciou de forma tão considerável a taxa de classificação correta, apesar de contribuir de certa forma na caracterização dos vídeos.
|
Download |
|
|
Classificação de Séries Temporais baseada em Análise de Recorrência e Extração de Características |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
03/08/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Eraldo Luis Rezende Fernandes
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Rodrigo Fernandes de Mello
|
Resumo |
A identificação de padrões em fluxos de dados contínuos tem despertado o interesse científico, seja na detecção de falhas em sistemas, identificação de operações fraudulentas em transações bancárias, propagação de doenças ou ainda na preservação do meio ambiente. A categorização destes dados, concomitante com a ampliação do sensoriamento e monitoramento de diversos outros domínios, motiva a busca por soluções práticas e eficientes que auxiliem na busca por padrões recorrentes. A extração de conhecimento dos dados, quando dependentes do tempo, exige um tratamento especial e a mineração dos dados apresenta-se como uma atividade valiosa. Neste trabalho, é proposta uma abordagem chamada DSP-Class para classificação de séries temporais utilizando Descritores de Textura aplicados em Gráficos de Recorrência (RP). São utilizados 14 conjuntos de dados reais relacionados a vocalizações de aves, identificação de insetos, categorização de reações químicas, dentre outros. O objetivo desta pesquisa é verificar a utilização das características texturais de RPs em algoritmos de aprendizagem, tais como Support Vector Machine (SVM) e C5:0, aplicando a Decomposição de Modo Empírico (EMD) na classificação de séries temporais. Também é analisada a influência estocástica-determinística presentes nos fluxos. Verifica-se desempenho ruim do algoritmo 1NN, considerado estado-da-arte, em séries predominantemente estocásticas ou determinísticas e desempenho 67:66% superior da abordagem DSP-Class, uma vez que as características texturais distinguem classes de séries temporais mais satisfatoriamente que a busca por similaridade utilizada no algoritmo 1NN nos dados analisados. Verifica-se inclusive, resultados 18;67% superiores àqueles obtidos por pesquisas semelhantes que utilizam outras características presentes em séries temporais. |
Download |
|
|
Problema das pseudo-arborescências capacitadas com a localização de facilidades |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
22/07/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Fabio Henrique Noboru Abe
|
Banca |
- Anderson Vicoso de Araujo
- Cid Carvalho de Souza
- Edna Ayako Hoshino
- Fabio Henrique Viduani Martinez
|
Resumo |
Neste trabalho apresentamos o problema das pseudo-arborescências capacitadas com localização de facilidades, um problema novo e relacionado a dois outros problemas clássicos: o problema do roteamento de veículos
capacitado e o problema da localização de facilidade capacitada. O problema estudado é uma generalização do problema da pseudo-arborescência capacitada, em inglês capacitated ring tree problem. Propomos neste estudo duas formulações em programação linear inteira para modelar o problema. A primeira é uma formulação estendida baseada em partição de conjuntos e a segunda é uma formulação compacta baseada em fluxos. Propomos também dois algoritmos exatos para resolver o problema. Um deles utiliza a técnica de branch-and-price com a formulação estendida e o outro é um algoritmo do tipo branch-and-bound baseado na formulação compacta. Implementamos também uma heurística primal e uma heurística de pricing com o objetivo de melhorar o desempenho dos métodos exatos. Experimentos computacionais realizados em um grupo de instâncias testes mostram que a formulação estendida fornece limitantes muito mais apertados do que a formulação compacta. Além disso, as heurísticas foramrelevantes para acelerar os métodos de branch-and-price e branch-and-bound, em especial a heurística primal. |
Download |
|
|
FlexRank: Um Rankeador Lexicográfico Rápido |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
29/06/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
|
Resumo |
O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
|
Download |
|
|
Uma Abordagem para Classificação de Séries Temporais Baseada em Modelo Autorregressivo e Gráfico de Recorrência |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
25/05/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Eraldo Luis Rezende Fernandes
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
- Ricardo Araújo Rios
|
Resumo |
Atualmente, os estudos sobre o problema da classificação de séries temporais tem se concentrado em elaborar abordagens em dois formatos: baseado em funções de distância entre itens do conjunto de dados, e baseado em um procedimento de dois estágios, onde as séries temporais são transformadas em vetores de características, permitindo o emprego de técnicas de classificação convencionais. Neste contexto, não tem sido notado na literatura
estudos baseados na análise de propriedades intrínsecas do processo gerador da série temporal como, por exemplo, o determinismo. Neste trabalho de mestrado, é proposta uma abordagem para o problema da classificação de séries temporais, projetada em dois estágios e baseada na análise de propriedades intrínsecas de determinismo e de estocasticidade. Primeiramente, cada série temporal é processada pelo modelo autorregressivo (AR) e pelo Gráfico de Recorrências, para modelar as influências estocásticas e determinísticas, presentes nas séries temporais. Posteriormente, são extraídas características, a partir da nova representação, que compõem o novo espaço característico. Para a classificação em si, optou-se pelo SVM em seu formato convencional. Tomou-se como abordagem de referência da literatura, o classificador 1-NN com funções de distâncias Euclidiana, DTW e DTW otimizado por janela de busca. Os experimentos foram executados sobre os conjuntos de dados do repositório UCR. Os resultados finais mostram que o desempenho de classificação é competitivo, ou superior, a melhor configuração 1-NN em 19 de 41 conjuntos de dados. Não obstante, os resultados evidenciam, também, a necessidade de uma investigação mais aprofundada sobre as influências das propriedades intrínsecas, e outras técnicas da área de análise de séries temporais, quando aplicadas na tarefa de classificação.
|
Download |
|
|
Atributos de Ponto de Interesse e Casamento de Modelos para Contagem de Insetos-Praga em Cultura de Soja |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
31/03/2016 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Denilson de Oliveira Guilherme
- Edson Takashi Matsubara
- Hemerson Pistori
- Lucas Castro Torres
- Marco Hiroshi Naka
|
Resumo |
Neste trabalho é apresentado uma aplicação para a contagem de insetos em plantações de soja, o objetivo desta aplicação é ser uma ferramenta para o auxílio de agrônomos e técnicos agrícolas na inspeção de cultivos de soja. A aplicação utiliza imagens aéreas, capturadas por Veículos Aéreos não Tripulados, para a contagem dos insetos, e com esta informação o especialista pode definir se existe infestação de insetos na plantação ou não, decidindo se é necessária a aplicação de inseticidas. Para a identificação e contageßm dos insetos, técnicas de visão computacional baseadas em Pontos de Interesse foram utilizadas, sendo o Speeded Up Robust Feaure (SURF) a técnica utilizada para a detecção e descrição dos Pontos de Interesse das imagens analisadas. Para a classificação dos insetos, técnicas baseadas em casamento de modelos, em específico técnicas que utilizam os pontos de interesse para definir o casamento entre as imagens, foram utilizadas para definir a semelhança entre a imagem teste com as classes analisadas. Com essa informação três métricas foram utilizadas para definir a classe do inseto, a do ponto com distância mínima, a distância média mínima e o número de casamentos. Nos experimentos realizados foram variados os parâmetros do detector e descritor de pontos de interesse a fim de encontrar os melhores resultados para a classificação. O método proposto foi comparado com três classificadores baseados em Máquina de Vetores de Suporte, K vizinhos mais próximos e árvores de decisão. O método proposto obteve uma medida-F de 0.899 sendo estatisticamente melhor do que o classificador baseado em árvores de decisão e semelhante aos baseados em Máquina de Vetores de Suporte e K vizinhos mais próximos. O módulo de contagem foi comparado com a contagem de um especialista que marcou todas as imagens de teste. Através do teste de hipóteses ANOVA (Análise de variância) foi comprovado que a contagem do método proposto e do especialista não são divergentes, com um nível de significância de 5%, evidenciando o potencial da proposta na automação de avaliações de pragas em campo. |
Download |
|
|
Parametrização Cruzada de Modelos Geométricos 3D em Movimento |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
02/10/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
- Andre Luis Vieira Medalha
|
Banca |
- Afonso Paiva Neto
- Edson Takashi Matsubara
- Paulo Aristarco Pagliosa
- Renato Porfirio Ishii
|
Resumo |
O objetivo geral deste projeto de mestrado é apresentar uma técnica de parametrização cruzada entre modelos geométricos 3D em movimento. Um modelo geométrico de um objeto em movimento é definido por um conjunto de malhas de triângulos, onde cada malha representa uma pose da superfície do objeto em dado instante de tempo. A técnica proposta toma como entrada dois conjuntos de poses, um conjunto fonte e outro alvo. O primeiro passo desta técnica é a determinação da correspondência inicial de cada pose, ação esta que conta com auxílio de um algoritmo de detecção de pontos característicos e um ambiente de teste interativo. Com esse conjunto de correspondência inicial, torna-se possível realizar a parametrização cruzada entre as diversas poses da fonte e do alvo enquanto os respectivos modelos geométricos se movem, permitindo assim aplicações como morphing dinâmico. |
|
Problema do Fluxo Máximo em Redes Utilizando OpenMP e CUDA |
|
Curso |
Mestrado em Ciência da Computação |
Tipo |
Dissertação |
Data |
02/10/2015 |
Área |
CIÊNCIA DA COMPUTAÇÃO |
Orientador(es) |
|
Coorientador(es) |
|
Orientando(s) |
|
Banca |
- Carlos Henrique Aguena Higa
- Fabio Henrique Viduani Martinez
- José Coelho de Pina Junior
- Marco Aurelio Stefanes
|
Resumo |
O problema do fluxo máximo em redes é um problema fundamental de teoria dos grafos, com muitas aplicações importantes. Os algoritmos para o fluxo máximo baseados no método push-relabel são conhecidos por serem mais efi-
cientes assintoticamente e terem menor tempo de execução na prática. Vários algoritmos paralelos foram propostos, mas poucos deles tiveram tempos de execução menores do que a implementação hipr de Goldberg, baseada em push-relabel. O objetivo geral desta dissertação é discutir as soluções sequenciais e paralelas para o problema do fluxo máximo em redes. Uma contribuição relevante é que propomos um novo algoritmo paralelo híbrido OpenMP-CUDA que explora a paralelização das heurísticas rotulação global e rotulação gap, além de utilizar o processamento em CPU e GPU adaptativamente para maximizar a eficiência de execução. Os resultados dos testes realizados mostram que esse algoritmo é até 5 vezes mais rápido do que a implementação hipr.
|
Download |
|
|