Plataforma de busca e indexação em nuvem privada

Data
2017-12-12
Título da Revista
ISSN da Revista
Título de Volume
Editor
Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)

Resumo

A busca por arquivos é algo comum no dia a dia, e o próprio sistema operacional nos dá suporte a uma interface básica de busca. Entretanto, essa ferramenta é limitada e não é adequada ao meio empresarial, onde há pastas de rede com milhares e até milhões de arquivos. Isso traz um grande desafio quanto ao modo de disponibilizar estes arquivos, pois o custo computacional para a indexação é alto, e sua não indexação faz a busca ser muito lenta. Adiciona-se o complicador de que muitas vezes o documento está digitalizado com seu conteúdo como imagem, o que já não o torna acessível à maioria dos sistemas de busca que vem por padrão no computador. Deste modo, o objetivo deste trabalho é o desenvolvimento de uma plataforma web que possa servir para armazenar arquivos e busca de documentos por conteúdo. O projeto foi desenvolvido utilizando a linguagem Groovy, com o front end utilizando as seguintes tecnologias: Html5, CSS, e Javascript, com React. O armazenamento dos dados indexados foi feito com o Elasticsearch. O sistema atingiu seus objetivos, tendo uma busca com cobertura 40% superior ao Google Drive, que é uma aplicação semelhante. Entretanto a precisão do Google Drive foi 16% mais eficiente e a medida F, teve uma vantagem de 3% em relação ao sistema desenvolvido.


Descrição
Palavras-chave
Citação