Plataforma de busca e indexação em nuvem privada
dc.contributor.advisor | Corrêa, Andreiwid Sheffer | |
dc.contributor.author | Ribeiro, Renato dos Santos | |
dc.date.accessioned | 2024-03-15T15:33:17Z | |
dc.date.available | 2024-03-15T15:33:17Z | |
dc.date.issued | 2017-12-12 | |
dc.description.abstract | A busca por arquivos é algo comum no dia a dia, e o próprio sistema operacional nos dá suporte a uma interface básica de busca. Entretanto, essa ferramenta é limitada e não é adequada ao meio empresarial, onde há pastas de rede com milhares e até milhões de arquivos. Isso traz um grande desafio quanto ao modo de disponibilizar estes arquivos, pois o custo computacional para a indexação é alto, e sua não indexação faz a busca ser muito lenta. Adiciona-se o complicador de que muitas vezes o documento está digitalizado com seu conteúdo como imagem, o que já não o torna acessível à maioria dos sistemas de busca que vem por padrão no computador. Deste modo, o objetivo deste trabalho é o desenvolvimento de uma plataforma web que possa servir para armazenar arquivos e busca de documentos por conteúdo. O projeto foi desenvolvido utilizando a linguagem Groovy, com o front end utilizando as seguintes tecnologias: Html5, CSS, e Javascript, com React. O armazenamento dos dados indexados foi feito com o Elasticsearch. O sistema atingiu seus objetivos, tendo uma busca com cobertura 40% superior ao Google Drive, que é uma aplicação semelhante. Entretanto a precisão do Google Drive foi 16% mais eficiente e a medida F, teve uma vantagem de 3% em relação ao sistema desenvolvido. | |
dc.description.abstract2 | The files search is commonplace day by day, and the operating system itself supports a basic search interface. However, these tools are limited and not suited to business environment, where there are network folders with thousands and even millions of files. This brings a great challenge to the way of making files available, since the computational cost for indexing is high, and its non-indexing makes the search very slow. It adds the complication that the document is often scanned, which is no longer the most accessible in most search systems by default in OS. In this way, the objective of this work is the development of a web platform that can be used to store files and search for documents by content. The project was developed, use a Groovy language, with the front-end, use as following technologies: Html5, CSS, and Javascript, with React. The indexed data was stored using elastic search. The system has achieved its goals, having a search coverage 40% higher than Google Drive, which is an similar application. However, Google Drive was 16% more efficient and the F-measure had 3% advantage over the developed system. | |
dc.format.mimetype | application/pdf | |
dc.identifier.bibliographicCitation | RIBEIRO, Renato dos Santos. Plataforma de busca e indexação em nuvem privada. 2017. 39 f. Trabalho de Conclusão de Curso (Graduação)- Tecnologia em Análise e Desenvolvimento de Sistemas, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Campus Campinas, 2017. | |
dc.identifier.uri | https://repositorio.ifsp.edu.br/handle/123456789/711 | |
dc.publisher | Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP) | |
dc.publisher.campi | CAMPINAS | |
dc.rights | Attribution-NonCommercial-ShareAlike 3.0 Brazil | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/br/ | |
dc.subject.keywords | Indexação | |
dc.subject.keywords | Sistemas web | |
dc.subject.keywords | OCR | |
dc.subject.keywords | Busca em conteúdo de arquivo | |
dc.title | Plataforma de busca e indexação em nuvem privada | |
dc.title.alternative | Private cloud search and indexing platform | |
dc.type | Trabalhos de Conclusão de Curso de Graduação |