Plataforma de busca e indexação em nuvem privada

dc.contributor.advisorCorrêa, Andreiwid Sheffer
dc.contributor.authorRibeiro, Renato dos Santos
dc.date.accessioned2024-03-15T15:33:17Z
dc.date.available2024-03-15T15:33:17Z
dc.date.issued2017-12-12
dc.description.abstractA busca por arquivos é algo comum no dia a dia, e o próprio sistema operacional nos dá suporte a uma interface básica de busca. Entretanto, essa ferramenta é limitada e não é adequada ao meio empresarial, onde há pastas de rede com milhares e até milhões de arquivos. Isso traz um grande desafio quanto ao modo de disponibilizar estes arquivos, pois o custo computacional para a indexação é alto, e sua não indexação faz a busca ser muito lenta. Adiciona-se o complicador de que muitas vezes o documento está digitalizado com seu conteúdo como imagem, o que já não o torna acessível à maioria dos sistemas de busca que vem por padrão no computador. Deste modo, o objetivo deste trabalho é o desenvolvimento de uma plataforma web que possa servir para armazenar arquivos e busca de documentos por conteúdo. O projeto foi desenvolvido utilizando a linguagem Groovy, com o front end utilizando as seguintes tecnologias: Html5, CSS, e Javascript, com React. O armazenamento dos dados indexados foi feito com o Elasticsearch. O sistema atingiu seus objetivos, tendo uma busca com cobertura 40% superior ao Google Drive, que é uma aplicação semelhante. Entretanto a precisão do Google Drive foi 16% mais eficiente e a medida F, teve uma vantagem de 3% em relação ao sistema desenvolvido.
dc.description.abstract2The files search is commonplace day by day, and the operating system itself supports a basic search interface. However, these tools are limited and not suited to business environment, where there are network folders with thousands and even millions of files. This brings a great challenge to the way of making files available, since the computational cost for indexing is high, and its non-indexing makes the search very slow. It adds the complication that the document is often scanned, which is no longer the most accessible in most search systems by default in OS. In this way, the objective of this work is the development of a web platform that can be used to store files and search for documents by content. The project was developed, use a Groovy language, with the front-end, use as following technologies: Html5, CSS, and Javascript, with React. The indexed data was stored using elastic search. The system has achieved its goals, having a search coverage 40% higher than Google Drive, which is an similar application. However, Google Drive was 16% more efficient and the F-measure had 3% advantage over the developed system.
dc.format.mimetypeapplication/pdf
dc.identifier.bibliographicCitationRIBEIRO, Renato dos Santos. Plataforma de busca e indexação em nuvem privada. 2017. 39 f. Trabalho de Conclusão de Curso (Graduação)- Tecnologia em Análise e Desenvolvimento de Sistemas, Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Campus Campinas, 2017.
dc.identifier.urihttps://repositorio.ifsp.edu.br/handle/123456789/711
dc.publisherInstituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)
dc.publisher.campiCAMPINAS
dc.rightsAttribution-NonCommercial-ShareAlike 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/br/
dc.subject.keywordsIndexação
dc.subject.keywordsSistemas web
dc.subject.keywordsOCR
dc.subject.keywordsBusca em conteúdo de arquivo
dc.titlePlataforma de busca e indexação em nuvem privada
dc.title.alternativePrivate cloud search and indexing platform
dc.typeTrabalhos de Conclusão de Curso de Graduação
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
ribeiro_rs_plataforma.pdf
Tamanho:
1.23 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descrição: