Use este identificador para citar ou linkar para este item:
https://repositorio.ifgoiano.edu.br/handle/prefix/5494
Tipo: | Trabalho de Conclusão de Curso |
Título: | ANÁLISE DE TÉCNICAS DE SIMILARIDADE TEXTUAL NO REPOSITÓRIO INSTITUCIONAL DO IF GOIANO (RIIF Goiano) |
Autor(es): | Rodrigues Filho, Edson Candido |
Primeiro Orientador: | Feitosa, Rafael Divino Ferreira |
Resumo: | Os algoritmos de sugestão tornaram-se essenciais para simplificar o acesso eficaz ao saber. Esses algoritmos são frequentemente empregados em sistemas de sugestão, mecanismos de pesquisa e plataformas de conteúdo acadêmico, auxiliando na customização da experiência do usuário e na identificação de materiais pertinentes. No âmbito educacional e científico, sua implementação pode facilitar o acesso a estudos similares, incentivando a propagação do saber e o progresso das pesquisas. Diante da dificuldade de encontrar trabalhos semelhantes ao tema desejado, este artigo analisa e compara técnicas de similaridade textual no Repositório Institucional do IF Goiano (RIIF GOIANO), focando em duas abordagens: similaridade por compressão de dados e por clusterização. Foram selecionados os algoritmos Damicore e K-Means para a análise. A coleta de dados foi realizada com um web crawler, seguida pela conversão de documentos PDF para texto. Os resultados indicam que o Damicore apresenta a melhor eficiência em uma abordagem qualitativa, contribuindo para a organização e acessibilidade dos dados no RIIF GOIANO. |
Abstract: | Suggestion algorithms have become essential for simplifying effective access to knowledge. These algorithms are frequently employed in recommendation systems, search engines, and academic content platforms, assisting in the customization of the user experience and the identification of relevant materials. In educational and scientific contexts, their implementation can facilitate access to similar studies, encouraging the dissemination of knowledge and the advancement of research. Facing the difficulty of finding works similar to the desired theme, this paper analyzes and compares text similarity techniques in the Institutional Repository of IF Goiano (RIIF GOIANO), focusing on two approaches: data compression similarity and clustering. The algorithms Damicore and K-Means were selected for the analysis. Data collection was performed using a web crawler, followed by the conversion of PDF documents to text. The results indicate that Damicore demonstrates superior efficiency in a qualitative approach, contributing to the organization and accessibility of data in the RIIF GOIANO. |
Palavras-chave: | Similaridade Textual. Repositório Acadêmico. Processamento de Linguagem Natural. Algoritmos de Clusterização. Damicore. K-Means. Recuperação de Informação. Coeficiente de Silhueta. Mineração de Texto. |
Área do CNPq: | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO |
Idioma: | por |
Pais: | Brasil |
Editor: | Instituto Federal Goiano |
Sigla da Instituição: | IF Goiano |
Campus: | Campus Ceres |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.ifgoiano.edu.br/handle/prefix/5494 |
Data do documento: | 5-Jul-2025 |
Aparece nas coleções: | Bacharelado em Sistemas de Informação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ANÁLISE DE TÉCNICAS DE SIMILARIDADE TEXTUAL NO REPOSITÓRIO INSTITUCIONAL DO IF GOIANO (RIIF Goiano)_Edson Candido Rodrigues Filho.pdf | 1,62 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.