Use este identificador para citar ou linkar para este item: https://repositorio.ifgoiano.edu.br/handle/prefix/6340
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Costa, Nattane-
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/9968129748669015pt_BR
dc.contributor.referee1Costa, Nattane-
dc.contributor.referee2Cardoso, Cristiane-
dc.contributor.referee3Carvalho, Amaury-
dc.creatorSousa, Souto, José Antonio Ribeiro Flávio Diniz de-
dc.creator.Latteshttp://lattes.cnpq.br/1643481386862110pt_BR
dc.date.accessioned2026-03-16T12:58:06Z-
dc.date.available2026-03-13-
dc.date.available2026-03-16T12:58:06Z-
dc.date.issued2026-03-11-
dc.identifier.urihttps://repositorio.ifgoiano.edu.br/handle/prefix/6340-
dc.description.abstractClass imbalance occurs when there is an unequal distribution among the classes in a dataset, such that one class has a significantly smaller number of instances compared to the others. This scenario represents one of the challenges present in machine learning tasks, directly impacting the performance of predictive models. This study aims to compare different data balancing techniques, including oversampling, undersampling, and hybrid approaches, applied to multiple datasets with different levels of imbalance. Experiments were conducted using classification algorithms such as Decision Tree (C5.0), Random Forest, Artificial Neural Networks (ANN), Logistic Regression, and SVM, which were evaluated using the following performance metrics: accuracy, precision, recall, and F1-score. The analysis of the results made it possible to identify the impact of balancing techniques in different experimental scenarios, as well as their limitations and advantages. In general, oversampling techniques frequently showed superior or equivalent performance compared to the other evaluated methods, while the use of unbalanced data tended to present inferior results for certain metrics and algorithms. In addition, tree-based models, such as Random Forest, demonstrated greater robustness across the different analyzed scenarios. The findings of this study aim to provide support for the appropriate selection of balancing methods, contributing to the development of more robust and reliable models.pt_BR
dc.description.resumoO desbalanceamento de classes ocorre quando há uma distribuição desigual entre as classes de um conjunto de dados, de modo que uma delas possui número significativamente inferior de instâncias em relação às demais. Esse cenário constitui um dos desafios presentes em tarefas de aprendizado de máquina, impactando diretamente o desempenho de modelos preditivos. Este trabalho tem como objetivo comparar diferentes técnicas de balanceamento de dados, incluindo métodos de oversampling, undersampling e abordagens híbridas, aplicadas a múltiplas bases de dados com diferentes níveis de desbalanceamento. Foram conduzidos experimentos utilizando os algoritmos de classificação como Árvore de Decisão(C5.0), Random Forest, Rede Neural Artificial(ANN), Regressão Logística e SVM que foram avaliados por meio das seguintes métricas de desempenho: acurácia, precisão, recall e F1-score. A análise dos resultados permitiu identificar o impacto das técnicas de balanceamento em distintos cenários experimentais, bem como suas limitações e vantagens. De modo geral, observou-se que técnicas de oversampling frequentemente apresentaram desempenho superior ou equivalente aos demais métodos avaliados, enquanto o uso de dados sem balanceamento tendeu a apresentar resultados inferiores em algumas métricas e algoritmos específicos. Além disso, modelos baseados em árvores, como o Random Forest, demonstraram maior robustez nos diferentes cenários analisados. Os achados deste estudo buscam fornecer subsídios para a escolha adequada de métodos de balanceamento, contribuindo para o desenvolvimento de modelos mais robustos e confiáveis.pt_BR
dc.description.provenanceSubmitted by José Antonio Ribeiro Souto (jose.ribeiro@estudante.ifgoiano.edu.br) on 2026-03-13T21:58:49Z No. of bitstreams: 1 TC_Comparação_de_Métodos_de_Balanceamento_de_Dados_em_Diferentes_Cenários.pdf: 6277032 bytes, checksum: c3bbd1c9ece282e47bc56ae47622e001 (MD5)en
dc.description.provenanceApproved for entry into archive by Itala Moreira Alves (itala.moreira@ifgoiano.edu.br) on 2026-03-16T12:55:13Z (GMT) No. of bitstreams: 1 TC_Comparação_de_Métodos_de_Balanceamento_de_Dados_em_Diferentes_Cenários.pdf: 6277032 bytes, checksum: c3bbd1c9ece282e47bc56ae47622e001 (MD5)en
dc.description.provenanceMade available in DSpace on 2026-03-16T12:58:06Z (GMT). No. of bitstreams: 1 TC_Comparação_de_Métodos_de_Balanceamento_de_Dados_em_Diferentes_Cenários.pdf: 6277032 bytes, checksum: c3bbd1c9ece282e47bc56ae47622e001 (MD5) Previous issue date: 2026-03-11en
dc.languageporpt_BR
dc.publisherInstituto Federal Goianopt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus Urutaípt_BR
dc.publisher.initialsIF Goianopt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectDesbalanceamento de classespt_BR
dc.subjectBalanceamento de dadospt_BR
dc.subjectClassificação bináriapt_BR
dc.subjectAvaliação de modelospt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSpt_BR
dc.titleComparação de Métodos de Balanceamento de Dados em Diferentes Cenáriospt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
Aparece nas coleções:Bacharelado em Sistemas de Informação



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.