Use este identificador para citar ou linkar para este item: https://repositorio.ifgoiano.edu.br/handle/prefix/2712
Tipo: Trabalho de Conclusão de Curso
Título: TÉCNICAS DE OTIMIZAÇÃO E MÉTRICAS DE AVALIAÇÃO APLICADAS A MACHINE LEARNING
Autor(es): Cardoso, Isaac
Primeiro Orientador: França, Heyde
Resumo: Para o aprendizado de máquina, a qualidade dos dados, bem como seu pré-processamento, uma vez que os algoritmos utilizados derivam conhecimento principalmente desses mesmos dados, é decisiva para a qualidade dos resultados. A presença ou ausência de valores desconhecidos e a seleção de dados chave, de forma a não contaminar a base de dados utilizada com informações sem relação com o objetivo, por exemplo, são fatores decisivos em se tratando do mérito citado. Em muitas aplicações é importante pensar em como proceder com as informações disponíveis caso estejam incompletas pois o manuseio de valores desconhecidos deve ser cuidadosamente planejado ou surge o risco de distorção. Este trabalho apresenta uma visão panorâmica do tema bem como a implementação de técnicas de pré-processamento aplicados a uma base que contém dados de Covid 19, demonstrando os processos seguidos e os resultados adquiridos, e mostrando como o pré-processamento de dados pode influenciar no resultado final da implementação de um algoritmo. Aprender a trabalhar com dados desbalanceados é primordial, pois nos diversos campos em que estes se encontram, dificilmente se encontrará uma base perfeitamente balanceada, portanto, entender como realizar um bom pré-processamento é uma solução possível para melhorar os resultados de projetos com aprendizado de máquina.
Abstract: For machine learning, the quality of the data, as well as its pre-processing, since the algorithms used mainly derive knowledge from these same data, is decisive for the quality of the results. The presence or absence of unknown values ​​and the selection of key data, so as not to contaminate the database used with information unrelated to the objective, for example, are decisive factors when it comes to the cited merit. In many applications it is important to think about how to proceed with available information if it is incomplete as the handling of unknown values must be carefully planned or the risk of misstatement arises. This work presents a panoramic view of the subject as well as the implementation of pre-processing techniques applied to a database that contains Covid 19 data, demonstrating the processes followed and the results acquired, and showing how the pre-processing of data can influence the final result of implementing an algorithm. Learning to work with unbalanced data is essential, because in the various fields in which they are found, it is difficult to find a perfectly balanced base, therefore, understanding how to perform a good pre-processing is a possible solution to improve the results of projects with learning from machine.
Palavras-chave: Aprendizado de Máquina
Pré-processameno de dados
Algoritmos
Métricas de Avaliação
Área do CNPq: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
Pais: Brasil
Editor: Instituto Federal Goiano
Sigla da Instituição: IF Goiano
Campus: Campus Rio Verde
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ifgoiano.edu.br/handle/prefix/2712
Data do documento: 12-Ago-2022
Aparece nas coleções:Bacharelado em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_Isaac da Silva Cardoso.pdf1,76 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.