Use este identificador para citar ou linkar para este item:
https://repositorio.ifgoiano.edu.br/handle/prefix/6102Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.contributor.advisor1 | Alves, Jesmmer da Silveira | - |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/0742389762650364 | pt_BR |
| dc.contributor.referee1 | Silva, Leila Roling Scariot da | - |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/1190705935250092 | pt_BR |
| dc.contributor.referee2 | Alves, Rejane da Silva | - |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/9932927324447195 | pt_BR |
| dc.creator | Guimarães, Rafael Quintino Fonseca | - |
| dc.creator.Lattes | https://lattes.cnpq.br/0147305731280241 | pt_BR |
| dc.date.accessioned | 2026-01-13T21:20:24Z | - |
| dc.date.available | 2026-01-18 | - |
| dc.date.available | 2026-01-13T21:20:24Z | - |
| dc.date.issued | 2025-12-18 | - |
| dc.identifier.uri | https://repositorio.ifgoiano.edu.br/handle/prefix/6102 | - |
| dc.description.abstract | This study analyzes the news published on the website of the Instituto Federal Goiano in order to identify which articles receive the most views and the reasons behind their success on the platform. Web scraping techniques were employed using the Python programming language and the Selenium browser automation library to develop a software robot capable of collecting news data from the website. The Apache Airflow platform was used to automate its execution, which was performed daily. The news articles were classified into categories such as public notices (editais) and selection processes, by analyzing the titles and descriptions of the publications with the ChatGPT chatbot, from the GPT series of LLMs by OpenAI. The evaluation of the number of accesses was conducted using Python and the data analysis library Pandas, which provided valuable insights for understanding user interest patterns and preferences. Data analysis techniques involving reading and writing CSV files, selecting and filtering by object classes and numerical values, handling tabulated and missing data, calculating descriptive statistics and Z-Scores, and visualizing data through charts were applied to extract the most relevant information from the publications. Pretrained artificial intelligence models for NLP tasks, such as Google’s Bidirectional Encoder Representations from Transformers (BERT) and Meta’s Bidirectional and AutoRegressive Transformer (BART), were used to perform sentiment analysis on the news. The goal was to determine the influence of more positive language on the number of views and to generate a new description for each article that would receive higher sentiment ratings from the BERT model. The findings indicate that users of the website show greater interest in news related to public notices and selection processes. Additionally, it was observed that publications containing a single cover image tend to achieve a higher average number of views. Finally, the study identified that the most suitable days for publishing news on the IF Goiano website correspond, approximately, to the first business days of the week. | pt_BR |
| dc.description.resumo | Este trabalho analisa as notícias publicadas no site do Instituto Federal Goiano para identificar quais são as mais acessadas e as suas razões de sucesso na plataforma. Utilizou-se de técnicas de web scraping com a linguagem de programação Python e a biblioteca de automação de navegador, Selenium, para desenvolver um robô de software capaz de coletar os dados das notícias do site, e da plataforma Apache Airflow, para automatizar a sua execução, que foi feita diariamente. As notícias foram classificadas em categorias como editais e processos seletivos, analisando o título e a descrição das publicações com o chatbot ChatGPT, da série de LLMs, GPT da OpenAI. A avaliação da quantidade de acessos foi realizada por meio da linguagem Python e da biblioteca para análise de dados, Pandas, o que forneceu insights valiosos para a melhor compreensão dos padrões de interesse e preferências dos usuários. As técnicas de análise de dados que envolvem a escrita e a leitura de arquivos CSV, seleção e filtragem por classes de objetos e valores numéricos, manipulação de colunas de dados tabulados e ausentes, cálculo de estatísticas descritivas e Z-Score e de visualização de dados através de gráficos, foram utilizadas para extrair as informações mais importantes das publicações. Os modelos de inteligência artifical pré-treinados para tarefas de NLP, Bidirectional Encoder Representations from Transformers (BERT, em português, ”Representações de Codificador Bidirecional de Transformers”) da Google e Bidirectional and Auto-Regressive Transformer (BART, em português, ”Transformer Bidirecional e Auto-Regressivo”) da Meta, foram utilizados para realizar uma análise de sentimento das notícias, visando descobrir qual é a influência de textos com sentimento mais positivo na quantidade de acessos, e produzir uma nova descrição de cada notícia que seja mais bem avaliada pela análise de sentimento do modelo BERT, respectivamente. Os resultados da pesquisa indicam que os usuários do site demonstram maior interesse por notícias relacionadas a editais e processos seletivos. Ademais, verificou-se que publicações contendo uma única imagem de capa tendem a apresentar maior média de acessos. Por fim, identificou-se que os dias mais propícios para publicação de notícias no site do IF Goiano correspondem, aproximadamente, aos primeiros dias úteis da semana. | pt_BR |
| dc.description.provenance | Submitted by Rafael Quintino Fonseca Guimarães (rafael.fonseca@estudante.ifgoiano.edu.br) on 2026-01-10T21:40:27Z No. of bitstreams: 1 TCC.pdf: 4967260 bytes, checksum: 2b6c2657094702406eb7a7b9038ec33a (MD5) | en |
| dc.description.provenance | Approved for entry into archive by Hevellin Estrela (hevellin.estrela@ifgoiano.edu.br) on 2026-01-13T21:20:17Z (GMT) No. of bitstreams: 1 TCC.pdf: 4967260 bytes, checksum: 2b6c2657094702406eb7a7b9038ec33a (MD5) | en |
| dc.description.provenance | Approved for entry into archive by Hevellin Estrela (hevellin.estrela@ifgoiano.edu.br) on 2026-01-13T21:20:24Z (GMT) No. of bitstreams: 1 TCC.pdf: 4967260 bytes, checksum: 2b6c2657094702406eb7a7b9038ec33a (MD5) | en |
| dc.description.provenance | Made available in DSpace on 2026-01-13T21:20:24Z (GMT). No. of bitstreams: 1 TCC.pdf: 4967260 bytes, checksum: 2b6c2657094702406eb7a7b9038ec33a (MD5) Previous issue date: 2025-12-18 | en |
| dc.language | por | pt_BR |
| dc.publisher | Instituto Federal Goiano | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Campus Morrinhos | pt_BR |
| dc.publisher.initials | IF Goiano | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.subject | Análise de Notícias | pt_BR |
| dc.subject | Análise de Sentimento | pt_BR |
| dc.subject | Mineração de Texto | pt_BR |
| dc.subject | Transformers | pt_BR |
| dc.subject | Web Scraping | pt_BR |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| dc.title | ANÁLISE DE SENTIMENTO E PREVISIBILIDADE DE SUCESSO DE NOTÍCIAS PUBLICADAS NO SITE DO IF GOIANO | pt_BR |
| dc.type | Trabalho de Conclusão de Curso | pt_BR |
| Aparece nas coleções: | Bacharelado em Ciência da Computação | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| TCC.pdf | Este trabalho analisa as notícias publicadas no site do Instituto Federal Goiano para identificar quais são as mais acessadas e as suas razões de sucesso na plataforma. | 4,85 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.