Sensor virtual para classificação de emissões de so2 baseado em k-NN (k-Nearest Neighbors)

Autores

DOI:

https://doi.org/10.6008/CBPC2179-6858.2021.009.0022

Palavras-chave:

Sensor virtual, Dióxido de enxofre, classificação, Caldeira kraft, Estudo de caso real

Resumo

As indústrias em geral buscam cada vez mais, além do aumento de produção com qualidade, redução de custos e operações mais seguras, uma produção mais limpa. De outro lado, o uso de modelos obtidos diretamente a partir de dados históricos sobre as operações se fortaleceu a partir da geração massiva de dados pelos processos industriais. Outro fator que contribuiu para esse avanço foi a aumento da complexidade das operações com o tempo. O objetivo deste trabalho foi construir um sensor virtual para a classificação de seis categorias de emissões de SO2 em uma caldeira de recuperação química de uma fábrica de celulose kraft no Brasil. Baseou-se esse sensor no algoritmo k-vizinhos mais próximos (k-NN; k-Nearest Neighbors), que é uma técnica de aprendizado supervisionado. Testaram-se três abordagens para a obtenção dos modelos k-NN: univariável (usada como referência), a partir de subconjuntos pré-selecionados de preditores, e a partir de comitês de modelos k-NN. O melhor desempenho ocorreu para um comitê de vinte e cinco modelos k-NN, com oito preditores, k (número de vizinhos mais próximos) igual a 2 e distância de Manhattan. Foi possível aumentar a acurácia de classificação das classes minoritárias (4 a 6), sem perda de desempenho sobre as classes majoritárias (1 a 3), como usualmente ocorre em problemas de classificação com dados desbalanceados. Para a classe 6 por exemplo, com o menor número de observações, a precisão passou de 0.794 para 0.906, o recall, de 0.640 para 0.715, a F1-score, de 0.693 para 0.791, e a g-mean de 0.797 para 0.843, sem perda de generalização para as demais classes, em comparação com a abordagem de subconjuntos de preditores. Um sensor virtual pode ser útil como uma fonte de informação redundante sobre variáveis-chave de processo, ou para antecipar resultados de análises de laboratório, o que demanda um tempo razoável em geral, entre outras aplicações.

Downloads

Não há dados estatísticos.

Biografia do Autor

Paolla Marlene Caetano da Cunha, Universidade Federal de Minas Gerais

Mestranda em Engenharia Química, na área de Análise de Dados, pela UFMG. Graduação em Engenharia Química pela UFU, MG. Atualmente é Analista de dados na empresa MG Info, em Belo Horizonte. E possui experiência em PCM de vagões cargueiros, controle dos processos de fabricação de açúcar e tratamento de água potável e desmineralizada, implementação de projetos industriais e desenvolvimento em pesquisas. Especialização em Gerenciamento de Projetos pela IPEMIG. 

Gustavo Matheus de Almeida, Universidade Federal de Minas Gerais

Graduação (2000) e mestrado (2003) em Engenharia Química pela Universidade Federal de Minas Gerais, e especialização em Papel e Celulose (2004) e doutorado em Engenharia Química (2006) pela Universidade de São Paulo, com estágio no IDIAP Research Institute, Suiça (2005). Pós-doutorado na Universidade Federal de Minas Gerais (2007-2008), e professor visitante na Universidade de Coimbra, Portugal (2011). Professor do Depto. de Engenharia Química e Estatística da Universidade Federal de São João del-Rei de 2009 a 2014. Desde 2015, professor do Depto. de Engenharia Química da Universidade Federal de Minas Gerais. Docente permanente de seu Programa de Pós-Graduação em Engenharia Química, e fundador e coordenador do Laboratório de Pesquisa em Análise e Visualização de Dados. Membro do Comitê de Trabalhos Técnicos da revista O Papel da Associação Brasileira Técnica de Celulose e Papel desde 2014. Interesse de pesquisa em desenvolvimento de aplicações data-driven em geral, a partir de estatística e probabilidade, inteligência computacional e visualização de dados. Interesse particular em monitoramento de sistemas contínuos e modelo oculto de Markov.

Downloads

Publicado

2021-08-22