fbpx

Por John Klaess

Frequentemente conversamos com empresas interessadas em aplicar algoritmos de machine learning (aprendizado de máquina) a seus dados de manufatura.

Como discutimos anteriormente, a chave para o sucesso com ML e AI são dados robustos, e é por isso que a plataforma de monitoramento de máquinas da Tulip coleta os dados necessários para que você entenda realmente suas operações.

Quando se tratar de análise de big data, nosso objetivo é ser um facilitador. A Tulip fornece às empresas os dados necessários para aplicar as técnicas de análise mais sofisticadas possíveis. Queremos tornar trivial para as equipes e engenheiros de ciência de dados coletar em suas estações de trabalho e extrair dados da Tulip para que eles possam desbloquear novos níveis de produtividade e qualidade.

Neste artigo, demonstraremos como você poderá aplicar técnicas simples e poderosas de ciência de dados aos dados que você coletar com a Tulip.

O experimento: detecção de anomalias em dados CNC

Para mostrar como a Tulip pode capacitar iniciativas de ciência de dados, realizamos um experimento rápido usando dados gerados por um cliente da Tulip (aqui mantido anônimo).

Para este experimento, selecionamos um conjunto de dados coletados por este cliente usando a Tulip para monitoramento de máquinas. Escolhemos esse conjunto de dados por vários motivos.

Em primeiro lugar, o conjunto de dados é suficientemente grande para treinar adequadamente os modelos de ML. Extraímos dados de uma janela de 24 horas e o conjunto de dados chegou às centenas de milhares de linhas. Isso é suficiente para a maioria dos algoritmos de classificação, agrupamento e detecção de anomalias para produzir resultados confiáveis.

Em segundo lugar, o conjunto de dados concentrava-se nas informações de monitoramento das máquinas com as quais as empresas mais se preocupavam. A partir desse conjunto de dados, conseguimos representar graficamente KPIs críticos, como taxa de alimentação, velocidade do eixo e taxa de transferência − o básico necessário para otimizar programas e calcular o OEE. Os dados foram responsáveis por parâmetros suficientes para conduzir uma análise relevante para a atividade no chão de fábrica e também foram consistentes com os tipos de análise de manufatura que vemos nossos clientes usar todos os dias.

Para realizar a análise, usamos bibliotecas Python populares como PANDAS e Sci Kit Learn no Notebook Jupyter. Para as equipes de ciência de dados, é possível fazer essa mesma análise no idioma que você preferir e ela pode ser executada no Data Studio do Microsoft Azure, no SageMaker da AWS ou em qualquer ambiente de análise usado em suas operações.

Obtendo os dados

Obter os dados da Tulip foi fácil. Os dados foram armazenados em tabelas sem codificação, que continham os parâmetros exatos de que precisávamos.

Começar foi tão simples quanto baixar um CSV, importá-lo para o nosso notebook e criar um quadro de dados. Demorou 5 minutos e duas linhas de código.

Imagem da plataforma da Tulip para demonstrar que para a preparação dos dados de monitoramento das máquinas foram necessárias duas linhas de código
Para a preparação dos dados de monitoramento das máquinas foram necessárias duas linhas de código.

Gráfico da taxa de alimentação, velocidade do fuso e peças produzidas ao longo do tempo

O próximo passo após organizar o arquivo .csv nos quadros de dados foi criar gráficos para visualizar o que estava acontecendo no chão de fábrica.

Para começar, criamos um gráfico mapeando três partes críticas de dados de produção: velocidade do fuso, taxa de avanço e peças produzidas ao longo do tempo.

Essas três métricas são críticas para otimizar a produção e garantir a integridade dos ativos a longo prazo. Como duas máquinas idênticas que executam o mesmo programa na mesma fábrica podem ter OEE significativamente diferente, é importante medir exatamente o que acontece durante uma corrida de produção.

Imagem de um gráfico das métricas de produção da velocidade do fuso, taxa de avanço e peças produzidas ao longo do tempo, para demonstrar como a plataforma da Tulip permite o uso de machine learning e análise de Big Data na manufatura
Gráficos das métricas de produção da velocidade do fuso, taxa de avanço e peças produzidas ao longo do tempo.

Este gráfico fornece uma boa visão geral da produção durante essa janela de 24 horas (as linhas são bastante irregulares porque usamos uma amostragem relativamente pequena de 20 minutos; amostragens mais rápidas produzem gráficos ruidosos). Na maioria das vezes, elas mostram o que você deveria esperar dos dados da máquina. Em quase todos os pontos, há uma forte correlação entre a velocidade do eixo e a taxa de avanço, entre a velocidade do eixo:velocidade de avanço e as peças produzidas.

No entanto, também existem alguns pontos em que a taxa de alimentação é inversamente relacionada às peças produzidas, enquanto a velocidade do eixo permanece a mesma. Existem até dois casos em que a velocidade do eixo e a taxa de alimentação são zero, mas, mesmo assim, ainda existem peças produzidas.

Por fim, este gráfico gera mais perguntas do que respostas. Mas ele funciona. Ele identifica áreas para uma investigação mais aprofundada e permite mergulhar mais fundo nos dados.

Taxa de alimentação vs. peças fabricadas

O gráfico anterior nos alertou para o fato de que a taxa de alimentação nem sempre estava correlacionada com as peças produzidas. O próximo passo foi, portanto, representar graficamente as peças feitas com base na taxa de alimentação para entender melhor essa relação.

Imagem com a representação gráfica da taxa de alimentação em relação às peças fabricadas, para demostrar como a plataforma da Tulip permite o uso de machine learning e análise de Big Data na manufatura
Representação gráfica da taxa de alimentação em relação às peças fabricadas.

Neste gráfico, podemos ver que as peças fabricadas começam a subir vertiginosamente quando a taxa de alimentação chega a 1400. O número de peças fabricadas continua a aumentar à medida que a taxa de alimentação se aproxima de 1600.

O que este gráfico revela visualmente (que as peças produzidas parecem se agrupar entre 5 e 10 a uma taxa de alimentação de aproximadamente 1600), pode ser confirmado por uma análise mais aprofundada. (Ou, se você usou dados para este programa coletados ao longo de muitos dias, você pode usar regressões lineares para prever as peças produzidas em uma determinada taxa de avanço para melhor balanceamento de linha).

Nada neste gráfico é surpreendente. O que é bom. No entanto, isso significa que precisamos nos aprofundar ainda mais para entender melhor o que está acontecendo no chão de fábrica.

Usando algoritmos de detecção de discrepância para encontrar anomalias

O próximo passo foi representar graficamente a velocidade do fuso em relação à taxa de alimentação. Isso nos permitiu entender exatamente quais configurações estão correlacionadas com a maior taxa de alimentação.

Imagem da representação gráfica da velocidade do fuso versus a taxa de alimentação.
Representação gráfica da velocidade do fuso vs. taxa de alimentação.

Durante o dia de produção, as altas velocidades do fuso estão altamente correlacionadas com as altas taxas de alimentação. Novamente, isso é de se esperar.

Mas notamos vários pontos que não estavam em conformidade com esses padrões. A pergunta que fizemos nesse momento foi: "até que ponto existem discrepâncias estatísticas neste gráfico”?

A resposta a esta pergunta é importante por dois motivos. Por um lado, essas discrepâncias podem revelar comportamentos ou processos no chão de fábrica que afetam diretamente a produção. Em outras palavras, localizar e entender esses pontos de dados pode se traduzir diretamente em maior produtividade. Segundo, os valores discrepantes podem prejudicar o desempenho de muitos algoritmos de machine learning. Portanto, determinar se precisamos ou não excluir esses pontos de nossa análise é fundamental para retornar insights precisos.

Para determinar se nosso conjunto de dados incluía ou não as discrepâncias, usamos um método chamado Isolation Forest (você pode ler mais sobre esta técnica aqui).

Imagem de dois gráficos paralelos para demonstrar a detecção de dados discrepantes com o uso da técnica de isolation forests para o monitoramento de máquinas para análises de big data.
Os concordantes exigem mais partições para isolar do que os discrepantes. Isso faz das florestas aleatórias (à direita) uma ótima ferramenta para detecção de discrepantes. Fonte: towardsdatascience.com

A Isolation Forest localizou 5 pontos de dados que considerou ser discrepantes.

Isso não apenas nos forneceu um conjunto de dados mais limpo, como também permitiu fazemos uma pergunta crítica: o que estava acontecendo com essas máquinas nesses pontos?

Representação gráfica das discrepâncias a tempo de revelar as causas principais

A etapa final deste experimento foi mapear nossas anomalias de volta ao nosso gráfico inicial do dia de produção.

Vejamos primeiro as três linhas que ocorreram logo após às 03:00. Se compararmos isso com nosso gráfico inicial (taxa de alimentação, velocidade do fuso, peças produzidas ao longo do tempo), veremos que todas essas três linhas de discrepâncias coincidem com uma queda vertiginosa das três métricas.

Imagem de um gráfico de mapeando as discrepâncias no tempo
Mapeando as discrepâncias no tempo

A questão é: o que aconteceu então? É importante ressaltar que a representação gráfica desses eventos dessa maneira permite fazer perguntas mais bem informadas. Quem foi o operador? Qual programa estava sendo executado? Quais eram as condições na fábrica? Quem foi o supervisor de turno? Uma mudança foi realizada corretamente? A ferramenta certa estava disponível? Houve algum problema mecânico?

Essas são algumas das muitas perguntas que as empresas precisam responder diariamente para tornar suas operações mais lucrativas tanto quanto for possível.

Além disso, com o monitoramento de máquinas da Tulip, você não precisa limitar sua análise a essas três variáveis. Com a Tulip, você pode rastrear outros parâmetros que adicionarão nuances e perspectivas a esses parâmetros comuns.

Conclusões

Essa análise é simplista. Não há razão para fingir o contrário.

Mas, realizando análises simples de machine learning nos dados de monitoramento de máquinas, você determina quais perguntas são as melhores a serem feitas a qualquer momento.

Esse é o valor real de aumentar o monitoramento das máquinas com machine learning. Os algoritmos podem ajudá-lo a encontrar ordem em conjuntos de dados massivos. Mas, em última análise, eles dão aos engenheiros a oportunidade de isolar e resolver problemas difíceis de manufatura em menos tempo e com mais certeza do que nunca.

Para concluir, há um ponto que gostaríamos de enfatizar.

Conseguimos realizar essa análise em poucas horas. Como as tabelas da Tulip coletam e organizam dados de uma maneira acessível, não houve necessidade de criar tabelas com SQL, e não precisamos gastar muito tempo realizando o trabalho meticuloso da engenharia de recursos.

Esse tipo de análise não exige um mestrado em ciência de dados ou um software caro. Um de nossos engenheiros a realizou em poucas horas, usando bibliotecas de análise padrão da indústria, disponíveis publicamente. Uma equipe de negócios, analistas e cientistas de dados trabalhando com conjuntos de dados personalizados coletados pela Tulip pode ir muito além ao mesmo tempo.

O que pretendíamos aqui não era produzir uma análise definitiva, mas mostrar como é fácil criar insights que fazem a diferença.

Fonte: Tulip

TREINAMENTOS

Workshop Prático de Indústria 4.0 e IIOT

O workshop visa apresentar como os conceitos de Indústria 4.0 e IIOT podem ser aplicados na prática, por profissionais da indústria, sem necessidade de conhecimento ou experiência prévia em tecnologias de automação e informação. Os participantes poderão colocar em prática os conceitos criando seus próprios aplicativos para manufatura.

Deixe uma resposta

× Como posso te ajudar?