Parecer Técnico – Análise de Incidente |
Gerente de operações Linx | @Maria Angélica | Versão | 1.0.0 |
---|---|---|---|
Elaborado por | Data da elaboração |
| |
Revisado por | Data da revisão |
|
Histórico
Versão | Data | Autor | Descrição |
---|---|---|---|
1.0.0 | Criação do documento de parecer técnico |
Objetivo
Documento objetiva esclarecer incidentes ocorridos no ambiente de produção em , onde as operações de geração do vale troca estavam apresentando PDV OFFLINE de forma intermitente. Este cenário estava causando impacto na operação com a inviabilização de diversas trocas e foi montada uma war room em para investigar os casos ocorridos no dia anterior e acompanhar a operação ao longo da manhã.
Problema reportado
Fomos acionados diante do agravamento dos casos de trocas não efetivadas devido a falha apresentada no PDV. Segue caso aberto:
BIGRETAIL-94319 PDV-OFFLINE ( NO VALE TROCA )
Escopo da análise:
Análise dos logs disponibilizados do PDV 2 da Loja 1000 do dia 30/11/2023.
Adicionalmente em sala foram disponibilizados os logs do integrador do safe no PDV e do ProcTrans para compor a análise.
Análise:
PDV - Em análise foi verificado que a operação no PDV era interrompida diante de um timeout na consulta da transação ao realizar uma tentativa de troca com cupom.
Mesmo sendo reportada ocorrência de intermitência no momento do fluxo onde é feita comunicação com o serviço do SAFE, não tivemos evidenciada nos logs disponibilizados.
Proctrans - Em análise verificamos uma diferença no horário do início do processamento das mensagens de consulta de transação para efetuar a troca e o envio pelo PDV.
Notamos que no exemplo acima, a mensagem começou a ser processada 34 segundos depois do estouro do timeout do PDV que é de 10 segundos.
Ao longo do dia tivemos várias ocorrências com o mesmo cenário observadas no log do ProcTrans.
Conclusão
As evidências analisadas do dia 30/11/2023 e a normalização da operação no dia seguinte (01/12/2023) sem intervenção na aplicação, denotam uma lentidão excessiva no serviço do ProcTrans que impactou na operação.
Foram feitas observações em sala em relação a distribuição das aplicações (serviços) nos servidores. Hoje a Obramax utiliza muitas aplicações em um mesmo servidor que podem contribuir na oscilação de um serviço devido a sobrecarga do outro.
Ações imediatas
Linx - enviará documento com as recomendações de distribuição dos serviços para um ambiente mais estável.
Obramax - seguirá acompanhando possíveis oscilações e vai avaliar possíveis reestruturação.
Recomendações / Próximos passos