O Que Um Pastor Pode Ensinar Ao Mercado De Telecomunicações?

O Que Um Pastor Pode Ensinar Ao Mercado De Telecomunicações?
🐣 Contexto

Em algum momento de 2024, tive uma conversa em grupo fora do ambiente de trabalho — já não lembro exatamente com quem — sobre a importância dos conhecimentos básicos das disciplinas acadêmicas. Discutíamos como esse entendimento pode nos ajudar a escolher melhor as ferramentas ideais para resolver os problemas do dia a dia. Confesso que fui vencido pela maioria do grupo.

Algum tempo depois, em uma conversa com colegas de trabalho sobre uma campanha de marketing, nos deparamos com um impasse: como calcular um dos ganhos gerados pela solução EyON, com base nos números que havíamos alcançado? Algumas pessoas sugeriram um processo de conversão direta das métricas em ganhos. No entanto, ao me aprofundar no problema, percebi que se tratava de algo mais complexo do que simples conversões numéricas. Estávamos, na verdade, diante de um problema digno de um pastor — e seu nome era Thomas Bayes.

Também percebi que talvez eu não estivesse tão errado naquela discussão em grupo, tempos atrás.

Explicando a brincadeira com o título deste artigo: Thomas Bayes foi um ministro presbiteriano cuja atuação como pastor coexistia com um profundo interesse pela matemática. Em um trabalho chamado "An Essay Towards Solving a Problem in the Doctrine of Chances" ele apresentou diversos teoremas sobre probabilidade condicional, que hoje formam a base do que conhecemos como o Teorema de Bayes (Bayes's Theorem).

🧠 Teorema de Bayes

O Teorema de Bayes é a base do que irei apresentar aqui. Para começar, vou explicar brevemente o que é esse teorema e por que ele é tão relevante. O Teorema de Bayes descreve a probabilidade de um evento com base em informações prévias sobre condições relacionadas a esse evento. Uma das principais vantagens desse teorema, que dá vida a fórmula, é que ele permite calcular probabilidades utilizando apenas o conhecimento de outras probabilidades — ou seja, não é necessário conhecer a amostra original que gerou esses dados. A fórmula é a seguinte:

$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} $$

Onde:

  • P(A|B) é a probabilidade de A ser verdadeiro dado que B ocorreu (probabilidade posterior).
  • P(B|A) é a probabilidade de B ocorrer dado que A é verdadeiro (verossimilhança).
  • P(A) é a probabilidade a priori de A> ocorrer.
  • P(B) é a probabilidade de B ocorrer

Podemos também escrever da seguinte forma substituindo P(B) por:

$$ P(B) = P(B∣A)⋅P(A)+P(B∣¬A)⋅P(¬A) $$

Isso nos daria:

$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B∣A)⋅P(A)+P(B∣¬A)⋅P(¬A)} $$

Onde:

  • P(B∣A)⋅P(A) representa a chance de B ocorrer se A for verdadeiro, ponderada pela chance de A ocorrer.
  • P(B∣¬A)⋅P(¬A) representa a chance de B ocorrer se A não for verdadeiro, ponderada pela chance de A não ocorrer

Apesar de a fórmula não exigir o uso direto de amostras para o cálculo, na primeira vez em que a vi, confesso que fiquei bem perdido. Para conseguir avançar no entendimento, precisei recorrer a números reais e a um diagrama visual em forma de árvore. Bora?

Vou utilizar de um exemplo muito tradicional e utilizado nas graduações para demostração.

📘 Exemplo - Detectar Doença

Imagine um teste para detectar uma doença. Sabemos o seguinte:

  • Apenas 1% da população tem essa doença.
  • Se uma pessoa tem a doença, o teste acerta em 99% dos casos (sensibilidade).
  • Se a pessoa não tem a doença, o teste erra em 5% dos casos, ou seja, 5% dos saudáveis testam positivo (falso positivo).

Para a maioria das pessoas que não conhecem ou não utilizam do Teorema de Bayes, a resposta mais comum ao ver um teste positivo, especialmente se o teste tem 99% de precisão — seria algo como:

“Se o teste deu positivo e é 99% confiável, então é quase certo que está doente.

Me manda uma mensagem no LinkedIn se essa foi a sua resposta ou não 😅.

Essa interpretação é intuitiva, mas enganosa, pois ignora um fator fundamental: a probabilidade base (neste caso, a raridade da doença). Muitas pessoas não consideram o impacto da baixa prevalência da condição ao interpretar os resultados, o que leva a uma superestimação drástica do risco real.

Esse erro é conhecido como falácia da taxa base, e o Teorema de Bayes é justamente o antídoto lógico para evitá-lo. Continuando o exemplo e utlizando números para demonstrar em que ponto está o erro.

Vamos aplicar isso a 10,000 pessoas:

  1. Doentes: 1% de 10,000 = 100 pessoas.
    • Desses, 99% testam positivo → 99 positivos verdadeiros.
    • 1% testam negativo → 1 falso negativo.
  2. Saudáveis: 99% de 10,000 = 9,900 pessoas.
    • 5% testam positivo495 falsos positivos.
    • 95% testam negativo → 9,405 negativos verdadeiros.

Total de testes positivos:

  • 99 (positivos verdadeiros) + 495 (falsos positivos) = 594 positivos.

Probabilidade de uma pessoa realmente estar doente dado que o teste deu positivo:

  • 99 verdadeiros positivos / 594 totais positivos ≈ 16.7%.

Ou seja, mesmo com um teste “bom”, a chance de uma pessoa estar realmente doente, se o teste der positivo, é de apenas 16.7% — por causa da raridade da doença. Notem como é muito menor a probabilidade de se estar doente, quando comparado com a resposta muito intuitiva de 99% baseado na sensibilidade do teste.

Uma forma de visualizarmos a lógica aplicada nesse cálculo seria através da árvore de probabilidades, conforme imagem abaixo:

Probability Tree - Disease Test

O Motivo para termos 16.7% é por que queremos saber qual a chance de doente depois de sabermos que foi positivo o teste, logo, precisamos saber as chances baseado em TODAS as chances de dar positivo.

Além da lógica que aplicamos, podemos pegar o caminho de aplicar a fórmula anterior, desconsiderando os números absolutos e substituindo apenas pelos percentuais. ficaria assim:

$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} $$
$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B∣A)⋅P(A)+P(B∣¬A)⋅P(¬A)} $$

Sendo:

  • P(A|B) = P(Doente | Positivo) - Probabilidade de doente dado que o teste deu positivo
  • P(B|A) = P(Positivo | Doente) = 99% - Probabilidade de positivo dado que está doente
  • P(A) = P(Doente) = 1% - Probabilidade de estar doente
  • P(B) = P(Positivo) = P(B∣A)⋅P(A)+P(B∣¬A)⋅P(¬A) - Probabilidade de testar positivo
  • P(B∣A) = P(Positivo | Doente) = 99% - representa a chance de Positivo se estiver doente, na fórmula multiplicamos por P(A) = P(Doente) para ponderar a chance de estar doente
  • P(B∣¬A) = P(Positivo|Não Doente) = 5% - representa a chance de Positivo se não estiver doente, na fórmula multiplicamos por P(¬A) = P(Não Doente) para ponderar a chance de não estar doente

Substituindo temos:

$$ P(A|B) = \frac{0.99 \cdot 0.01}{0.99⋅0.01+0.05⋅0.99} $$
$$ P(A|B) = \frac{0.0099}{0.0099+0.0495} $$
$$ P(A|B) = \frac{0.0099}{0.0594} $$
$$ P(A|B) = 0.16666 $$
$$ P(A|B) = 16.7 \% $$

Notem que para calcularmos a probabilidade utilizando a fórmula não precisamos utilizar números de amostras como no caso anterior que consideramos um total de 10,000 pessoas. É muito mais rápido e prático quando sabemos como abordar a situação

O Padre em Telecomunicação

Seguindo com a proposta do título desse artigo, vamos utilizar desse mesmo teorema no campo de telecomunicações. Em outro artigo do meu blog, Decifrando o Churn: Entendendo, Medindo e Combatendo a Perda de Clientes, eu detalho sobre o que é, como calcular e a importância de se ter esse número sobre controle. Por isso, aqui não vou me aprofundar nos seus conceitos e irei direto para a prática do Teorema de Bayes.

📘 Exemplo: Churn em redes FTTx com base em falhas técnicas

Suponha que uma operadora de fibra analisa o churn e observa o seguinte:

  • 5% dos clientes cancelam por mês: P(A) = P(Churn) = 0.05
  • 20% dos clientes que vão cancelar tiveram falhas frequentes na ONU nos últimos 30 dias: P(B|A) = P(Falha | Churn) = 0.20
  • Entre os que não cancelam, apenas 2% tiveram falhas: P(B|¬A)P(Falha | Sem Churn) = 0.02

Pergunta:

Se um cliente apresentou falhas frequentes, qual é a probabilidade de ele cancelar o serviço no próximo mês? O que queremos saber é P(A|B) = P(Churn | Falha), a probabilidade de churn dado que o cliente teve falhas nos últimos 30 dias.

Notem que aqui iremos utilizar apenas as porcentagens, mas para facilitar vou apresentar a árvore de probabilidades.

Árvore de Probabilidades

Probability Tree - Churn and Fault

Etapa 1: Dados

  • P(A) = P(Churn) = 0.05
  • P(¬A) = P(Sem Churn) = 0.95
  • P(B|A) = P(Falha | Churn) = 0.20
  • P(B|¬A) = P(Falha | Sem Churn) = 0.02
  • Queremos: P(Churn | Falha)

Etapa 2: Aplicar o Teorema de Bayes

$$ P(Churn|Falha) = \frac{P(Falha | Churn) \cdot P(Churn)}{P(Falha)} $$

Calculando P(Falha):

$$ P(Falha) = P(Falha | Churn)⋅P(Churn)+P(Falha | Não Churn)⋅P(Não Churn) $$
$$ P(Falha) = 0.20⋅0.05+0.02⋅0.95 $$
$$ P(Falha) = 0.029 $$

Agora calculamos P(Churn | Falha):

$$ P(Churn|Falha) = \frac{0.20 \cdot 0.05}{0.029} $$
$$ P(Churn|Falha) = \frac{0.01}{0.029} $$
$$ P(Churn|Falha) ≃ 0.3448 $$
$$ P(Churn|Falha) ≃ 34.48 \% $$

Resultado - Churn em redes FTTx com base em falhas técnicas:

Se um cliente teve falhas frequentes na ONU, a chance de ele cancelar no próximo mês é de ≈34.48%, muito maior que os 5% iniciais.

📘 Exemplo: Churn em redes FTTx com base em SLA não cumprido:

Outro exemplo de possível abordagem seria trabalhar com os dados de cancelamentos e SLAs não correspondidos, por exemplo, extrapolando 8h de interrupção máxima prevista em contrato.

Suponha que uma operadora de fibra analisa o churn e observa o seguinte:

  • 3% dos clientes cancelam por mês: P(A) = P(Churn) = 0.03
  • 40% dos clientes que vão cancelar tiveram interrupções no serviço de internet maiores que 8h nos últimos 30 dias: P(B|A) = P(Interrupção | Churn) = 0.40
  • Entre os que não cancelam, apenas 1% tiveram Interrupção: P(B|¬A) = P(Interrupção | Sem Churn) = 0.01

Pergunta:

Se um cliente apresentou interrupção maior que 8h, qual é a probabilidade de ele cancelar o serviço no próximo mês? O que queremos saber é P(A|B) = P(Churn | Interrupção), a probabilidade de churn dado que o cliente teve interrupção nos últimos 30 dias.

Como já estamos craques em utilizar as probabilidades, não vamos utilizar a árvore de probabilidades, bora direto para o cálculo!

Dados:

  • P(A) = P(Churn) = 0.03
  • P(¬A) = P(Sem Churn) = 0.97
  • P(B|A) = P(Interrupção | Churn) = 0.40
  • P(B|¬A) = P(Interrupção | Sem Churn) = 0.01
  • Queremos: P(Churn | Interrupção)

Queremos resolver:

$$ P(Churn|Interrupção) = \frac{P(Interrupção | Churn) \cdot P(Churn)}{P(Interrupção)} $$

Trocando B por sua equação correspondente

$$ P(Churn | Interrupção) = \frac{P(Interrupção | Churn) \cdot P(Churn)}{P(Interrupção | Churn)⋅P(Churn)+P(Interrupção | Sem Churn)⋅P(Sem Churn)} $$

Substituindo os valores

$$ P(A|B) = \frac{0.40 \cdot 0.03}{0.40⋅0.03+0.01⋅0.97} $$
$$ P(Churn | Interrupção) = \frac{0.0120}{0.0120+0.0097} $$
$$ P(Churn | Interrupção) = \frac{0.0120}{0.0217} $$
$$ P(Churn | Interrupção) = 0.5529 $$
$$ P(Churn | Interrupção) = 55.29 \% $$

Resultado - Churn em redes FTTx com base em SLA não cumprido:

Se um cliente teve Interrupções com Tempo Média de Recuperação acima das 8h, a chance de ele cancelar no próximo mês é de ≈55,29%, maior que os 40% considerando isoladamente a proporção daqueles que cancelaram e tiveram interrupção.

Conclusão e Interpretação prática:

Esse tipo de análise pode alimentar um modelo de risco de churn, permitindo priorizar ações proativas como:

  • Agendar manutenção preventiva
  • Garantir SLAs através de monitoramento de efetivo da infraestrura
  • Oferecer suporte técnico direcionado
  • Enviar ofertas de retenção personalizadas

Atualmente, muitos acreditam que apenas as inteligências artificiais serão capazes de resolver problemas relevantes, e não necessariamente complexos. Nem todo problema relevante é complexo e nem todo problema complexo é relevante. No entanto, é importante lembrar que as próprias AIs são construídas sobre fundamentos desenvolvidos por seres humanos, como o Cálculo, a Álgebra Linear e a Estatística. Ou seja, o raciocínio humano ainda é a base do pensamento computacional. A inteligência artificial é uma poderosa ferramenta, mas seu potencial depende diretamente da criatividade, da lógica e da intuição humanas que a guiaram e continuam a aprimorá-la.

🖩 Tools

Pensando em ajudar aqueles que se interessaram no assunto, segue uma ferramenta simples que desenvolvi para praticarem o Teorema de Bayes Calculadora Bayesiana.

embrace the journey and keep learning!