Análise de e-mail rebatizada

Atualmente, tenho problemas para capturar, analisar e classificar emails rejeitados. Eu tenho o básico configurado bem e faz o que eu quero, o que é bom … o problema é que parece não haver um padrão para as mensagens retornadas no e-mail rejeitado.

Por exemplo, alguns servidores retornam o código de erro conforme especificado pelo RFC 1893 e eu posso nove vezes em dez escolher isso por meio de uma simples coisa regex. Mas às vezes os servidores apenas respondem dizendo que o e-mail saltou, sem qualquer motivo ou motivo totalmente diferente de qualquer padrão.

Então, acho que a minha pergunta é que alguém conseguiu alguma solução para isso? Eu não quero estar procurando por um bilhão e uma das possíveis strings no e-mail retornado para ser honesto. No entanto, seria bom não ter que recorrer a “razão desconhecida” ou algo parecido.

Alguém mais teve alguma sorte com isso ou idéias? Felicidades

Você pode configurar o sistema para que um operador analise as mensagens, selecione strings e depois categorize a partir daí. Eventualmente, você poderia esperar obter 1 em 10 para 1 em 100 ou 1 em 1.000. Sempre haverá sempre mais casos de canto aqui.

Também não é uma resposta definitiva, mas em um espírito semelhante à resposta de Kyle, você poderia usar um filtro de spam baseado em bayes / token para “aprender” sobre mensagens de retorno e, em seguida, encaminhá-las automaticamente para o que quiser para lidar com o correio recomeado.

Em outras palavras, você tem uma conta onde você treina spamassassin ou spamprobe ou o que quer que um monte de mensagens de retorno diferentes (e apenas mensagens de retorno) são “lixo”, então deixe esse sistema de spam ser uma segunda linha de filtragem depois do que você tiver desenvolvido.

Então, digamos que sua solução, o primeiro filtro, encontra 90% das mensagens rejeitadas. Você faz o seu sistema fazer o que faz normalmente com saltos e, em seguida, guarde-os em uma checkbox de correio de rejeição, que é periodicamente verificada por spamassasin / spamprobe para aprender essas mensagens como “lixo”.

Você também tem spamassassin ou spamprobe ou o que quer que seja como um segundo filtro (execute qualquer coisa que não faça a bandeira como um salto) faça sua própria estimativa de rebote, e o que considere “lixo” (porque você treinou para pense em bounce = junk), você também rooteia para o seu programa etc.

Ainda precisa de um pouco de revisão manual, mas, em teoria, deve melhorar e melhorar ao longo do tempo à medida que você confia no aprendizado do sistema de spam para explicar os casos de ponta.

Estamos enfrentando o mesmo problema, mas não encontraram nenhuma solução “perfeita”. eu acho que você

  • pode usar algum provedor de serviços (com uma API de e-mail adequada) – isso permitiria “terceirizar” o problema e dar-lhe uma alta taxa de detecção ou
  • use algum filtro simples para pegar pelo menos (digamos) 80% dos rebotes. Na nossa configuração , isso foi suficiente para manter nosso database em um estado razoável.
    Intereting Posts