SpamBayes


SpamBayes es un filtro de spam bayesiano escrito en Python que utiliza técnicas establecidas por Paul Graham en su ensayo "Un plan para el spam". Posteriormente ha sido mejorado por Gary Robinson y Tim Peters , entre otros.

La diferencia más notable entre un filtro bayesiano convencional y el filtro utilizado por SpamBayes es que hay tres clasificaciones en lugar de dos: spam, no spam (llamado ham en SpamBayes) y no seguro. El usuario entrena un mensaje como jamón o spam; al filtrar un mensaje, los filtros de spam generan una puntuación para jamón y otra para spam.

Si la puntuación de spam es alta y la puntuación de jamón es baja, el mensaje se clasificará como spam. Si el puntaje de spam es bajo y el puntaje de ham es alto, el mensaje se clasificará como ham. Si las puntuaciones son altas o bajas, el mensaje se clasificará como inseguro.

Este enfoque conduce a un bajo número de falsos positivos y falsos negativos , pero puede dar lugar a una serie de dudas que requieren una decisión humana.