SpamBayes es un filtro de spam bayesiano escrito en Python que utiliza técnicas expuestas por Paul Graham en su ensayo "Un plan para el spam". Posteriormente ha sido mejorado por Gary Robinson y Tim Peters , entre otros.
Autor (es) original (es) | Tim Peters |
---|---|
Versión inicial | Septiembre de 2002 |
Lanzamiento estable | 1.0.4 / marzo de 2005 |
Versión de vista previa | 1.1a6 / 6 de diciembre de 2008 [1] |
Escrito en | Pitón |
Plataforma | Multiplataforma |
Disponible en | Solo en ingles |
Tipo | Filtrado de correo electrónico |
Licencia | PSFL |
Sitio web | spambayes.sourceforge.net |
La diferencia más notable entre un filtro bayesiano convencional y el filtro utilizado por SpamBayes es que hay tres clasificaciones en lugar de dos: spam, no spam (llamado jamón en SpamBayes) e inseguro. El usuario entrena un mensaje como jamón o spam; al filtrar un mensaje, los filtros de spam generan una puntuación para ham y otra para spam.
Si la puntuación de spam es alta y la puntuación de jamón es baja, el mensaje se clasificará como spam. Si la puntuación de spam es baja y la puntuación de jamón es alta, el mensaje se clasificará como jamón. Si las puntuaciones son altas o bajas, el mensaje se clasificará como inseguro.
Este enfoque conduce a un número reducido de falsos positivos y falsos negativos , pero puede dar lugar a una serie de inseguridades que requieren una decisión humana.
Filtrado web
Se ha trabajado en la aplicación de SpamBayes para filtrar el contenido de Internet a través de un servidor web proxy . [2] [3]