Apache SpamAssassin

Apache SpamAssassin es un programa informático utilizado para el filtrado de correo no deseado . Utiliza una variedad de técnicas de detección de spam, que incluyen DNS y técnicas de suma de comprobación difusa , filtrado bayesiano , programas externos, listas negras y bases de datos en línea. Se lanza bajo Apache License 2.0 y es parte de Apache Foundation desde 2004.

Apache SpamAssassin

Desarrollador (es)	Fundación de software Apache ^[1]
Versión inicial	20 de abril de 2001 ; hace 20 años (20 de abril de 2001 )

Lanzamiento estable	3.4.6 / 12 de abril de 2021 ; Hace 2 meses ^[2] ( 04/12/2021 )

Repositorio	Repositorio de SpamAssassin
Escrito en	Perl , C
Sistema operativo	Multiplataforma
Tipo	Filtro de spam
Licencia	Licencia Apache 2.0
Sitio web	spamassassin .apache .org

El programa se puede integrar con el servidor de correo para filtrar automáticamente todo el correo de un sitio. También puede ser ejecutado por usuarios individuales en su propio buzón y se integra con varios programas de correo . Apache SpamAssassin es altamente configurable; si se usa como un filtro para todo el sistema, aún se puede configurar para admitir las preferencias de cada usuario.

Historia

Apache SpamAssassin fue creado por Justin Mason, quien había mantenido una serie de parches contra un programa anterior llamado filter.plx por Mark Jeftovic, que a su vez se inició en agosto de 1997. Mason reescribió todo el código de Jeftovic desde cero y cargó la base de código resultante en SourceForge el 20 de abril de 2001. ^[3]

En el verano de 2004, el proyecto se convirtió en un proyecto de la Apache Software Foundation y luego se renombró oficialmente como Apache SpamAssassin . ^[4]

El lanzamiento de SpamAssassin 3.4.2 en septiembre de 2019 fue el primero en más de tres años, pero los desarrolladores dicen que "el proyecto ha adquirido un nuevo grupo de desarrolladores y está avanzando de nuevo". ^[5]

En diciembre de 2019, se lanzó la versión 3.4.3 de SpamAssassin.

En abril de 2021, se lanzó la versión 3.4.6 de SpamAssassin. Se anunció que el desarrollo de la versión 4.0.0 se convertiría en el foco del proyecto. ^[2]

Métodos de uso

Apache SpamAssassin es una aplicación basada en Perl ( Mail :: SpamAssassin en CPAN ) que generalmente se usa para filtrar todo el correo entrante para uno o varios usuarios. Se puede ejecutar como una aplicación independiente o como un subprograma de otra aplicación (como Milter , SA-Exim , Exiscan , MailScanner , MIMEDefang , Amavis ) o como un cliente ( spamc ) que se comunica con un demonio ( spam ). El modo de operación cliente / servidor o integrado tiene beneficios de rendimiento, pero bajo ciertas circunstancias puede introducir riesgos de seguridad adicionales.

Normalmente, la variante de la aplicación se configura en un programa de filtro de correo genérico , o se llama directamente desde un agente de usuario de correo que lo admita, siempre que llega un nuevo correo. Los programas de filtro de correo como procmail se pueden hacer para canalizar todo el correo entrante a través de Apache SpamAssassin con un ajuste a un usuario. archivo procmailrc .

Operación

Apache SpamAssassin viene con un gran conjunto de reglas que se aplican para determinar si un correo electrónico es spam o no. La mayoría de las reglas se basan en expresiones regulares que se comparan con el cuerpo o los campos de encabezado del mensaje, pero Apache SpamAssassin también emplea otras técnicas de lucha contra el spam. Las reglas se denominan "pruebas" en la documentación de SpamAssassin.

Cada prueba tiene un valor de puntuación que se asignará a un mensaje si coincide con los criterios de la prueba. Las puntuaciones pueden ser positivas o negativas, con valores positivos que indican "spam" y "ham" negativo (mensajes que no son spam). Un mensaje se compara con todas las pruebas y Apache SpamAssassin combina los resultados en una puntuación global que se asigna al mensaje. Cuanto mayor sea la puntuación, mayor será la probabilidad de que el mensaje sea spam.

Apache SpamAssassin tiene un umbral de puntuación interno (configurable) para clasificar un mensaje como spam. Por lo general, un mensaje solo se considerará spam si coincide con varios criterios; Por lo general, igualar una sola prueba no será suficiente para alcanzar el umbral.

Si Apache SpamAssassin considera que un mensaje es spam, se puede volver a escribir. En la configuración predeterminada, el contenido del correo se adjunta como un archivo adjunto MIME , con un breve extracto en el cuerpo del mensaje y una descripción de las pruebas que dieron como resultado que el correo se clasificara como spam. Si la puntuación es inferior a la configuración definida, de forma predeterminada, la información sobre las pruebas aprobadas y la puntuación total se sigue agregando a los encabezados de correo electrónico y se puede utilizar en el posprocesamiento para acciones menos graves, como etiquetar el correo como sospechoso.

Apache SpamAssassin permite una configuración por usuario de su comportamiento, incluso si se instala como un servicio para todo el sistema; la configuración se puede leer desde un archivo o una base de datos. En su configuración, los usuarios pueden especificar las personas cuyos correos electrónicos nunca se consideran spam o cambiar las puntuaciones de determinadas reglas. El usuario también puede definir una lista de idiomas en los que desea recibir correo, y Apache SpamAssassin asigna una puntuación más alta a todos los correos que parecen estar escritos en otro idioma.

Apache SpamAssassin se basa en la heurística (reconocimiento de patrones) y dicho software muestra falsos positivos y falsos negativos.

Métodos de filtrado basados en red

Apache SpamAssassin también admite:

Listas negras basadas en DNS y listas blancas basadas en DNS
Filtros de detección de spam basados en sumas de verificación difusas, como Distributed Checksum Clearinghouse , Vipul's Razor y los complementos de Cloudmark Authority (comercial)
Sellos de correo electrónico Hashcash basados en prueba de trabajo
Marco de políticas del remitente y correo identificado con DomainKeys
Listas negras de URI como SURBL o URIBL que rastrean sitios web de spam

Se pueden agregar más métodos de manera razonablemente fácil escribiendo un complemento de Perl para Apache SpamAssassin.

Filtrado bayesiano

Apache SpamAssassin refuerza sus reglas a través del filtrado Bayesiano donde un usuario o administrador "alimenta" ejemplos de buenos (jamones) y malos (spam) en el filtro para aprender la diferencia entre los dos. Para este propósito, Apache SpamAssassin proporciona la herramienta de línea de comandos sa-learn , al que se le puede indicar que aprenda un solo correo o un buzón completo como ham o spam.

Normalmente, el usuario moverá el spam no reconocido a una carpeta separada y luego ejecutará sa-learn en la carpeta de correo no deseado y en la carpeta de correo no deseado por separado. Alternativamente, si el agente de usuario de correo lo admite, Se puede llamar a sa-learn para correos electrónicos individuales. Independientemente del método utilizado para realizar el aprendizaje, la prueba bayesiana de SpamAssassin ayudará a calificar los correos electrónicos futuros en función de este aprendizaje para mejorar la precisión.

Licencia

Apache SpamAssassin es un software gratuito / de código abierto , con licencia de Apache License 2.0 . Las versiones anteriores a la 3.0 tienen doble licencia bajo la Licencia Artística y la Licencia Pública General GNU .

sa-compilar

sa-compilees una utilidad distribuida con Apache SpamAssassin que compila un conjunto de reglas de SpamAssassin en un autómata finito determinista que permite a Apache SpamAssassin utilizar la potencia del procesador de manera más eficiente.

Prueba de Apache SpamAssassin

Apache SpamAssassin está diseñado para activarse en GTUBE , una cadena de 68 bytes similar al archivo de prueba EICAR del antivirus . Si esta cadena se inserta en un mensaje con formato RFC 5322 y se pasa a través del motor Apache SpamAssassin, Apache SpamAssassin se activará con un peso de 1000.

Ver también

Técnicas anti-spam

Notas

^ http://svn.apache.org/repos/asf/spamassassin/trunk/CREDITS
^ a b "SpamAssassin: noticias y anuncios" . spamassassin.apache.org . Consultado el 12 de abril de 2021 .
^ "Prehistoria de SpamAssassin" . Fundación Apache . Consultado el 19 de diciembre de 2018 .
^ "Estado de incubación del proyecto SpamAssassin" . Fundación Apache . Consultado el 19 de diciembre de 2018 .
^ "SpamAssassin ha vuelto" . LWN.net . Consultado el 19 de diciembre de 2018 .

Referencias

McDonald, Alistair (27 de septiembre de 2004). SpamAssassin: una guía práctica para la integración y la configuración (1ª ed.). Packt Publishing . pag. 240. ISBN 978-1-904811-12-1.
Schwartz, Alan (julio de 2004). SpamAssassin (1ª ed.). O'Reilly Media . pag. 207 . ISBN 978-0-596-00707-2.

enlaces externos

Página web oficial
Apache SpamAssassin Wiki
Wiki de actualizaciones de reglas de Apache SpamAssassin Actualización automática de Apache SpamAssassin
KAM.cf Conjunto de reglas KAM para Apache SpamAssassin

[1] ttp://svn.apache.org/repos/asf/spamassassin/trunk/CREDITS

[newspage-2] "SpamAssassin: noticias y anuncios" . spamassassin.apache.org . Consultado el 12 de abril de 2021 .

[3] "Prehistoria de SpamAssassin" . Fundación Apache . Consultado el 19 de diciembre de 2018 .

[4] "Estado de incubación del proyecto SpamAssassin" . Fundación Apache . Consultado el 19 de diciembre de 2018 .

[5] "SpamAssassin ha vuelto" . LWN.net . Consultado el 19 de diciembre de 2018 .

[1]