Apache SpamAssassin

Filtro antispam de correo electrónico de código abierto

Apache SpamAssassin
Desarrollador(es)Fundación de software Apache [1]
Lanzamiento inicial20 de abril de 2001 ; hace 23 años (2001-04-20)
Versión estable
4.0.1 [2]  / 29 de marzo de 2024 ; hace 6 meses (29 March 2024)
RepositorioRepositorio de SpamAssassin
Escrito enPerl , C
Sistema operativoMultiplataforma
TipoFiltro de spam
LicenciaLicencia Apache 2.0
Sitio webspamassassin.apache.org 

Apache SpamAssassin es un programa informático que se utiliza para filtrar correo no deseado . Utiliza una variedad de técnicas de detección de correo no deseado, incluidas técnicas de DNS y suma de comprobación difusa , filtrado bayesiano , programas externos, listas negras y bases de datos en línea. Se publica bajo la licencia Apache 2.0 y forma parte de la Fundación Apache desde 2004.

El programa se puede integrar con el servidor de correo para filtrar automáticamente todo el correo de un sitio. También lo pueden ejecutar usuarios individuales en su propio buzón de correo y se integra con varios programas de correo . Apache SpamAssassin es altamente configurable; si se utiliza como filtro para todo el sistema, se puede configurar para que admita las preferencias de cada usuario.

Historia

Apache SpamAssassin fue creado por Justin Mason, quien había mantenido una serie de parches contra un programa anterior llamado filter.plx de Mark Jeftovic, que a su vez se inició en agosto de 1997. Mason reescribió todo el código de Jeftovic desde cero y subió la base de código resultante a SourceForge el 20 de abril de 2001. [3]

En el verano de 2004, el proyecto se convirtió en un proyecto de la Apache Software Foundation y más tarde pasó a llamarse oficialmente Apache SpamAssassin . [4]

Métodos de uso

Apache SpamAssassin es una aplicación basada en Perl ( Mail::SpamAssassin en CPAN ) que se utiliza habitualmente para filtrar todo el correo entrante de uno o varios usuarios. Puede ejecutarse como una aplicación independiente o como un subprograma de otra aplicación (como Milter , SA-Exim, Exiscan, MailScanner , MIMEDefang , Amavis ) o como un cliente ( spamc ) que se comunica con un demonio ( spamd ). El modo de funcionamiento cliente/servidor o integrado tiene ventajas en el rendimiento, pero en determinadas circunstancias puede introducir riesgos de seguridad adicionales.

Normalmente, cada una de las variantes de la aplicación se configura en un programa de filtrado de correo genérico o se llama directamente desde un agente de usuario de correo que lo admita, siempre que llega correo nuevo. Se puede hacer que los programas de filtrado de correo, como procmail, canalicen todo el correo entrante a través de Apache SpamAssassin con un ajuste en el archivo procmailrc de un usuario .

Operación

Apache SpamAssassin incluye un amplio conjunto de reglas que se aplican para determinar si un correo electrónico es spam o no. La mayoría de las reglas se basan en expresiones regulares que se comparan con los campos del cuerpo o del encabezado del mensaje, pero Apache SpamAssassin también emplea otras técnicas de lucha contra el spam. Las reglas se denominan "pruebas" en la documentación de SpamAssassin.

Cada prueba tiene un valor de puntuación que se asignará a un mensaje si coincide con los criterios de la prueba. Las puntuaciones pueden ser positivas o negativas, donde los valores positivos indican "spam" y los negativos "ham" (mensajes que no son spam). Un mensaje se compara con todas las pruebas y Apache SpamAssassin combina los resultados en una puntuación global que se asigna al mensaje. Cuanto mayor sea la puntuación, mayor será la probabilidad de que el mensaje sea spam.

Apache SpamAssassin tiene un umbral de puntuación interno (configurable) para clasificar un mensaje como spam. Por lo general, un mensaje solo se considerará spam si cumple varios criterios; cumplir con una sola prueba no suele ser suficiente para alcanzar el umbral.

Si Apache SpamAssassin considera que un mensaje es spam, puede reescribirse. En la configuración predeterminada, el contenido del correo se adjunta como un archivo adjunto MIME , con un breve extracto en el cuerpo del mensaje y una descripción de las pruebas que dieron como resultado que el correo se clasificara como spam. Si la puntuación es inferior a la configuración definida, de forma predeterminada, la información sobre las pruebas aprobadas y la puntuación total se agregan a los encabezados del correo electrónico y se pueden usar en el posprocesamiento para acciones menos graves, como etiquetar el correo como sospechoso.

Apache SpamAssassin permite una configuración de su comportamiento por usuario, incluso si se instala como un servicio para todo el sistema; la configuración se puede leer desde un archivo o una base de datos. En su configuración, los usuarios pueden especificar a qué personas enviar sus correos electrónicos nunca se considerarán spam, o cambiar las puntuaciones de determinadas reglas. El usuario también puede definir una lista de idiomas en los que desea recibir correos electrónicos y, a continuación, Apache SpamAssassin asigna una puntuación más alta a todos los correos electrónicos que parezcan estar escritos en otro idioma.

Apache SpamAssassin se basa en heurística (reconocimiento de patrones) y este tipo de software presenta falsos positivos y falsos negativos.

Métodos de filtrado basados ​​en red

Apache SpamAssassin también admite:

Se pueden agregar más métodos con relativa facilidad escribiendo un complemento de Perl para Apache SpamAssassin.

Filtrado bayesiano

Apache SpamAssassin refuerza sus reglas mediante el filtrado bayesiano , en el que un usuario o administrador "introduce" ejemplos de correo bueno (ham) y correo malo (spam) en el filtro para aprender la diferencia entre ambos. Para este fin, Apache SpamAssassin proporciona la herramienta de línea de comandos sa-learn , a la que se le puede indicar que aprenda a distinguir un solo correo o un buzón entero como correo bueno o correo no deseado.

Normalmente, el usuario moverá el correo no deseado no reconocido a una carpeta separada y luego ejecutará sa-learn en la carpeta de correo no deseado y en la carpeta de correo no deseado por separado. Alternativamente, si el agente de usuario de correo lo admite, se puede llamar a sa-learn para correos electrónicos individuales. Independientemente del método utilizado para realizar el aprendizaje, la prueba bayesiana de SpamAssassin ayudará a puntuar los correos electrónicos futuros en función de este aprendizaje para mejorar la precisión.

Licencias

Apache SpamAssassin es un software libre y de código abierto , con licencia Apache 2.0 . Las versiones anteriores a la 3.0 tienen licencia dual, la Licencia Artística y la Licencia Pública General GNU .

sa-compilar

sa-compilees una utilidad distribuida con Apache SpamAssassin que compila un conjunto de reglas de SpamAssassin en un autómata finito determinista que permite a Apache SpamAssassin utilizar la potencia del procesador de manera más eficiente.

Pruebas

Apache SpamAssassin está diseñado para activarse en GTUBE , una cadena de 68 bytes similar al archivo de prueba EICAR del antivirus . Si esta cadena se inserta en un mensaje con formato RFC 5322 y se pasa a través del motor Apache SpamAssassin, Apache SpamAssassin se activará con un peso de 1000.

Véase también

Notas

  1. ^ "Comité de Gestión de Proyectos". The Apache Software Foundation . 2022 . Consultado el 23 de agosto de 2023 .
  2. ^ Sidney Markowitz (29 de marzo de 2024). «[ANUNCIO] Apache SpamAssassin 4.0.1 disponible» . Consultado el 30 de marzo de 2024 .
  3. ^ "Prehistoria de SpamAssassin". Apache Foundation . Consultado el 19 de diciembre de 2018 .
  4. ^ "Estado de incubación del proyecto SpamAssassin". Apache Foundation . Consultado el 19 de diciembre de 2018 .

Referencias

  • Sitio web oficial
  • Wiki de Apache SpamAssassin
  • Actualizaciones de reglas de Apache SpamAssassin Wiki Actualización automática de Apache SpamAssassin
  • KAM.cf Conjunto de reglas KAM para Apache SpamAssassin
Retrieved from "https://en.wikipedia.org/w/index.php?title=Apache_SpamAssassin&oldid=1234361310"