Un sistema de filtrado de información es un sistema que elimina redundante o no deseada de información de una corriente de información usando métodos automatizados o computarizada (semi) antes de la presentación a un usuario humano. Su principal objetivo es la gestión de la sobrecarga de información y el incremento de la relación semántica señal / ruido . Para ello se compara el perfil del usuario con algunas características de referencia. Estas características pueden tener su origen en el elemento de información (el enfoque basado en contenido) o el entorno social del usuario (el enfoque de filtrado colaborativo ).
Mientras que en la transmisión de información los filtros de procesamiento de señales se utilizan contra el ruido que interrumpe la sintaxis en el nivel de bits, los métodos empleados en el filtrado de información actúan en el nivel semántico.
La gama de métodos mecánicos empleados se basa en los mismos principios que los de extracción de información . Se puede encontrar una aplicación notable en el campo de los filtros de correo no deseado . Por lo tanto, no es solo la explosión de información la que necesita algún tipo de filtro, sino también la pseudoinformación introducida de manera inadvertida o maliciosa .
En el nivel de la presentación, el filtrado de información toma la forma de fuentes de noticias basadas en las preferencias del usuario , etc.
Los sistemas de recomendación y las plataformas de descubrimiento de contenido son sistemas activos de filtrado de información que intentan presentar al usuario elementos de información ( películas , televisión , música , libros , noticias , páginas web ) que le interesan al usuario. Estos sistemas agregan elementos de información a la información que fluye hacia el usuario, en contraposición a eliminar elementos de información del flujo de información hacia el usuario. Los sistemas de recomendación suelen utilizar enfoques de filtrado colaborativo o una combinación de los enfoques de filtrado colaborativo y filtrado basado en contenido, aunque existen sistemas de recomendación basados en contenido.
Historia
Antes de la llegada de Internet , ya existen varios métodos para filtrar información ; por ejemplo, los gobiernos pueden controlar y restringir el flujo de información en un país determinado mediante censura formal o informal.
Por otra parte, vamos a hablar de filtros de información si nos referimos a los editores de periódicos y periodistas cuando proporcionan un servicio que selecciona la información más valiosa para sus clientes, lectores de libros, revistas, periódicos, la radio oyentes y espectadores de televisión . Esta operación de filtrado también está presente en escuelas y universidades donde existe una selección de información para brindar asistencia en base a criterios académicos a los clientes de este servicio, los estudiantes. Con la llegada de Internet es posible que cualquiera pueda publicar lo que quiera a bajo costo. De esta forma, aumenta considerablemente la información menos útil y en consecuencia se difunde información de calidad. Con este problema, se comenzó a idear un nuevo filtrado con el que podemos obtener la información requerida para cada tema específico de manera fácil y eficiente.
Operación
Un sistema de filtrado de este estilo consta de varias herramientas que ayudan a las personas a encontrar la información más valiosa, por lo que el tiempo limitado que puedes dedicar a leer / escuchar / ver, se dirige correctamente a los documentos más interesantes y valiosos. Estos filtros también se utilizan para organizar y estructurar la información de forma correcta y comprensible, además de agrupar los mensajes en el correo dirigido. Estos filtros son fundamentales en los resultados obtenidos de los buscadores en Internet. Las funciones de filtrado mejoran día a día para conseguir descargas de documentos web y mensajes más eficientes.
Criterio
Uno de los criterios utilizados en este paso es si el conocimiento es dañino o no, si el conocimiento permite una mejor comprensión con o sin el concepto. En este caso la tarea de filtrado de información para reducir o eliminar la información dañina con conocimiento.
Sistema de aprendizaje
Un sistema de contenidos de aprendizaje consta, en reglas generales, principalmente de tres etapas básicas:
- Primero, un sistema que brinda soluciones a un conjunto definido de tareas.
- Posteriormente, se somete a criterios de evaluación que medirán el desempeño de la etapa anterior en relación a la solución de problemas.
- Módulo de adquisición cuya salida obtuvo conocimientos que se utilizan en el solucionador de sistemas de la primera etapa.
Futuro
Actualmente el problema no es encontrar la mejor forma de filtrar la información , sino la forma que estos sistemas requieren para conocer de forma independiente las necesidades de información de los usuarios. No solo porque automatizan el proceso de filtrado sino también la construcción y adaptación del filtro. Algunas ramas que se basan en él, como la estadística, el aprendizaje automático, el reconocimiento de patrones y la minería de datos, son la base para desarrollar filtros de información que aparecen y se adaptan en base a la experiencia. Para que se pueda llevar a cabo el proceso de aprendizaje, parte de la información tiene que estar prefiltrada, es decir, hay ejemplos positivos y negativos a los que denominamos datos de formación, que pueden ser generados por expertos o, mediante feedback, a través de usuarios ordinarios.
Error
A medida que se ingresan los datos, el sistema incluye nuevas reglas; si consideramos que estos datos pueden generalizar la información de los datos de entrenamiento, entonces tenemos que evaluar el desarrollo del sistema y medir la capacidad del sistema para predecir correctamente las categorías de nueva información . Este paso se simplifica al separar los datos de entrenamiento en una nueva serie llamada "datos de prueba" que usaremos para medir la tasa de error. Como regla general, es importante distinguir entre tipos de errores (falsos positivos y falsos negativos). Por ejemplo, en el caso de un agregador de contenido para niños, no tiene la misma gravedad permitir el paso de información no apta para ellos, que muestre violencia o pornografía, que el error de descartar alguna información apropiada. Para mejorar el sistema para reducir las tasas de error y tener estos sistemas con capacidades de aprendizaje similares a las de los humanos, necesitamos el desarrollo de sistemas que simulen las capacidades cognitivas humanas, como la comprensión del lenguaje natural , la captura de significados comunes y otras formas de procesamiento avanzado para lograr la semántica de información.
Campos de uso
Hoy en día existen numerosas técnicas para desarrollar filtros de información, algunas de estas alcanzan tasas de error inferiores al 10% en diversos experimentos. [ cita requerida ] Entre estas técnicas se encuentran árboles de decisión, máquinas de vectores de soporte, redes neuronales, redes bayesianas, discriminantes lineales, regresión logística, etc. En la actualidad, estas técnicas se utilizan en diferentes aplicaciones, no solo en el contexto web, sino en temas tan variados como reconocimiento de voz, clasificación de astronomía telescópica o evaluación de riesgo financiero.
Ver también
Referencias
- Hanani, U., Shapira, B., Shoval, P. (2001) Filtrado de información: descripción general de problemas, investigación y sistemas. Modelado de usuario e interacción adaptada al usuario, 11, págs. 203–259.
- http://www.infoworld.com/d/developer-world/human-information-filter-813