Caja de herramientas de selección de características

Feature Selection Toolbox (FST) es un software principalmente para la selección de funciones en el dominio del aprendizaje automático , ^[1] escrito en C ++ , desarrollado en el Instituto de Teoría y Automatización de la Información (UTIA), de la Academia Checa de Ciencias .

Caja de herramientas de selección de características
Una captura de pantalla muestra la interfaz de usuario completa de FST1. A la izquierda hay una ventana de registro con los resultados de la selección de funciones. En el centro a la derecha hay una ventana de tabla de resultados. En la parte inferior derecha hay una proyección gráfica de datos y componentes del modelo de mezcla. En la parte superior está el cuadro de diálogo para establecer parámetros de métodos de búsqueda de subconjuntos óptimos.
Desarrollador (es)	UTIA , Academia Checa de Ciencias

Lanzamiento estable	3.1.1 / 9 de septiembre de 2012 ; Hace 8 años ( 09/09/2012 )

Escrito en	C ++
Sistema operativo	Multiplataforma (v3)
Tipo	Aprendizaje automático , reconocimiento de patrones
Licencia	Gratis para uso no comercial
Sitio web	fst .utia .cz

Versión 1

La primera generación de Feature Selection Toolbox (FST1) fue una aplicación de Windows con interfaz de usuario que permitía a los usuarios aplicar varios métodos de selección de funciones subóptimos, óptimos y basados en mezclas en datos almacenados en un formato de archivo plano textual trivial patentado. ^[2]

Versión 3

La tercera generación de Feature Selection Toolbox (FST3) era una biblioteca sin interfaz de usuario, escrita para ser más eficiente y versátil que la FST1 original. ^[3]

FST3 admite varias tareas estándar de minería de datos , más específicamente, preprocesamiento y clasificación de datos , pero su enfoque principal está en la selección de características . En el contexto de selección de características, implementa varias técnicas comunes como así como menos habituales, haciendo especial hincapié en roscado aplicación de diversos métodos de búsqueda secuenciales (una forma de bajada ). Los métodos implementados incluyen clasificación de características individuales, búsqueda flotante, búsqueda oscilante (adecuada para problemas de muy alta dimensión) en forma aleatoria o determinista, métodos óptimos de tipo de rama y límite , criterios de distancia de clase probabilística, varios estimadores de precisión de clasificador, optimización de tamaño de subconjunto de características, selección de características con pesos de características preespecificados, conjuntos de criterios, métodos híbridos, detección de todas las soluciones equivalentes u optimización de dos criterios. FST3 está más especializado que el software popular como el entorno Waikato para el análisis del conocimiento Weka , RapidMiner o PRTools. ^[4]

De forma predeterminada, las técnicas implementadas en la caja de herramientas se basan en el supuesto de que los datos están disponibles como un solo archivo plano en un formato propietario simple o en formato ARFF de Weka, donde cada punto de datos se describe mediante un número fijo de atributos numéricos. FST3 se proporciona sin interfaz de usuario y está destinado a usuarios familiarizados con el aprendizaje automático y la programación en C ++ . El software FST1 más antiguo es más adecuado para experimentos sencillos o con fines educativos porque se puede utilizar sin necesidad de codificar en C ++.

Historia

En 1999, el desarrollo de la primera versión de Feature Selection Toolbox comenzó en UTIA como parte de una tesis doctoral. Se desarrolló originalmente en el entorno Optima ++ (luego renombrado como Power ++) RAD C ++.
En 2002, se suspendió el desarrollo de la primera generación de FST, principalmente debido al fin del soporte de Sybase para el entorno de desarrollo utilizado en ese momento.
En 2002–2008, el kernel de FST se recodificó y se utilizó para la experimentación de investigación dentro de UTIA únicamente.
En 2009, comenzó la recodificación del tercer kernel FST desde cero.
En 2010, FST3 se puso a disposición del público en forma de biblioteca C ++ sin GUI. La página web adjunta recopila enlaces relacionados con la selección de funciones, referencias, documentación y el FST1 original disponible para descargar.
En 2011, una actualización de FST3 a la versión 3.1 incluyó nuevos métodos (en particular, una clasificación novedosa de características que reconocen la dependencia adecuada para problemas de reconocimiento de muy alta dimensión) y mejoras en el código central.

Ver también

Selección de características
Reconocimiento de patrones
Aprendizaje automático
Procesamiento de datos
OpenNN , biblioteca de redes neuronales abiertas para análisis predictivo
Weka , software de código abierto Java completo y popular de la Universidad de Waikato
RapidMiner , anteriormente Yet Another Learning Environment (YALE), un marco comercial de aprendizaje automático
PRTools de la Universidad Tecnológica de Delft
Infosel ++ especializado en la selección de características basada en la teoría de la información
Tooldiag una caja de herramientas de reconocimiento de patrones C ++
Lista de software de análisis numérico

Referencias

^ Petr Somol; Jana Novovičová; Pavel Pudil (2010). "Selección eficiente de subconjuntos de funciones y optimización del tamaño de subconjuntos" (PDF) . Reconocimiento de patrones Avances recientes, INTECH . págs. 75–97. ISBN 978-953-7619-90-9.
^ Petr Somol; Pavel Pudil (2002). "Caja de herramientas de selección de funciones" (PDF) . Reconocimiento de patrones vol.35, no.12, Elsevier . págs. 2749–2759.
^ Petr Somol; Pavel Vácha; Stanislav Mikeš; Jan Hora; Pavel Pudil; Pavel Žid (2010). "Introducción a la caja de herramientas de selección de características 3: la biblioteca C ++ para la búsqueda de subconjuntos, el modelado de datos y la clasificación" (PDF) . UTIA Tech. Informe No. 2287 . págs. 1-12 . Consultado el 2 de noviembre de 2010 .
^ PRTools

enlaces externos

Página web oficial

[1] Petr Somol; Jana Novovičová; Pavel Pudil (2010). "Selección eficiente de subconjuntos de funciones y optimización del tamaño de subconjuntos" (PDF) . Reconocimiento de patrones Avances recientes, INTECH . págs. 75–97. ISBN 978-953-7619-90-9.

[2] Petr Somol; Pavel Pudil (2002). "Caja de herramientas de selección de funciones" (PDF) . Reconocimiento de patrones vol.35, no.12, Elsevier . págs. 2749–2759.

[3] Petr Somol; Pavel Vácha; Stanislav Mikeš; Jan Hora; Pavel Pudil; Pavel Žid (2010). "Introducción a la caja de herramientas de selección de características 3: la biblioteca C ++ para la búsqueda de subconjuntos, el modelado de datos y la clasificación" (PDF) . UTIA Tech. Informe No. 2287 . págs. 1-12 . Consultado el 2 de noviembre de 2010 .

[4] PRTools

[1]