La gestión del flujo de datos aumenta el rendimiento del sistema ciberfísico

Los investigadores de inteligencia artificial de la Universidad Estatal de Carolina del Norte han mejorado el rendimiento de las redes neuronales profundas combinando la normalización de características y los módulos de atención de características en un solo módulo que denominan normalización de atención (AN). El módulo híbrido mejora considerablemente la precisión del sistema, al tiempo que utiliza una potencia de cálculo adicional insignificante.

“La normalización de características es un elemento crucial de la formación de redes neuronales profundas, y la atención a las características es igualmente importante para ayudar a las redes a destacar qué características aprendidas de los datos brutos son más importantes para realizar una tarea determinada”, dice Tianfu Wu, autor correspondiente de un documento sobre el trabajo y profesor adjunto de ingeniería eléctrica e informática en el Estado de Carolina del Norte. “Pero en su mayoría han sido tratados por separado. Encontramos que la combinación de ellos los hizo más eficientes y efectivos”.

Para probar su módulo de AN, los investigadores lo conectaron a cuatro de las arquitecturas de redes neuronales más utilizadas: ResNets, DenseNets, MobileNetsV2 y AOGNets. Luego probaron las redes contra dos puntos de referencia estándar de la industria: el punto de referencia de clasificación ImageNet-1000 y el punto de referencia de detección de objetos y segmentación de instancias MS-COCO 2017.

“Encontramos que AN mejoró el rendimiento de las cuatro arquitecturas en ambos puntos de referencia”, dice Wu. “Por ejemplo, la precisión del top-1 en el ImageNet-1000 mejoró entre el 0,5% y el 2,7%. Y la precisión promedio (AP) aumentó hasta un 1,8% para el cuadro delimitador y un 2,2% para la máscara semántica en el MS-COCO.

“Otra ventaja del AN es que facilita una mejor transferencia de aprendizaje entre diferentes dominios”, dice Wu. “Por ejemplo, desde la clasificación de imágenes en ImageNet hasta la detección de objetos y la segmentación semántica en MS-COCO. Esto se ilustra con la mejora del rendimiento en el punto de referencia de MS-COCO, que se obtuvo mediante la puesta a punto de las redes neurales profundas preentrenadas de ImageNet en MS-COCO, un flujo de trabajo común en la visión por ordenador de última generación.

“Hemos liberado el código fuente y esperamos que nuestra AN nos lleve a un mejor diseño integrador de las redes neuronales profundas”.

Comments Off on La gestión del flujo de datos aumenta el rendimiento del sistema ciberfísico

Filed under My Blog

Comments are closed.