Método de detección de cuerpos extraños en el cinturón minero basado en YOLOv4
HogarHogar > Noticias > Método de detección de cuerpos extraños en el cinturón minero basado en YOLOv4

Método de detección de cuerpos extraños en el cinturón minero basado en YOLOv4

Nov 22, 2023

Scientific Reports volumen 13, Número de artículo: 8881 (2023) Citar este artículo

117 Accesos

1 Altmetric

Detalles de métricas

En el proceso de transporte de la correa de minería, pueden aparecer varios objetos extraños, que tendrán un gran impacto en la trituradora y la correa, lo que afectará el progreso de la producción y provocará accidentes de seguridad graves. Por lo tanto, es importante detectar objetos extraños en las primeras etapas de intrusión en los sistemas de cintas transportadoras de minería. Para resolver este problema, en este artículo se propone el método YOLOv4_GECA. En primer lugar, se agrega el módulo de atención de GECA para establecer el modelo de detección de objetos extraños YOLOv4_GECA en el cinturón mineral para mejorar la capacidad de extracción de características de objetos extraños. En segundo lugar, según este modelo, la disminución de la tasa de aprendizaje del recocido de coseno de reinicio se utiliza para mejorar el rendimiento de detección de imágenes de objetos extraños del modelo. Finalmente, recopilamos información de imágenes de transporte del cinturón del sitio de la mina de oro Pai Shan Lou en Shenyang y establecimos un conjunto de datos de detección de cuerpos extraños en el cinturón. Los resultados experimentales muestran que la precisión de detección promedio del método YOLOv4_GECA propuesto en este documento es del 90,1 %, la tasa de recuperación es del 90,7 % y el tiempo de detección promedio es de 30 ms, lo que cumple con los requisitos de precisión de detección y rendimiento en tiempo real en el sitio de transporte del cinturón de la mina.

La detección de cuerpos extraños juega un papel importante en las industrias de procesamiento de minerales y control de calidad de productos. Las cintas transportadoras de minerales pueden cargarse con todo tipo de cuerpos extraños al transportar minerales, como barras de acero, cables de hierro, hierro, madera, tuberías de plástico, etc., que pueden tener un gran impacto en las trituradoras, molinos de bolas y correas. Los métodos tradicionales de detección de cuerpos extraños son el método de detección manual, el método de rayos y el método de detección espectral. El método de detección manual está muy influenciado por el estado mental de los trabajadores y es ineficiente. El método de rayos es más estable pero costoso y dañino para el cuerpo humano1. El método de detección espectral tiene una tasa de detección falsa relativamente baja, la desventaja es que es susceptible a interferencias, equipos difíciles de mantener y objetos extraños difíciles de detectar en el mineral de hierro para detectar hierro. Debido a la influencia de factores humanos e interferencias externas, las técnicas de detección de cuerpos extraños anteriores son lentas, costosas y difíciles de mantener, con altas tasas de fuga, lo que dificulta su promoción universal en las empresas mineras.

Con el desarrollo del aprendizaje profundo, los métodos de detección de objetos basados ​​en redes neuronales convolucionales se han utilizado ampliamente, y los métodos de detección de cuerpos extraños basados ​​en el aprendizaje profundo se han convertido en un punto crítico de investigación. Los métodos de detección de objetos existentes se basan principalmente en anclas y no tienen anclas. Entre ellos, el basado en ancla tiene principalmente Faster R-CNN de dos etapas y la serie YOLO de una etapa, SSD, etc. En 2015, Ren2 et al. propuso Faster R-CNN, que mejoró la velocidad del algoritmo de búsqueda selectiva para extraer regiones de casillas candidatas y se convirtió en el primer detector de objetivos de aprendizaje profundo casi en tiempo real de extremo a extremo. YOLO (solo se mira una vez)3 fue propuesto por Redmon et al. en 2015 como el primer detector de una etapa en el campo del aprendizaje profundo. El principal punto de mejora de YOLOv24 en comparación con la versión anterior es el algoritmo de entrenamiento conjunto propuesto, que proporciona una localización más precisa mientras mantiene la velocidad de procesamiento de YOLO. YOLOv35 presenta la introducción de FPN para la predicción de múltiples escalas y también utiliza una mejor red subyacente. Darknet-53 y función de pérdida de entropía cruzada binaria, y puede lograr un equilibrio entre velocidad y precisión al cambiar la estructura de red del modelo. YOLOv46 es un hito importante en la serie YOLO, con la introducción de CSPDarknet-53 para extraer características, la adición de redes SPP para mejorar la extracción de imágenes y el uso de la función de activación Mish, estas mejoras también hacen de YOLOv4 un detector de objetos extremadamente eficiente y poderoso. Liu7 et al. propuso el algoritmo SSD en 2015, que introduce técnicas de detección de múltiples referencias y múltiples resoluciones, y la red de diferentes capas detecta objetos con diferentes escalas, y el efecto de detección para objetivos pequeños mejora considerablemente. YOLOv58 utiliza computación de marco de anclaje adaptativo y un mecanismo de detección de fusión multisemántica, que permite la fusión rápida y efectiva de información semántica rica de alto nivel con información de ubicación de bajo nivel para lograr una detección rápida de objetos. YOLOv69 incorpora ideas de diseño de red reciente, estrategias de capacitación, técnicas de prueba, cuantificación y métodos de optimización para construir un conjunto de redes desplegables de diferentes tamaños para adaptarse a diversos casos de uso. aumentando el costo de la inferencia, mientras reduce efectivamente alrededor del 40% de los parámetros y el 50% del esfuerzo computacional de los detectores de objetivos en tiempo real existentes.

En los últimos años, una gran cantidad de académicos han utilizado métodos de aprendizaje profundo para la detección de objetos extraños, incluida la detección de objetos extraños basada en la red neuronal convolucional (CNN), la detección de objetos extraños basada en la red neuronal recurrente (RNN) y la detección de objetos extraños basada en el codificador automático. detección. Estos métodos han logrado buenos resultados en la detección de objetos extraños y tienen una mejor generalización y robustez en comparación con los algoritmos tradicionales de aprendizaje automático. En 2018, Cao11 et al. propuso un novedoso algoritmo basado en una red neuronal convolucional (CNN) para detectar desechos de objetos extraños (FOD) basado en sensores ópticos de imágenes. En comparación con R-CNN y SSD más rápidos, su algoritmo propuesto tiene mejores resultados para la detección de desechos de objetos extraños para pavimentos de aeropuertos. En 2018, Xu12 et al. propuso un nuevo método de reconocimiento de material de fragmentos de objetos extraños basado en el aprendizaje de migración y los modelos de red neuronal convolucional profunda (D-CNN) convencionales. En 2019, Rong13 et al. aplicó dos estructuras de redes neuronales convolucionales diferentes a imágenes de nueces para segmentar automáticamente las imágenes y detectar objetos extraños naturales y artificiales de diferentes tamaños, evitando la extracción manual de características y superando el fenómeno de agrupamiento entre nueces y objetos extraños en imágenes reales. En 2020, He14 et al . construyó una red basada en aprendizaje profundo para la detección de bolsas de plástico debajo de los trenes usando la red SSD y combinando diferentes extractores de características. Entre los resultados, la velocidad de detección más rápida se obtuvo con la combinación de SSD y MobileNet. En 2020, Pang15 et al. propuso un método de detección en tiempo real basado en el algoritmo YOLOv3 para detectar armas metálicas ocultas en el cuerpo humano, que se aplicó a imágenes de ondas milimétricas pasivas (PMMW). No solo tiene una alta precisión, sino también una velocidad de detección muy rápida en términos de detección de objetivos de pequeño tamaño. En 2022, Chen16 et al. combinó el algoritmo YOLOv4 con una caja de anclaje optimizada para lograr una detección eficiente de objetos extraños en las cintas transportadoras y reducir la aparición de este problema de roturas longitudinales de la cinta. En 2022, Qiu17 et al. Una técnica de detección en tiempo real basada en aprendizaje profundo para radar terrestre con mecanismo de atención adicional y aumento de datos para mejorar los problemas de detección falsa y perdida en la detección. En 2022, Jing18 et al. propuso un marco de bosque aleatorio basado en características óptimas de visión de píxeles y diseñó características de visión de píxeles (PVF) para superar la complejidad de la información de la imagen del pavimento del aeropuerto y la variabilidad de los fragmentos de objetos extraños, lo que es más ventajoso en términos de precisión y recuperación de objetos extraños. detección de fragmentos de objetos. En 2022, Abramson19 et al. creó un algoritmo de seguimiento de objetos extraños totalmente automatizado que utilizaba una red neuronal convolucional personalizada para lograr una precisión del 99 %, superando a otros algoritmos comparables.

La investigación actual sobre la detección de cuerpos extraños en los cinturones de minería se centra en los métodos tradicionales de detección de objetos, con baja precisión de reconocimiento, baja velocidad de identificación y fácil situación de fuga y error de juicio. Al mismo tiempo, hay cuerpos extraños de objetos pequeños, cuerpos extraños parcialmente oscurecidos y cuerpos extraños difíciles de identificar debido a la interferencia del polvo durante el transporte del cinturón mineral. Para resolver los problemas anteriores, este artículo propone un método basado en YOLOv4_GECA para detectar cuerpos extraños en la correa de transmisión del mineral. Nuestra contribución se puede resumir de la siguiente manera.

En respuesta a la falta de una base de datos de imágenes estándar y abierta en el campo de la detección de cuerpos extraños en el cinturón minero, recopilamos información de imágenes de transporte del cinturón del sitio de la mina de oro Pai Shan Lou en Shenyang, creamos un conjunto de datos de detección de cuerpos extraños en el cinturón minero y ampliamos él, con los principales tipos de cuerpos extraños que incluyen barras de acero, cables de acero, hierro, madera y tuberías de plástico.

Se propone el mecanismo de atención GECA y se construye el modelo YOLOv4_GECA para las características de oclusión parcial de cuerpos extraños e interferencia de polvo en imágenes en el proceso de producción real.

El método de caída de la tasa de aprendizaje en el proceso de entrenamiento del modelo se ha mejorado para optimizar el proceso de entrenamiento con el método de caída de la tasa de aprendizaje de recocido de coseno de reinicio. Basado en el modelo YOLOv4_GECA, la red YOLOv4_GECA_SGDR se construye para mejorar aún más el rendimiento sin aumentar la carga del modelo.

El modelo YOLOv4 se mejora en base al modelo YOLOv320, incorporando algunas excelentes técnicas de detección que han surgido en el campo del aprendizaje profundo en los últimos años, mejorando el rendimiento de detección del modelo para objetos pequeños, y el diagrama esquemático de la estructura del modelo se muestra en Fig. 1. En términos de la estructura general de la red, el modelo YOLOv4 se puede dividir en cuatro partes: entrada, red troncal, cuello y cabeza. El modelo YOLOv4 utiliza el aumento de datos Mosaic en el lado de entrada durante el entrenamiento al realizar algunas operaciones de voltear y escalar las cuatro imágenes por separado y luego unir las cuatro imágenes para obtener una nueva imagen21. La red troncal del modelo YOLOv4 incluye el uso de la red CSPDarknet53 y la función de activación Mish. La red de detección de objetos utiliza una estructura de agrupación piramidal espacial y una estructura PANet en medio de las capas CSPDarknet53 y de salida. PAN pasa la información semántica profunda a la capa superficial para complementar la información semántica superficial, obteniendo así características semánticas sólidas y de alta resolución, que tienen un rendimiento muy impresionante en áreas como la detección de objetos pequeños y la segmentación de instancias. En predicción, el mecanismo de marco de anclaje de la capa de salida es el mismo que el de YOLOv3, y las principales mejoras son la función de pérdida CIOU_Loss durante el entrenamiento y la supresión no máxima del filtrado del marco de predicción en DIOU_nms.

La estructura del modelo YOLOV4.

La arquitectura de red troncal CSPDarknet53 de YOLOv4 utiliza muchos módulos CSPX para el apilamiento. El módulo CSPX toma prestada la estructura de la red parcial de etapas cruzadas22 (CSPNet) con costura de tensor por capas convolucionales y módulos de unidades X Res, consulte la Fig. 2. En el problema de detección de objetos, el uso de CSPNet como red troncal puede traer algunos mejorar el rendimiento del modelo de red, mejorar la capacidad de las redes neuronales convolucionales para extraer características de las imágenes y mejorar la eficiencia computacional. La figura 3 muestra la estructura del módulo residual (unidad Res), el cual se divide en una parte de mapeo directo y una parte residual, donde la parte residual contiene dos operaciones de convolución. La parte residual primero se convoluciona y luego se suma tensorialmente con la parte de mapeo directo. La figura 4 ilustra el módulo convolucional de CBL, que consta de una capa convolucional, una capa de normalización por lotes y una capa de activación de Leaky Relu.

Diagrama estructural del módulo CSPX.

Esquema estructural del módulo de la unidad Res.

Diagrama estructural del módulo de convolución CBL.

El módulo del mecanismo de atención ECA mejora el módulo SE23 al eliminar la operación de reducción de dimensionalidad y usar dos capas completamente conectadas de la misma dimensión más útiles para aprender a canalizar la atención de manera efectiva. Sin embargo, el uso de dos capas completamente conectadas de la misma dimensión conducirá a una cantidad excesiva de parámetros, por lo que el enfoque de usar k características adyacentes para obtener información de interacción local entre canales tiene solo k número de parámetros y puede obtener el mismo rendimiento y es más eficiente. El módulo del mecanismo atencional ECA se calcula como:

donde \(C1D\) representa la operación de convolución unidimensional realizada en las entidades de entrada y representa la función sigmoidea. El módulo ECA no utiliza la capa de conexión completa del módulo SE. Aprende directamente las características después de la agrupación promedio global a través de una convolución unidimensional que puede compartir pesos, como se muestra en la Fig. 5. La información de interacción local entre canales se obtiene por cada canal y sus k características adyacentes, es decir, la información la interacción entre canales se logra mediante una convolución unidimensional con un núcleo de convolución de tamaño k. Se aprende la relación no lineal entre cada canal y también se obtienen los pesos de los diferentes canales. La convolución unidimensional involucra el hiperparámetro k, el tamaño del kernel de convolución, que indica la cobertura de las interacciones locales entre canales, es decir, cuántas características adyacentes en la vecindad de esa característica del canal están involucradas conjuntamente en la predicción de la atención.

Diagrama estructural del módulo ECA.

Durante la optimización del algoritmo de descenso de gradiente estocástico, a medida que el valor de pérdida se aproxima al mínimo global, la tasa de aprendizaje actual es grande para la función actual de pesos y pérdidas, y en este punto, si la tasa de aprendizaje se reduce, el modelo se puede acercar al mínimo global. El recocido de coseno reduce la tasa de aprendizaje mediante la función coseno, como se muestra en la Fig. 6, donde la coordenada horizontal es el número de rondas de entrenamiento y la coordenada vertical es la tasa de aprendizaje. La disminución de la tasa de aprendizaje de 0,01 a 0,005 con rondas de entrenamiento crecientes se ilustra en la Fig. 6, donde su valor de coseno primero disminuye lentamente con rondas crecientes, luego se acelera y vuelve a disminuir lentamente. Esto se usa en el proceso de entrenamiento del modelo YOLOv4, donde la tasa de aprendizaje decae gradualmente a medida que avanza el entrenamiento, con la función de pérdida primero disminuyendo sustancialmente al principio del entrenamiento y variando en un pequeño rango alrededor del óptimo local o global más tarde.

Descenso de la tasa de aprendizaje de recocido de coseno.

El método de decaimiento de la tasa de aprendizaje de recocido de coseno utiliza la función coseno, por lo que el proceso de decaimiento se ajusta a la forma de la función coseno, cuya fórmula se muestra en la ecuación. (2).

donde \({\eta }_{max}\) y \({\eta }_{min}\) son los valores máximo y mínimo de la tasa de aprendizaje, respectivamente, \({T}_{\text{cur }}\) es el número de rondas entrenadas hasta el momento, y \(T\) es el número total de rondas de entrenamiento.

Los algoritmos de optimización de descenso de gradiente estocástico a menudo encuentran el problema de caer en mínimos locales durante el proceso de entrenamiento. El enfoque de caída de la tasa de aprendizaje de recocido de coseno tendrá una tasa de aprendizaje más pequeña en las etapas posteriores del entrenamiento y puede caer en mínimos locales de los que es difícil saltar, lo que da como resultado un algoritmo de descenso que no puede optimizarse a un mínimo global. Si la tasa de aprendizaje aumenta en un momento en que la tasa de aprendizaje es pequeña más adelante en el entrenamiento del algoritmo de descenso estocástico, entonces es posible hacer que el proceso de optimización salte fuera de los mínimos locales y encuentre el camino hacia el mínimo global, llamado reiniciando el método de tasa de aprendizaje de recocido de coseno. La fórmula para la tasa de aprendizaje de recocido de coseno de reinicio se da en la ecuación. (3).

En la fórmula, \(i\) denota las primeras veces la tasa de aprendizaje de reinicio. \({\eta }_{max}^{i}\) y \({\eta }_{min}^{i}\) denotan los valores máximo y mínimo de la tasa de aprendizaje en el i-ésimo reinicio, respectivamente . \({T}_{i}\) indica el número total de rondas del proceso de entrenamiento en el i-ésimo reinicio y \({T}_{\text{cur}}\) indica cuántas rondas se ejecutan actualmente y actualizarse en cada reinicio. Se establecen los valores máximo y mínimo en la tasa de aprendizaje de reinicio, y cada tasa de aprendizaje de reinicio sufre un decaimiento de recocido de coseno, con la tasa de aprendizaje decayendo desde el valor máximo hasta el valor mínimo. La Figura 7 muestra una simulación de la tasa de aprendizaje para el recocido de coseno de tres reinicios, donde la tasa de aprendizaje se reinicia en las rondas 50, 100 y 150 del proceso de capacitación, y el valor máximo y mínimo de la tasa de aprendizaje para cada reinicio es setenta por ciento del valor anterior.

Reinicie el descenso de la velocidad de aprendizaje del recocido de coseno.

Para hacer un uso completo de la información contextual global y capturar dependencias de largo alcance para el sitio de producción real donde hay objetos pequeños, algunos objetos extraños existen para ocultar y se puede generar polvo, este documento propone el mecanismo de atención de GECA para mejorar la atención de ECA mecanismo. La operación de agrupación de promedio global en el mecanismo de atención de ECA solo opera promediando cada mapa de características de canal por separado y usa este promedio para representar la información del mapa de características de canal sin hacer un uso completo de la información global. En este documento, la operación de agrupación de promedios globales en ECA se mejora al no usar la agrupación de promedios globales, sino al usar una operación de convolución unidimensional para obtener las dependencias en las ubicaciones de píxeles de cada mapa de características de canal para obtener el vector de salida, que es luego operado por la función Softmax para obtener el vector de valor de probabilidad, que se multiplica con el mapa de características de entrada original. Esta mejora puede hacer un uso completo de la información de texto completo del mapa de funciones para obtener la conexión entre los puntos de píxeles de cada canal, y el vector de valor de probabilidad obtenido hace que la información clave en el mapa de funciones sea más prominente, lo que es más conveniente para el posterior aprendizaje del mecanismo de atención del canal, y mejora la capacidad de extracción de características de objetos extraños parcialmente ocluidos y también de objetos extraños en imágenes polvorientas. El módulo GECA construido se muestra en la Fig. 8.

Esquema estructural del módulo GECA.

El módulo CSPX en la red troncal CSPDarknet53 contiene varias unidades Res de bloques residuales que mitigan los problemas de desaparición y explosión de gradientes, lo que permite construir una estructura de red más profunda y más capaz de extraer características de las imágenes. En este artículo, proponemos construir el módulo de la unidad Res_GECA colocando el módulo del mecanismo de atención GECA detrás de la capa convolucional de la parte residual en el bloque residual de la unidad Res, esperando aprender la atención del canal del bloque convolucional de manera más efectiva y mejorar la capacidad de extracción de características de la red troncal con la introducción de parámetros de modelo muy pequeños. El módulo de la unidad Res_GECA construido se muestra en la Fig. 9.

Esquema estructural del módulo de la unidad Res _GECA.

Hay 23 módulos de conexión residual en los cinco módulos CSPX de la red troncal YOLOv4, y el módulo de conexión residual original se reemplaza por el módulo residual Res_GECA con el mecanismo de atención GECA propuesto en este documento, consulte la Fig. 10. Esto construye el modelo YOLOv4_GECA , que construye una red troncal con un mecanismo de atención para aumentar la capacidad de aprendizaje del modelo sobre la importancia del nivel del canal del mapa de características a costa de aumentar menos parámetros del modelo, explotar al máximo la información del mapa de características y mejorar la información útil del mapa de características, y permitir una mejor detección de cuerpos extraños difíciles de identificar.

El diagrama de estructura de la red troncal del modelo YOLOV4_GECA.

Actualmente, no existe una base de datos de imágenes estándar y abierta en el campo de la detección de cuerpos extraños en correas mineras. Recopilamos información de imágenes de transporte de correa del sitio de la mina de oro Pai Shan Lou en Shenyang, creamos un conjunto de datos y ampliamos el conjunto de datos mediante la mejora de datos. La información de la imagen en el conjunto de datos se puede ver en la Información complementaria. La mejora de datos es una expansión artificial de un conjunto de datos limitado para producir más datos equivalentes. Los métodos de mejora de datos de imagen comúnmente utilizados incluyen tramado de color de imagen, transformaciones de volteo y rotación, recorte aleatorio, transformaciones de panorámica y contraste, mejora de datos de mosaico, etc. Poses y condiciones de campo de objetos extraños en la cinta transportadora de mineral de forma aleatoria.

Este documento utiliza LabelImg, un software de etiquetado para tareas de detección de objetivos, que permite seleccionar el objetivo mediante un cuadro rectangular y guardarlo como un archivo XML. Para crear un conjunto de muestra de imágenes de objetos extraños de la correa de minería, se usó el software de etiquetado de conjuntos de datos LabelImg para mapear manualmente los objetivos de objetos extraños en la correa transportadora. Para marcar un solo objeto extraño, haga clic en el botón de cuadro rectangular en el software, mantenga presionado presione el botón izquierdo del mouse en la esquina superior izquierda del objeto extraño, deslice el mouse hacia abajo hasta la esquina inferior derecha del objeto extraño, deje que el cuadro rectangular lo envuelva completamente, luego complete la categoría de objeto extraño y guárdelo. Cuando haya varios objetos extraños en el diagrama, marque cada objeto extraño por separado y complete la categoría a la que pertenece. El etiquetado se guarda en formato VOC. Se seleccionaron un total de 1291 imágenes que contenían objetos extraños para el conjunto de datos total final, que se dividió en 5 categorías de objetos extraños, incluidos acero, tubería de plástico, madera, cable de acero y hierro, con un número equilibrado de imágenes en cada categoría. El conjunto de entrenamiento y el conjunto de prueba se toman en una proporción de 8:2. El aumento de datos de mosaico se utiliza durante el entrenamiento para enriquecer el conjunto de datos y hacer que la red sea más sólida.

La computadora utilizada para el entrenamiento del modelo de detección de objetos extraños del cinturón minero en este documento utiliza un procesador Intel Core i5-9400F de 2,90 GHz, una tarjeta gráfica NVIDIA GTX 1660, 16 GB de RAM y un disco duro Western Digital de 500 GB. En cuanto al software, el sistema operativo de la computadora es Windows 10 de 64 bits. El modelo de detección de cuerpos extraños del cinturón de minería se crea utilizando el marco de aprendizaje profundo PyTorch, que es un marco de código abierto ampliamente adoptado, simple y eficiente. Las bibliotecas de procesamiento de imágenes Opencv y PIL se utilizan para procesar las imágenes, y bibliotecas como Matplotlib se utilizan para dibujar las imágenes. Para la GPU, use Cudnn 7.6.5 y Cuda 10.2 para configurar la tarjeta gráfica.

El modelo YOLOv4 utiliza CSPDarknet53 como arquitectura principal y está preentrenado en el conjunto de datos de ImageNet para inicializar algunas de las capas convolucionales. En el experimento, los hiperparámetros predeterminados son los siguientes: el número total de rondas de entrenamiento para el modelo de detección de cuerpos extraños del cinturón minero es de 1000 rondas; el tamaño de cada imagen de entrenamiento por lotes se establece en 4; el valor inicial de la tasa de aprendizaje se establece en 0,01, que decaerá lentamente durante el proceso de entrenamiento, y la tasa de aprendizaje de caída final es 0,0005; el impulso y la disminución del peso se establecen en 0,937 y 0,005, respectivamente; el tamaño de la imagen de entrada es 3843´84. donde el tamaño del kernel convolucional unidimensional en el modelo YOLOv4_GECA se establece en 3, 5 y 7 para los experimentos para probar el impacto en el rendimiento de este parámetro en la mejora del modelo. En cuanto a la selección de la función de activación, usamos la función de activación de Leaky Relu porque la capacidad de la tarjeta gráfica requerida para la activación de Mish es demasiado grande. El modelo de detección de cuerpos extraños del cinturón minero utiliza un algoritmo de optimización de descenso de gradiente estocástico, que primero utiliza una estrategia de programación de tasa de aprendizaje de decaimiento de recocido de coseno para encontrar un modelo mejorado adecuado, y luego entrena el modelo usando una estrategia de decaimiento de tasa de aprendizaje de recocido de coseno reinicio para probar si diferentes estrategias de disminución de la tasa de aprendizaje afectan al modelo. Para la prueba, obtuvimos vectores de confianza a nivel de región por puntajes. Los resultados se procesan posteriormente mediante la votación del cuadro delimitador y la supresión no máxima (NMS) con un umbral de 0,5 IOU.

En el proceso de detección de cuerpos extraños en el sitio del mineral de transporte de cinta transportadora, la ocurrencia de detección de objetos extraños falsos y perdidos y la velocidad de detección no está a la altura del trabajo de inspección tiene un gran impacto, por lo que los indicadores de verificación de estas situaciones como el principal indicadores de desempeño del sistema de detección de este estudio. Por lo tanto, la precisión promedio media (mAP), la recuperación y los fps (fotogramas por segundo) se utilizan como métricas de evaluación del modelo en este estudio. Donde Mean Average Precision (mAP) es el promedio de los valores de AP tomados en todas las categorías. mAP es la precisión promedio, que es el promedio de todas las precisiones obtenidas sobre todos los valores posibles de recuperación. La recuperación se utiliza para evaluar la cobertura de detección del detector para detectar todos los objetivos. Fps se refiere a la cantidad de imágenes que se pueden procesar en cada segundo. Se calculan de la siguiente manera.

En la fórmula, TP es el número de muestras positivas previstas como clases positivas; FP es el número de muestras negativas previstas como clases positivas; FN es el número de muestras positivas previstas como clases negativas; TN es el número de muestras negativas previstas como clases negativas.

Este documento compara los efectos de detección de diferentes modelos avanzados de detección de objetos en el conjunto de datos de detección de cuerpos extraños del cinturón minero, incluidos cinco modelos de red, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 y YOLOv5, y el modelo de detección de objetos YOLOv4 se selecciona como base. modelo de red para las condiciones integrales del sitio de transporte de mineral. El rendimiento de los modelos mejorados YOLOv4_ECA, YOLOv4_GECA y YOLOv4 también se comparan entre sí, así como el efecto del tamaño del núcleo convolucional unidimensional en el modelo YOLOv4_GECA en el rendimiento del modelo. En este documento, mejoramos la estrategia de disminución de la tasa de aprendizaje en el entrenamiento del modelo de detección de cuerpos extraños del cinturón minero y cambiamos la estrategia de disminución de la tasa de aprendizaje de YOLOv4 para reiniciar la disminución de la tasa de aprendizaje del recocido de coseno y realizar comparaciones y análisis experimentales.

Para demostrar y evaluar el rendimiento de nuestro método propuesto, el rendimiento se compara con otros detectores avanzados. Los cinco modelos de red, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 y YOLOv5, se entrenaron para 1000 rondas en el conjunto de datos de cuerpos extraños del cinturón minero y se probaron en el conjunto de prueba. La Figura 11 muestra las tendencias de las métricas de mAP del modelo YOLOv4 y el modelo YOLOv5 durante el proceso de entrenamiento. Después de 300 rondas de entrenamiento, las métricas se nivelaron y variaron alrededor de los valores óptimos. Entre ellos, el efecto de entrenamiento del modelo YOLOv5 es mejor que el del modelo YOLOv4. La figura 12 muestra la tendencia de las métricas de recuperación durante el entrenamiento del modelo YOLOv4 y el modelo YOLOv5, y después de 300 rondas de entrenamiento, las métricas se nivelaron y variaron alrededor de los valores óptimos. Entre ellos, el efecto de entrenamiento del modelo YOLOv4 es mejor que el efecto de entrenamiento del modelo YOLOv5.

Cambios en el indicador [email protected] durante el entrenamiento del modelo YOLOv4 y YOLOv5.

Cambios en los indicadores de recuperación durante el entrenamiento del modelo YOLOv4 y YOLOv5.

En este estudio, el modelo se entrenó en un conjunto de datos de cuerpos extraños del cinturón minero casero y, en primer lugar, se entrenaron los cinco modelos de red, YOLOv3, YOLOv3-spp, Faster RCNN, YOLOv4 y YOLOv5, que se usan más popularmente en tareas de detección. en el conjunto de datos del conjunto de entrenamiento dividido durante 1000 rondas respectivamente, y luego se prueba en el conjunto de datos del conjunto de prueba. como se muestra en la Tabla 1.

Como se puede ver en la Tabla 1, el modelo YOLOv5 tiene la precisión de detección más alta con un mAP de 0,907 para la tarea de detección de cuerpos extraños en el cinturón de minería, y los otros modelos tienen un valor de mAP más cercano de aproximadamente 0,885. Sin embargo, el modelo YOLOv5 tiene un Recall más bajo de 0,867 y el modelo YOLOv4 tiene el Recall más alto de 0,888, que es un 2,1 % más alto que el modelo YOLOv5. Para esta tarea de prueba, las detecciones perdidas son más graves en comparación con los falsos positivos, por lo que la recuperación es más importante. En resumen, el modelo YOLOv4 funciona mejor que los modelos YOLOv3, YOLOv3-spp y YOLOv5 en términos de precisión y Recall, con un mAP de 0,885 y un Recall de 0,888, y sus Fps pueden satisfacer las necesidades reales de los sitios de producción, por lo que el modelo YOLOv4 se selecciona como modelo base para la mejora.

En la Fig. 13 se muestra una comparación de los resultados de predicción parcial de los cuatro modelos YOLOv3, YOLOv3-spp, YOLOv4 y YOLOv5. De izquierda a derecha, tres imágenes que contienen cuerpos extraños, incluidos madera, barras de refuerzo y tuberías de plástico, y acero. cable, se muestran en orden de arriba a abajo, mostrando los efectos de detección de los cuatro modelos de detección de objetos en las imágenes de cuerpos extraños.

Comparación del efecto de detección de los cuatro modelos.

En la detección de imágenes Image1, el modelo YOLOv4 y el modelo YOLOv5 predijeron las categorías con mayor confianza. En la detección de imágenes Image2, el modelo YOLOv5 identifica incorrectamente el mineral como un cuerpo extraño de madera en relación con los otros tres modelos en caso de clasificación errónea. En la detección de las imágenes Image3, los tres modelos excepto el modelo YOLOv4 no detectaron, el modelo YOLOv3 no detectó un cuerpo extraño de madera y un cuerpo extraño de cable de acero, y el modelo YOLOv3-spp y el modelo YOLOv5 no detectaron un cuerpo extraño de cable de acero . En el sitio de producción real, tanto el error de juicio como la detección de cuerpos extraños pueden causar problemas en el proceso de procesamiento de transferencia de mineral. La detección perdida conduce a la intrusión de cuerpos extraños en la abertura de alimentación, la trituradora y el molino de bolas, y otros equipos que causan daños al equipo, y un error de juicio puede aumentar la intensidad de trabajo de los trabajadores. A partir del efecto integral de la predicción del modelo, el modelo YOLOv4 es más adecuado para la tarea de detección de cuerpos extraños en el cinturón de minería en términos de rendimiento, por lo que se elige YOLOv4 como el modelo base para este documento para la mejora del modelo.

El modelo mejorado YOLOv4_GECA se entrena en el conjunto de datos de cuerpos extraños del cinturón minero, y los hiperparámetros k involucrados en la convolución unidimensional en el módulo residual Res_GECA se ajustan y establecen en 3, 5 y 7 respectivamente, y luego se entrenan para 1000 rondas respectivamente ,Varios modelos en proceso de entrenamiento [email protected] Ver Fig. 14 para comparación de tendencia de cambio de indicador. En la figura 14 se muestran cuatro curvas, YOLOv4, YOLOv4_GECA_3, YOLOv4_GECA_5 y YOLOv4_GECA_7, donde YOLOv4_GECA_3 indica que el hiperparámetro k del núcleo convolucional unidimensional del mecanismo de atención de GECA en el modelo YOLOv4_GECA es 3, y así sucesivamente. En la figura, se puede ver que el [email protected] del modelo YOLOv4_GECA con tres parámetros k diferentes alcanzó su punto más alto en aproximadamente 400 rondas durante el proceso de entrenamiento del modelo y fluctuó alrededor del valor óptimo después de eso. En comparación, el [email protected] del modelo YOLOv4_GECA es más alto que el del modelo YOLOv4 durante el proceso de entrenamiento.

Cambios en el indicador [email protected] durante el entrenamiento del modelo YOLOv4_GECA.

El modelo se probó en el conjunto de prueba después del entrenamiento y los resultados de la prueba se muestran en la Tabla 2. Los resultados del rendimiento de detección del modelo YOLOv4 y el modelo mejorado YOLOv4_GECA con diferentes hiperparámetros k se muestran en la Tabla 2. Se puede ver que el mAP @0.5 de YOLOv4_GECA mejora mucho en comparación con YOLOv4 para la tarea de detección de cuerpos extraños en el cinturón de minería, y la recuperación de YOLOv4_GECA_3 y YOLOv4_GECA_5 también mejora en comparación con YOLOv4, y la cantidad de parámetros del modelo mejorado aumenta muy poco. El modelo YOLOv4_GECA_7 se comporta mejor en el índice [email protected], pero su Recall disminuye. el modelo YOLOv4_GECA disminuye en el índice Fps respecto al modelo YOLOv4, detectando 5 imágenes menos por segundo. El modelo YOLOv4_GECA_3 funciona mejor en términos de todos los índices, y mejora el [email protected] y la recuperación de la tarea de detección de cuerpos extraños del cinturón minero en un 1% y 0.6%, respectivamente, y el número adicional de parámetros resultantes de la adición del El mecanismo de atención de GECA es muy pequeño. A partir de los resultados experimentales, la combinación del mecanismo de atención GECA propuesto en este documento con CSPDarknet53, la red troncal del modelo YOLOv4, puede mejorar el rendimiento de detección de cuerpos extraños. Aunque el modelo YOLOv4_GECA_3 ha reducido el índice Fps, detectando 30 imágenes de objetos extraños por segundo, todavía puede satisfacer la demanda de la tarea de detección de objetos extraños del cinturón minero desde la situación práctica y puede aplicarse en el proceso de producción real.

Se utiliza un mecanismo de tasa de aprendizaje de recocido de coseno de reinicio en el proceso de entrenamiento del modelo mejorado de detección de cuerpos extraños YOLOv4_GECA_3 en el conjunto de datos de cuerpos extraños del cinturón minero. El modelo YOLOv4 se entrena con el mecanismo de tasa de aprendizaje de recocido de coseno, y su proceso de caída de la tasa de aprendizaje se muestra en la Fig. 15. El valor de la tasa de aprendizaje inicial es 0,01, que decae lentamente al comienzo de la fase de entrenamiento y disminuye rápidamente a medida que la capacitación procede, y decrece en la etapa final del entrenamiento del modelo, con una tasa de aprendizaje final de 0.0005.

El proceso de decaimiento de la tasa de aprendizaje del modelo YOLOV4.

Dado que la disminución de la tasa de aprendizaje del recocido de coseno es pequeña en la última etapa del entrenamiento del modelo y puede caer en mínimos locales, este documento utiliza un mecanismo de tasa de aprendizaje de reinicio del recocido de coseno para aumentar la tasa de aprendizaje cuando la tasa de aprendizaje es pequeña en la última etapa de Entrenamiento del algoritmo de descenso de gradiente estocástico, para que el proceso de optimización salte de los mínimos locales y encuentre el camino hacia el mínimo global. En este documento, se probaron la tasa de aprendizaje de un reinicio, la tasa de aprendizaje de dos reinicios, la tasa de aprendizaje de tres reinicios y la tasa de aprendizaje de cuatro reinicios, como se muestra en la Fig. 16. En la Fig. 16, los gráficos de se muestra la tasa de aprendizaje del recocido de coseno para un número diferente de reinicios, de izquierda a derecha y de arriba a abajo, reinicio primario, reinicio secundario, reinicio terciario y reinicio cuádruple, con una tasa de aprendizaje inicial de 0,01 y una tasa de aprendizaje final de 0.0005. Los puntos de reinicio se ubican en los puntos donde las rondas de entrenamiento se dividen uniformemente, como cuatro tasas de aprendizaje de reinicio, cuyos puntos de reinicio se ubican cuando el modelo se entrena a las rondas 200, 400, 600 y 800, respectivamente. El valor inicial de cada reinicio de la tasa de aprendizaje es el valor máximo de la tasa de aprendizaje anterior multiplicado por un factor de escala, que se utiliza en este documento como 0,7.

Establezca diferentes tasas de aprendizaje de recocido de coseno de reinicio.

El proceso de entrenamiento del modelo utiliza un método de recesión de la tasa de aprendizaje de recocido de coseno de reinicio, que hace que la función de pérdida cambie debido al aumento en la tasa de aprendizaje durante el reinicio de la tasa de aprendizaje. En este documento, YOLOv4_GECA_3_SGDR_4 indica que se realizaron cuatro operaciones de tasa de aprendizaje de reinicio durante el entrenamiento del modelo YOLOv4_GECA_3, y así sucesivamente. El proceso de entrenamiento del modelo YOLOv4_GECA_3_SGDR_4 se ilustra en la Fig. 17 con una gran fluctuación en la función de pérdida de clasificación durante el reinicio de la tasa de aprendizaje, seguida de una disminución continua en la función de pérdida.

Cambios en la pérdida de clasificación durante el entrenamiento del modelo YOLOv4_GECA_3_SGDR_4.

El modelo YOLOv4_GECA_3 con un método de decaimiento de la tasa de aprendizaje de recocido de coseno de reinicio introducido durante el proceso de entrenamiento se probó en el conjunto de prueba después de completar el entrenamiento, y los resultados de la prueba se muestran en la Tabla 3. La Tabla 3 contiene los resultados de la prueba del modelo YOLOv4 con parámetros para el modelo mejorado YOLOv4_GECA con un número diferente de tasas de aprendizaje de reinicio y la red YOLOv4_GECA_3_Decay con caída exponencial de las tasas de aprendizaje. Los resultados muestran que un enfoque de decaimiento de la tasa de aprendizaje de recocido de coseno de reinicio es superior al enfoque de decaimiento exponencial en el modelo YOLOv4_GECA. En la tabla, podemos ver que el modelo YOLOv4_GECA_3_SGDR_1 tiene el [email protected] y el índice de recuperación más altos, donde la precisión promedio de 0.901 es un 0.6 % más alta que la de YOLOv4_GECA_3, y la recuperación de 0.907 es un 1.3 % más alta que la de YOLOv4_GECA_3. La tasa de aprendizaje de triple reinicio también trae una gran mejora en el rendimiento del modelo, con un [email protected] de 0.898 en comparación con YOLOv4_GECA_3, y un Recall de 0.899 en comparación con YOLOv4_GECA_3, una mejora del 0.5 %. En conjunto, la introducción de un enfoque de disminución de la tasa de aprendizaje de recocido de coseno de reinicio durante el entrenamiento es eficaz y no impone ninguna carga sobre los parámetros del modelo, y no tiene ningún efecto sobre la velocidad de detección del modelo.

El modelo de detección de cuerpos extraños en este estudio está entrenado en el conjunto de datos de imágenes de cuerpos extraños del cinturón de minería de fabricación propia, y la comparación experimental muestra que el modelo YOLOv4 funciona mejor en términos de precisión y recuperación en comparación con YOLOv3, YOLOv3-spp y YOLOv5. modelos, con un mAP de 0.885 y un Recall de 0.888, por lo que el modelo YOLOv4 se elige como el modelo base para la detección de cuerpos extraños, y mejora la estructura del modelo YOLOv4 y la forma de decaer la tasa de aprendizaje durante el entrenamiento, respectivamente. En primer lugar, se mejora la estructura del modelo YOLOv4 y se construye el modelo YOLOv4_GECA en la red troncal CSPDarknet53 mediante la combinación del mecanismo de atención GECA propuesto en este documento. Al entrenar y probar el modelo YOLOv4_GECA con diferentes hiperparámetros k por separado, se obtiene el mejor rendimiento del modelo YOLOv4_GECA_3. A continuación, se mejora el método de disminución de la tasa de aprendizaje durante el entrenamiento del modelo YOLOv4_GECA_3, y se propone el método de disminución de la tasa de aprendizaje de recocido de coseno de reinicio para mejorar aún más el rendimiento del modelo. YOLOv4_GECA_3_SGDR_1 tiene el mejor desempeño con un mAP de 0.901 y un Recall de 0.907. La Figura 18 muestra la comparación de rendimiento de los modelos YOLOv4, YOLOv4_GECA_3 y YOLOv4_GECA_3_SGDR_1, y podemos ver que mAP y Recall del modelo YOLOv4 mejoran después de combinar el mecanismo de atención GECA propuesto en este documento. El rendimiento del modelo se mejora aún más con el método de descomposición. El enfoque de mejora del modelo en este estudio mejora el rendimiento de cuerpos extraños del modelo, reduce la tasa de detección perdida y detección falsa, y aún se puede aplicar en el proceso de producción real, aunque hay una disminución en la velocidad de detección.

Comparación del rendimiento del modelo.

Para diferentes reconocimientos de cuerpos extraños, las tablas 4 y 5 muestran los resultados de los modelos YOLOv4, YOLOv4_GECA_3 y YOLOv4_GECA_3_SGDR_1 para cada tipo de reconocimiento de cuerpos extraños, respectivamente. En la Tabla 4, se puede ver que los dos modelos mejorados YOLOv4_GECA y YOLOv4_GECA_SGDR_1 propuestos en este documento mejoran la precisión de detección de cada categoría de cuerpos extraños en comparación con el modelo base YOLOv4, por ejemplo, el [email protected] del modelo YOLOv4 en cable de acero la detección de cuerpos extraños es de solo 0,638, mientras que YOLOv4_GECA_3 mejora este índice a 0,664. También en la Tabla 5, se puede ver que el modelo mejorado en este documento mejora el Recall para cada categoría de detección de cuerpos extraños, YOLOv4 tiene un Recall de 0,957 para detección de cuerpos extraños en tuberías de plástico, mientras que YOLOv4_GECA_3 mejora el índice a 0,975. Los resultados de estas dos tablas muestran que el mecanismo de atención GECA propuesto en este trabajo ha mejorado la detección de cuerpos extraños difíciles causados ​​por objetos pequeños, la oclusión parcial de cuerpos extraños y la interferencia de polvo, demostrando la efectividad del mecanismo de atención GECA.

En la Fig. 19 se muestra una comparación de los resultados de predicción de los modelos YOLOv4, YOLOv4_GECA y YOLOv4_GECA_SGDR para algunas imágenes. Se muestran tres imágenes que contienen cuerpos extraños de izquierda a derecha, y los resultados de detección de tres modelos de detección de objetos para imágenes de cuerpos extraños son se muestra en orden de arriba hacia abajo. En la imagen Image4, se puede ver que el cuerpo extraño del cable de acero está parcialmente oscurecido y el modelo YOLOv4 se desvía al predecir la ubicación del cuerpo extraño en comparación con los otros dos modelos mejorados, y los modelos mejorados YOLOv4_GECA y YOLOv4_GECA_SGDR en este documento son más precisos. en la detección del cuerpo extraño. En la imagen Image5, influenciada por la luz y la oclusión, el modelo YOLOv4 experimentó un falso positivo, prediciendo un solo cuerpo extraño de cable de acero como dos, y la confianza de predicción del tubo de plástico fue menor que la de los otros dos modelos mejorados. En la imagen Image6, debido a la barra de refuerzo enterrada y relativamente pequeña, que fue perturbada por el polvo, la luz y el oscurecimiento de muchos factores, el modelo YOLOv4 experimentó una detección de cuerpo extraño de barra de refuerzo perdida, lo que tendría un impacto en la seguridad de producción posterior. La comparación de los resultados de detección de imágenes muestra que los dos modelos mejorados YOLOv4_GECA y YOLOv4_GECA_SGDR propuestos en este documento son más efectivos que el modelo base YOLOv4 para detectar objetos pequeños, cuerpos extraños parcialmente oscurecidos y cuerpos extraños difíciles de identificar debido a la interferencia del polvo. En resumen, el modelo YOLOv4_GECA mejorado propuesto con mecanismo de atención basado en GECA y el modelo YOLOv4_GECA_SGDR propuesto con tasa de aprendizaje de recocido de coseno de reinicio decreciente se validan utilizando experimentos comparativos para mejorar la precisión de detección y el recuerdo de detección en la detección de cuerpos extraños difíciles de identificar. causado por objetos pequeños, cuerpos extraños parcialmente oscurecidos e interferencia de polvo, y se puede aplicar al sitio real de transporte de mineral.

Comparación del efecto de detección de los tres modelos.

Este documento selecciona YOLOv4 como el modelo básico de detección de objetos extraños y propone el mecanismo de atención GECA para construir el modelo YOLOv4_GECA, que puede explotar completamente la información de contexto global del mapa de características, obtener la relación de dependencia entre cada canal y mejorar la capacidad de extracción de características. del modelo para objetos extraños diana pequeños, objetos extraños parcialmente ocluidos e imágenes de interferencia de polvo. También se propone mejorar el método de decaimiento de la tasa de aprendizaje original de YOLOv4 mediante la construcción de un método de decaimiento de la tasa de aprendizaje de recocido de coseno de reinicio basado en el modelo YOLOv4_GECA con la red YOLOv4_GECA_SGDR. Esta red aumenta la versatilidad del proceso de entrenamiento y optimización de la red de detección de objetos extraños y mejora el rendimiento del modelo en la detección de imágenes de objetos extraños sin aumentar la carga del modelo, que es más adecuado para el entrenamiento de modelos de detección de objetos extraños para correas mineras. . Se realizaron experimentos en el conjunto de datos de detección de cuerpos extraños del cinturón minero creado, y los resultados del análisis experimental mostraron que la precisión y la recuperación del método YOLOv4_GECA propuesto en este documento mejoraron significativamente y lograron un equilibrio de precisión y velocidad, donde la precisión alcanzó 0.901, el Recall 0.907 y el Fps 30.31 ms, logrando el propósito de mejorar la detección de cuerpos extraños en cinturones minerales.

Los conjuntos de datos utilizados y/o analizados durante el estudio actual están disponibles del autor correspondiente a pedido razonable.

Janssens, E., De Beenhouwer, J. y Van Dael, M. Red neuronal Proyección retrofiltrada basada en la transformada de Hilbert para una inspección rápida de rayos X en línea. medida ciencia Tecnología 29(3), 034012 (2018).

Artículo ANUNCIOS Google Académico

Ren S, He K, Girshick R, et al. r-CNN más rápido: hacia la detección de objetos en tiempo real con redes de propuestas regionales. Adv. Información neuronal Proceso. sist. 28 (2015).

Redmon, J., Divvala, S., Girshick, R., et al. Solo mira una vez: Detección unificada de objetos en tiempo real. en la Conferencia IEEE de 2016 sobre visión artificial y reconocimiento de patrones, Las Vegas, EE. UU., 2016: 779–788. doi: https://doi.org/10.1109/CVPR.2016. 91.

Redmon, J. and Farhadi, A. YOLO9000: Mejor, más rápido, más fuerte. en la Conferencia IEEE de 2017 sobre visión por computadora y reconocimiento de patrones, Honolulu, EE. UU., 2017: 6517–6525. doi: https://doi.org/10.1109/CVPR.2017.690.

Redmon, J. and Farhadi, A. YOLOv3: Una mejora incremental. preimpresión de arXiv arXiv:1804.02767, (2018).

Bochkovskiy A, Wang CY, Liao HYM. YOLOv4: Velocidad y precisión óptimas de detección de objetos. arXiv: 2004.10934, (2020).

Liu W, Anguelov D, Erhan D, et al. SSD: detector MultiBox de disparo único. en Actas de la 14ª Conferencia Europea sobre Visión por Computador. Ámsterdam: Springer, 2016. 21–37.

Jocher, G., Stoken, A., Borovec, J., et al. Ultralytics/YOLOv5: V3.1: correcciones de errores y mejoras de rendimiento [EB/OL]. https://doi.org/10.5281/zenodo.4154370 (2020).

Li, C., Li, L., Jiang, H., et al. YOLOv6: un marco de detección de objetos de una sola etapa para aplicaciones industriales. preimpresión de arXiv arXiv:2209.02976, (2022).

Wang, CY, Bochkovskiy, A., Liao, HYM YOLOv7: La bolsa de obsequios entrenables establece un nuevo estado del arte para los detectores de objetos en tiempo real. preimpresión de arXiv arXiv:2207.02696, (2022).

Cao, X. et al. CNN basado en regiones para la detección de objetos extraños en el pavimento del aeródromo. Sensores 18(3), 737 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Xu, H. et al. Reconocimiento de material de desechos de objetos extraños basado en redes neuronales convolucionales. J. Procesamiento de video de imagen. 2018, 21. https://doi.org/10.1186/s13640-018-0261-2 (2018).

Artículo Google Académico

Rong, D., Xie, L. y Ying, Y. Detección por visión artificial de objetos extraños en nueces mediante el aprendizaje profundo. computar Electrón. agricola 162, 1001–1010 (2019).

Artículo Google Académico

Él, Q. et al. Detección de cuerpos extraños en los bajos de trenes de alta velocidad basada en aprendizaje profundo. Acceso IEEE 7, 183838–183846. https://doi.org/10.1109/ACCESS.2019.2960439 (2019).

Artículo Google Académico

Pang, L. et al. Detección de objetos ocultos en tiempo real a partir de imágenes de ondas milimétricas pasivas basadas en el algoritmo YOLOv3. Sensores 20(6), 1678 (2020).

Artículo ADS PubMed PubMed Central Google Scholar

Chen, Y. et al. Aplicación del algoritmo YOLOv4 para la detección de objetos extraños en una cinta transportadora en un entorno de baja iluminación. Sensores 22(18), 6851 (2022).

Artículo ADS PubMed PubMed Central Google Scholar

Qiu, Z. et al. Aplicación de un algoritmo YOLOv5 mejorado en la detección en tiempo real de objetos extraños por radar de penetración terrestre. Teledetección 14(8), 1895 (2022).

Artículo ANUNCIOS Google Académico

Jing, Y. et al. Detección de desechos de objetos extraños para sensores ópticos de imágenes basados ​​en bosques aleatorios. Sensores 22(7), 2463 (2022).

Artículo ADS PubMed PubMed Central Google Scholar

Abramson, HG et al. Detección automática de cuerpos extraños en neurocirugía utilizando un enfoque de aprendizaje profundo en imágenes de ultrasonido intraoperatorias: desde modelos animales hasta las primeras pruebas en humanos. Frente. Cirugía 30(9), 1040066. https://doi.org/10.3389/fsurg.2022.1040066 (2022).

Artículo Google Académico

Sowmya V, Radha R. Detección de vehículos pesados ​​basada en YOLOv4 con técnicas de aprendizaje de transferencia y aumento de datos. en Journal of Physics: Serie de conferencias. Vol. 1911, 1, 012029 (IOP Publishing, 2021).

Hou Z, Liu X, Chen L. Algoritmo de detección de objetos para mejorar la supresión no máxima utilizando GIoU.in Serie de conferencias IOP: Ciencia e ingeniería de materiales. vol. 720, no: 1, 012062 (IOP Publishing, 2020).

Wang CY, Liao HYM, Wu YH, et al. CSPNet: una nueva columna vertebral que puede mejorar la capacidad de aprendizaje de CNN. en Actas de la conferencia IEEE/CVF sobre visión artificial y talleres de reconocimiento de patrones. 390–391 (2020).

Ge, R. et al. Red convolucional de compresión y excitación para la detección de arritmias por ECG. Artefacto Intel. Medicina. 121, 102181 (2021).

Artículo PubMed Google Académico

Descargar referencias

Este trabajo fue apoyado en parte por el Programa Nacional de Investigación y Desarrollo Clave de China bajo la Subvención 2020AAA0109200; en parte por el Programa de Talentos de Revitalización de Liaoning bajo la Subvención XLYC2008020; en parte por la Fundación Nacional de Ciencias Naturales de China bajo la Subvención 52074064; en parte por los Fondos de Investigación Fundamental para las Universidades Centrales de China bajo la Subvención N2304006, la Subvención N2204006 y la Subvención N2104026.

Escuela de Ingeniería y Ciencias de la Información, Universidad del Noreste, Shenyang, 110004, China

Dong Xiao, Panpan Liu y Hang Yu

Laboratorio clave de Liaoning de diagnóstico inteligente y seguridad para la industria metalúrgica, Universidad del Noreste, Shenyang, 110819, China

Dong Xiao y Panpan Liu

Instituto Shenyang de Tecnología Informática Co. Ltd., CAS, Shenyang, 110168, Liaoning, China

wang jichun

Facultad de Ciencias, Universidad Shenyang Jianzhu, Shenyang, 110168, Liaoning, China

wang jichun

El primer hospital de la Universidad Médica de China, Shenyang, China

Zheng Min Gu

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

DX diseñó el estudio y escribió el texto principal del manuscrito. PL datos recogidos. JW analizó e interpretó los datos. ZG preparó figuras y tablas. HY revisó el manuscrito. Todos los autores revisaron el manuscrito.

Correspondencia a Dong Xiao.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Xiao, D., Liu, P., Wang, J. et al. Método de detección de cuerpos extraños en el cinturón minero basado en el modelo YOLOv4_GECA. Informe científico 13, 8881 (2023). https://doi.org/10.1038/s41598-023-35962-3

Descargar cita

Recibido: 10 febrero 2023

Aceptado: 26 de mayo de 2023

Publicado: 01 junio 2023

DOI: https://doi.org/10.1038/s41598-023-35962-3

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.