El presente artículo compara el desempeño de cuatro modelos de aprendizaje profundo en la tarea de clasificación de imágenes de plántulas vegetales capturadas en condiciones naturales. Se utilizaron una red neuronal convolucional (CNN) personalizada y tres arquitecturas preentrenadas: MobileNetV2, ResNet50 y EfficientNetB0. El conjunto de datos empleado fue el Plant Seedlings Dataset, que contiene más de 4.700 imágenes de doce especies diferentes. La metodología incluyó preprocesamiento de imágenes, aumento de datos, entrenamiento en Google Colab y evaluación con métricas como exactitud, F1-score macro y matrices de confusión. Los resultados muestran que los modelos basados en transferencia de aprendizaje superan significativamente a la CNN personalizada en precisión y capacidad de generalización. EfficientNetB0 obtuvo el mejor desempeño global (98.51% de precisión), mientras que MobileNetV2 destacó por su eficiencia computacional (5 ms por predicción). ResNet50 logró una precisión competitiva (98.11%), aunque con mayores costos de entrenamiento e inferencia. Este trabajo demuestra que las arquitecturas modernas permiten clasificaciones precisas incluso en escenarios visualmente complejos, y ofrece una guía comparativa para la selección de modelos según necesidades de precisión y recursos disponibles. Los hallazgos son relevantes para aplicaciones de inteligencia artificial en ecología, monitoreo ambiental y agricultura de precisión.
This article compares the performance of four deep learning models for the classification of seedling plant images captured under natural conditions. A custom convolutional neural network (CNN) and three pre-trained architectures—MobileNetV2, ResNet50, and EfficientNetB0—were evaluated using the Plant Seedlings Dataset, which contains over 4,700 images across twelve different species. The methodology involved image preprocessing, data augmentation, training in Google Colab, and evaluation through accuracy, macro F1-score, and confusion matrices. Results indicate that transfer learning models significantly outperform the custom CNN in terms of accuracy and generalization. EfficientNetB0 achieved the best overall performance (98.51% accuracy), while MobileNetV2 stood out for its computational efficiency (5 ms per prediction). ResNet50 reached competitive accuracy (98.11%) but required higher training and inference costs. The study confirms that modern architectures enable highly accurate classification even in visually complex scenarios and provides a comparative guide for model selection based on precision and computational constraints. These findings are relevant for real-world applications of artificial intelligence in ecology, environmental monitoring, and precision agriculture.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados