Modelo predictivo basado en algoritmos de machine learning para la estimación del peso de racimos de banano en una hacienda
Predictive model based on machine learning algorithms for estimating the weight of banana bunches on a farm
DOI:
https://doi.org/10.56712/latam.v5i6.3061Palabras clave:
productividad, machine learning, random forest, xgboost, regression, IOTResumen
La agricultura en el ámbito Bananero no se ha visto beneficiada fuertemente por los diferentes avances tecnológicos en materia de Ciencia de Datos y Machine Learning, estas técnicas ayudan a entender los patrones y las dinámicas que sigue sus datos, de esta forma, el objetivo principal de esta investigación es utilizar técnicas de Machine Learning para predecir pesos de racimos, para posteriormente realizar un análisis que le permita a un Productor Bananero tomar las mejores decisiones para sus plantaciones y obtener una buena productividad. En primera instancia de este trabajo investigativo consistió en recopilar todos los datos necesarios para entrenamiento y validación de los modelos de predicción para la variable peso (peso del racimo). Los datos son preprocesados estadísticamente, se entrenan y se validan los modelos con el programa R Studio, en este caso se utilizó el algoritmo Random Forest, y el Xgboost que resultó ser más eficiente en la predicción de los pesos de racimos, aunque no hubo mucha diferencia entre estos dos algoritmos, se eligió este último como el mejor algoritmo de predicción por el resultados de sus indicadores de métricas de evaluación del error como: Error Absoluto Medio (MAE) para Random Forest fue de 13.2 y en el modelo Xgboost fue de 13.1 por lo consiguiente se tiene una mínima diferencia entre los dos modelos. Posteriormente se espera realizar muchas más combinaciones con diferentes variables en torno a la producción Bananera, para una mejor eficiencia de este modelo de predicción de peso de racimos de banano se necesitaría que las plantaciones se encuentren monitoreadas por sensores IOT y dependiendo su naturaleza obtener diferentes variables y obtener conclusiones relacionadas a una mayor productividad de las Haciendas Bananeras.
Descargas
Citas
Allouhi, A., Choab, N., Hamrani, A., and Saadeddine, S. (2021). Machine learning algorithms to assess the thermal behavior of a moroccan agriculture greenhouse. Cleaner Engineering and Technology, 5:100346 DOI: https://doi.org/10.1016/j.clet.2021.100346
Arteaga, J. J. G., Zambrano, J. J. Z., Cevallos, R. A., and Romero, W. D. Z. (2020). Predicción del rendimiento de cultivos agrícolas usando aprendizaje automático. Revista Arbitrada Interdisciplinaria Koinonía, 5(2):144–160. DOI: https://doi.org/10.35381/r.k.v5i2.1013
Balducci, F., Impedovo, D., and Pirlo, G. (2018). Machine learning applications on agricultural datasets for smart farm enhancement. Machines, 6(3):38. DOI: https://doi.org/10.3390/machines6030038
Bernal Pablo, P. (2018). La Investigación en Ciencias Sociales: Técnicas de recolección de la información. DOI: https://doi.org/10.2307/j.ctv7fmfjk
Cantero Díaz, A., Goire Castilla, M. M., and Quintana Cassulo, Y. (2019). Sistema para la gestión y análisis de datos de una red de sensores inalámbricos basado en un almacén de datos. Revista Cubana de Ciencias Informáticas, 13(3):76–90.
Cedric, L. S., Adoni, W. Y. H., Aworka, R., Zoueu, J. T., Mutombo, F. K., Krichen, M., and Kimpolo, C. L. M. (2022). Crops yield prediction based on machine learning models: Case of west african countries. Smart Agricultural Technology, page 100049. DOI: https://doi.org/10.1016/j.atech.2022.100049
Chandraprabha, M. and Dhanaraj, R. K. (2020). Machine learning based pedantic analysis of predictive algorithms in crop yield management. In 2020 4th International Conference on Electronics, Communication and Aerospace Technology (ICECA), pages 1340–1345. DOI: https://doi.org/10.1109/ICECA49313.2020.9297544
Chlingaryan, A., Sukkarieh, S., and Whelan, B. (2018). Machine learning approaches for crop yield prediction and nitrogen status estimation in precision agriculture: A review. Computers and electronics in agriculture, 151:61–69. DOI: https://doi.org/10.1016/j.compag.2018.05.012
Crisóstomo Fernández, F. L., Lajo Aurazo, A. S., Hernández Quiroz, G. V., Asen- cio Diaz, L. d. l. A. M., and Chiang Cornejo, R. H. (2021). Técnicas de machine learning para la clasificación automática de clientes en una empresa de seguros.
Dadas, S., Protasiewicz, J., and Pedrycz, W. (2019). A deep learning model with data enrichment for intent detection and slot filling. In 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC), pages 3012–3018. IEEE. DOI: https://doi.org/10.1109/SMC.2019.8914542
Deepa, S., Alli, A., Gokila, S., et al. (2021). Machine learning regression model for material synthesis prices prediction in agriculture. Materials Today: Proceedings.
Degfie, T. A., Mamo, T. T., and Mekonnen, Y. S. (2019). Optimized biodiesel production from waste cooking oil (wco) using calcium oxide (cao) nano-catalyst. Scientific reports, 9(1):1–8. DOI: https://doi.org/10.1038/s41598-019-55403-4
Developers, S.-L. (2021). Metrics and scoring: Quantifying the quality of predictions. User Guide,[entre 2007 e 2019]. Disponível em: https://scikit-learn. org/stable/mo- dules/model_evaluation. html. Acesso em, 26.
Eulogio, R. (2017). Introduction to random forests. Oracle+ DataScience. com.
González, C. A. G. and Hernandez, V. (2020). Clasificador de productos agrícolas para control de calidad basado en machine learning e industria 4.0. Revista Perspectivas, 2(2):21–28. DOI: https://doi.org/10.47187/perspectivas.vol2iss2.pp21-28.2020
Herrera-Díaz, C. (2016). Implementación de un módulo de análisis estadístico y predictivo para agricultura utilizando bigdata y machine learning, integrado al sistema iotmach.[implementation of a statistical and predictive analysis module for agriculture using bigdata and machine learning, integrated to the iotmach system]. Trabajo de titulación. Carrera de ingeniería de sistemas. Universidad Técnica de Machala. Recuperado de https, (9).
Jiménez, J. U. (2019). Introducción a r y rstudio. DOI: https://doi.org/10.2307/j.ctvx5w86p.5
Kotu, V. and Deshpande, B. (2015). Data mining process. Predictive analytics and data mining, 1:17–36. DOI: https://doi.org/10.1016/B978-0-12-801460-8.00002-1
Kuhn, M., Wing, J., Weston, S., Williams, A., Keefer, C., and Engelhardt, A. (2016). Caret: classification and regression training package. R package version, pages 6 0.
León Serrano, L. A., Arcaya Sisalima, M. F., Barbotó Velásquez, N. A., and Bermeo Pi- neda, Y. L. (2021). Ecuador: Análisis comparativo de las exportaciones de banano orgánico y convencional e incidencia en la balanza comercial, 2018. DOI: https://doi.org/10.26423/rctu.v7i2.521
Lopez Briega, R. (2015). Machine learning con python.
Maduranga, M. and Abeysekera, R. (2020). Machine learning applications in iot based agriculture and smart farming: A review. Int. J. Eng. Appl. Sci. Technol, 4(12):24–27. DOI: https://doi.org/10.33564/IJEAST.2020.v04i12.004
Marqués Gozalbo, M. Á. (2022). Modelos predictivos de producción agroindustrial con machine learning a partir de fuentes de información pública.
Meshram, V., Patil, K., Meshram, V., Hanchate, D., and Ramkteke, S. (2021). Machine learning in agriculture domain: A state-of-art survey. Artificial Intelligence in the Life Sciences, 1:100010. DOI: https://doi.org/10.1016/j.ailsci.2021.100010
Mohd Shafri, H. Z. M. S. and Arenas París, C. (2019). Artificial intelligence (ai) in oil palm remote sensing applications.
Ortega, A. O. (2018). Enfoques de investigación. Métodos para el diseño urbano– Arquitectónico.
Pallares Cabrera, F. (2015). Desarrollo de un modelo basado en machine learning para la predicción de la demanda de habitaciones y ocupacion en el sector hotelero.
Pereyra, L. E. (2020). Metodología de la investigación.
Rezk, N. G., Hemdan, E. E.-D., Attia, A.-F., El-Sayed, A., and El-Rashidy, M. A. (2021). An efficient iot based smart farming system using machine learning algorithms. Multimedia Tools and Applications, 80(1):773–797. DOI: https://doi.org/10.1007/s11042-020-09740-6
Slob, N., Catal, C., and Kassahun, A. (2021). Application of machine learning to improve dairy farm management: A systematic literature review. Preventive Veterinary Medicine, 187:105237. DOI: https://doi.org/10.1016/j.prevetmed.2020.105237
Swami, D., Shah, A. D., and Ray, S. K. (2020). Predicting future sales of retail products using machine learning. arXiv preprint arXiv:2008.07779.
VanderPlas, J. (2016). Python data science handbook: Essential tools for working with data.
Villafuerte Chacnama, F. F. (2021). Análisis comparativo de modelos de pronóstico arima y xgboost aplicados a las series mensuales de ventas en una empresa certificadora.
Wickham, H. and Grolemund, G. (2017). R for data science: Import. Tidy, transform, visualize, and model data, 1.