مقایسه الگوریتم‌های ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک در پهنه‌بندی خطر زمین‌لغزش در جاده مهاباد سردشت

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دکترای تخصصی، دانشیار، گروه آموزشی سنجش از دور و سیستم اطلاعاتی جغرافیایی، دانشکده علوم جغرافیایی، دانشگاه خوارزمی

2 دانشجوی کارشناسی ارشد، دانشکده علوم جغرافیایی، دانشگاه خوارزمی

چکیده

در تحقیق حاضر به ارزیابی و پهنه‌بندی خطر زمین‌لغزش در محدوده مهاباد تا سردشت با کاربرد مدل‌های تحلیلی مختلف از قبیل ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک پرداخته شده است. روش انجام تحقیق حاضر مبتنی بر روش توصیفی – تحلیلی و کاربرد مقایسه‌ای صحت الگوریتم‌های ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک بوده است. بر این اساس از داده‌ها و معیارهای مختلف محیطی در فرآیند تجزیه و تحلیل استفاده گردیده است. ابتدا بر اساس تعیین نقاط نمونه، سه مدل مذکور به منظور تهیه نقشه پهنه‌بندی زمین‌لغزش به اجرا درآمده است و سپس بر اساس نتایج، اقدام به ارزیابی و اعتبارسنجی نتایج مدل‌های مورد استفاده شده است. نتایج پهنه‌بندی زمین‌لغزش محدوده مورد مطالعه حاکی از این بوده است که به‌طورکلی نیمه جنوبی منطقه به دلیل تأثیر عواملی از قبیل ساختارهای متراکم گسلی، شیب بالاتر و تراکم بیشتر آبراهه از پتانسیل بالاتری نسبت به نیمه شمالی آن برخوردار است و بر اساس ماشین بردار پشتیبان 04/71 درصد، بر اساس جنگل تصادفی 44/53 درصد و بر اساس رگرسیون لجستیک 39/77 درصد از مجموع وسعت منطقه دارای حساسیت لغزشی متوسط به بالا بوده است. ارزیابی دقت حاصله برای الگوریتم‌ها بر اساس منحنی ROC چنین مشخص نموده است که ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک به ترتیب مقدار صحت 76/0، 87/0 و 84/0 را به خود اختصاص داده‌اند و از این نظر الگوریتم جنگل تصادفی بهترین دقت را ارائه کرده است. همچنین شاخص Precision – Recall نیز به ترتیب برابر با 809/0، 873/0 و 844/0 به دست آمده است که بیانگر دقت بالاتر الگوریتم جنگل تصادفی نسبت به دو الگوریتم دیگر در زمینه پهنه‌بندی پتانسیل خطر وقوع زمین‌لغزش در مسیر مهاباد – سردشت می‌باشد.

تازه های تحقیق

با توجه به خسارات ناشی از وقوع خطر زمینلغزش در مناطق مختلف، ضروری است که تهیه نقشه پهنهبندی حساسیت زمینلغزش و شناسایی مناطق مستعد با روشها و ابزارهای مناسب مد نظر قرار گیرد. بدینمنظور در تحقیق حاضر به منظور پهنهبندی حساسیت زمینلغزش در محدوده مهاباد – سردشت در شمال غربی ایران ،سه الگوریتم ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک مورد استفاده واقع شده و کارایی آنها در این زمینه با یکدیگر مقایسه و ارزیابی گردید. مطابق نتایج و بر اساس شاخصهای مختلف ارزیابی صحت ،مدل جنگل تصادفی بهترین و بالاترین دقت را نسبت به مدل رگرسیون لجستیک و ماشین بردار پشتیبان در زمینه پهنهبندی زمینلغزش ارائه نموده است. از طرفی معیارهای محیطی مختلف در قالب ساختارهای توپوگرافی، زمینشناسی، هیدرولوژی و انسانی وارد فرآیند ارزیابی گردیده و تأثیر نسبی هر یک از عوامل در زمینه وقوع زمینلغزش در محدوده مورد مطالعه مشخص گردید. بر اساس نقشههای حاصله مشخص گردید که نیمه شمالی منطقه به دلایلی از قبیل شیب نسبی کمتر، ارتفاع کمتر، عدم وجود ساختار گسلی متراکم و تراکم کمتر آبراهه دارای حساسیت لغزشی پایینتری نسبت به نیمه جنوبی آن میباشد و از طرفی نواحی دارای حداکثر حساسیت لغزشی در بخشهای جنوب غربی و جنوب شرقی منطقه مستقر شده و درصد قابل توجهی از وقایع پیشین زمینلغزش نیز در آنجا به وقوع پیوسته است. علاوه بر این چنین مشخص گردیده است که سه ناحیه عمده در بخش جنوبی محدوده مهاباد – سردشت دارای حداکثر حساسیت به لحاظ وقوع خطر زمینلغزش میباشد که این سه ناحیه عبارتند از گردنه زمزیران از روستای کله گاوی تا روستای گویزان در منتهی الیه جنوب غربی منطقه، مسیر کوهستانی گرد شیلان تا نستان در بخش جنوب شرقی منطقه 

کلیدواژه‌ها

عنوان مقاله [English]

Using machine learning-based models for landslide susceptibility mapping in Mahabad-Sardasht road

نویسندگان [English]

  • Javad Sadidi 1
  • Reza Maliki 2

1 PhD, Associate Professor, Educational Department of Remote Sensing and Geographical Information System, Faculty of Geographical Sciences, Khwarazmi University

2 M.Sc student , Faculty of Geographical Sciences, Kharazmi University

چکیده [English]

In this research, the landslide susceptibility mapping in the area of Mahabad to Sardasht road has been done using different algorithms. The research method is based on the comparison of support vector machine, random forest, and logistic regression algorithms. In this regard, various environmental data and criteria have been used. First, based on the determination of the sample points, the three algorithms have been implemented in order to prepare the landslide susceptibility map, and then comparison and validation of the results of the used models have been addressed. The landslide zoning results have indicated that in general, the southern parts of the region have a higher susceptibility than the northern parts due to the influence of factors such as dense fault structures, higher slope, and higher density of waterways, and based on the support vector machine, it is 71.04%. According to random forest, 53.44% and according to logistic regression, 77.39% of the total area has medium to high landslide susceptibility. The accuracy assessment of the algorithms based on the ROC curve has determined that the support vector machine, random forest, and logistic regression have obtained accuracy values of 0.76, 0.87, and 0.84, respectively, and from this point of view, the random forest algorithm provided the best accuracy. Moreover, the Precision-Recall is equal to 0.809, 0.873, and 0.844, respectively, which indicates the higher accuracy of the random forest algorithm than the other two algorithms in the field of landslide susceptibility mapping in the Mahabad-Sardasht road.In this research, the landslide susceptibility mapping in the area of Mahabad to Sardasht road has been done using different algorithms. The research method is based on the comparison of support vector machine, random forest, and logistic regression algorithms. In this regard, various environmental data and criteria have been used. First, based on the determination of the sample points, the three algorithms have been implemented in order to prepare the landslide susceptibility map, and then comparison and validation of the results of the used models have been addressed. The landslide zoning results have indicated that in general, the southern parts of the region have a higher susceptibility than the northern parts due to the influence of factors such as dense fault structures, higher slope, and higher density of waterways, and based on the support vector machine, it is 71.04%. According to random forest, 53.44% and according to logistic regression, 77.39% of the total area has medium to high landslide susceptibility. The accuracy assessment of the algorithms based on the ROC curve has determined that the support vector machine, random forest, and logistic regression have obtained accuracy values of 0.76, 0.87, and 0.84, respectively, and from this point of view, the random forest algorithm provided the best accuracy. Moreover, the Precision-Recall is equal to 0.809, 0.873, and 0.844, respectively, which indicates the higher accuracy of the random forest algorithm than the other two algorithms in the field of landslide susceptibility mapping in the Mahabad-Sardasht road.

کلیدواژه‌ها [English]

  • Landslide
  • Machine learning
  • Random forest
  • Support vector machine
  • Mahabad-Sardasht

در تحقیق حاضر به ارزیابی و پهنهبندی خطر زمینلغزش در محدوده مهاباد تا سردشت با کاربرد مدلهای تحلیلی مختلف از قبیل ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک پرداخته شده است. روش انجام تحقیق حاضر مبتنی بر روش توصیفی – تحلیلی و کاربرد مقایسهای صحت الگوریتمهای ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک بوده است. بر این اساس از دادهها و معیارهای مختلف محیطی در فرآیند تجزیه و تحلیل استفاده گردیده است .ابتدا بر اساس تعیین نقاط نمونه، سه مدل مذکور به منظور تهیه نقشه پهنهبندی زمینلغزش به اجرا درآمده است و سپس بر اساس نتایج، اقدام به ارزیابی و اعتبارسنجی نتایج مدلهای مورد استفاده شده است. نتایج پهنهبندی زمینلغزش محدوده مورد مطالعه حاکی از این بوده است که بهطورکلی نیمه جنوبی منطقه به دلیل تأثیر عواملی از قبیل ساختارهای متراکم گسلی، شیب بالاتر و تراکم بیشتر آبراهه از پتانسیل بالاتری نسبت به نیمه شمالی آن برخوردار است و بر اساس ماشین بردار پشتیبان 90/12 درصد، بر اساس جنگل تصادفی 00/35 درصد و بر اساس رگرسیون لجستیک 50/11 درصد از مجموع وسعت منطقه دارای حساسیت لغزشی متوسط به بالا بوده است. ارزیابی دقت حاصله برای الگوریتمها بر اساس منحنی ROC چنین مشخص نموده است که ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک به ترتیب مقدار صحت 17/9، 71/9 و 70/9 را به خود اختصاص دادهاند و از این نظر الگوریتم جنگل تصادفی بهترین دقت را ارائه کرده است. همچنین شاخص Precision – Recall نیز به ترتیب برابر با 790/9، 715/9 و 700/9 به دست آمده است که بیانگر دقت بالاتر الگوریتم جنگل تصادفی نسبت به دو الگوریتم دیگر در زمینه پهنهبندی پتانسیل خطر وقوع زمینلغزش در مسیر مهاباد – سردشت میباشد .

  • Achour, Y. Pourghasemi, H.R. (2020). How do machine learning techniques help in increasing accuracy of landslide susceptibility maps? Geoscience Frontiers, 11(3); 871-883.
  • Ahmad, MN. Shao, Z. Aslam, RW. Ahmad, I. Liao, M. Li, X. Song, Y. (2022). Landslide hazard, susceptibility and risk assessment (HSRA) based on remote sensing and GIS data models: a case study of Muzaffarabad Pakistan. Stochastic Environmental Research and Risk Assessment. May 27; 1-6.
  • Akinci, H. Zeybek, M. (2021). Comparing classical statistic and machine learning models in landslide susceptibility mapping in Ardanuc (Artvin), Turkey. Natural Hazards, 108(2); 1515-1543.
  • Anastasiy, Motrenko. Strijov, Vadim. Weber, Gerhard-Wilhelm. (2014). Sample size determination for logistic regression. Journal of Computational and Applied Mathematics 255; 743-752.
  • Bennett, N.D. Croke, B.F. Guariso, G. Guillaume, J.H. Hamilton, S.H. Jakeman, A.J. MarsiliLibelli, S. Newham, L.T. Norton, J.P. Perrin, C. (2013). Characterizing performance of environmental models. Model, 4; 1–20.
  • Chen, W. Peng, J. Hong, H. Shahabi, H. Pradhan, B. Liu, J. Zhu, A.X. Pei, X. Duan, Z. (2018). Landslide susceptibility modelling using GIS-based machine learning techniques for Chongren county, Jiangxi province, China. Total Environ, 626; 1121–1135.
  • Hoang, N.D. Nguyen, Q.L. Bui, D.T. Image Processing-Based Classification of Asphalt Pavement Cracks Using Support Vector Machine Optimized by Artificial Bee Colony. (2018). Comput. Civ. Eng, 32; 04018037.
  • Hong, H. Shahabi, H. Shirzadi, A. Chen, W. Chapi, K. Ahmad, B.B. Roodposhti, M.S. Hesar, A.Y. Tian, Y. Bui, D.T. (2019). Landslide susceptibility assessment at the Wuning area, China: A comparison between multi-criteria decision making, bivariate statistical and machine learning methods. Hazards, 96; 173–212.
  • Hota, H. S. Handa, R Shrivas, A. K. (2017). Time series data prediction using sliding window based RBF neural network. International Journal of Computational Intelligence Research, )5(31; 1145-.6511
  • Kiani, S. Karimkhani, A. Mazidi, A. (2021). Landslide Risk Zoning using Logistic Regression and ANFIS Models in Hashtjin Catchment Area in Ardabil Province. Geography and Environmental Sustainability. 11(2); 55-73. doi: 10.22126/ges.2021.6461.2391. (In Persian).
  • Kornejady, A. Pourghasemi, H. R. (2019). 'Landslide Susceptibility Assessment Using Data Mining Models, A case study: Chehel-Chai Basin', Watershed Engineering and Management, )1(11; 28-42. doi: 10.22092/ijwmse.2019.118436. (In Persian).
  • Mahdavifard, M, Jafari, S. Valizadeh Kamran, K, Karimzadeh, S. (2022). Rapid monitoring of mangrove cover changes using support vector machine algorithm in Google Earth Engine

 

مقایسه الگوریتمهای ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک ...   جواد صدیقی ، رضا مالکی    88

computing platform (Case study: Qeshm mangrove forests). Remote Sensing and GIS Applications in Environmental Sciences, 2(2); 36-23. (In Persian).

  • Mersha, T. Meten, M. (2020). GIS-based landslide susceptibility mapping and assessment using bivariate statistical methods in Simada area, northwestern Ethiopia. Geoenvironmental disasters, 7(1); 1-22.
  • Miao, T. Wang, M. Susceptibility analysis of earthquake-induced landslide using random forest method. In proceedings of the international conference on computer information systems and industrial applications, Bangkok, Thailand, 28–29 June 2015; 1–1006. 136.
  • Ngo, T. Q. Dam, N. D. Al-Ansari, N. Amiri, M. Phong, T. V. Prakash, I. Pham, B. T. (2021). Landslide susceptibility mapping using single machine learning models: a case study from Pithoragarh District, India. Advances in civil engineering.
  • Niazi, Y. Mendoza, ME. Talebi, A. Bidaki, H. (2021). GIS-based support vector machine model in shallow landslide hazards prediction: A case study on Ilam dam watershed, Iran. Journal of Nature and Spatial Sciences (JONASS). 1(1); 59-84.
  • Pardeshi, SD. Autade, SE. Pardeshi, SS. (2013). Landslide hazard assessment: recent trends and techniques. SpringerPlus. )1(2; 1-.1
  • Su, Q. Zhang, J. Zhao, S. Wang, L. Liu, J. Guo, J. (2017). Comparative assessment of three nonlinear approaches for landslide susceptibility mapping in a coal mine area. ISPRS International Journal of Geo-Information. 6(7); 228.
  • Sukristiyanti, S. Wikantika, K. Sadisun, IA. Yayusman, LF. Soebowo, E. (2021). Preliminary Study of Landslide Susceptibility Modeling with Random Forest Algorithm Using R (Case Study: The Cisangkuy Sub-watershed). InIOP Conference Series: Earth and Environmental Science. 1(1); 012015. IOP Publishing.
  • Taheri, V. Karam, A. Safari, A. Shataii joibari, S. (2020). 'Landslides zoning of Golestan province using combination algorithm least squares support vector machines and artificial bee colony', Geographical Planning of Space, 10(37); 213-230. doi:

10.30488/gps.2021.177771.3022. (In Persian).

  • Tehrani, FS. Calvello, M. Liu, Z. Zhang, L. Lacasse, S. (2022). Machine learning and landslide studies: Recent advances and applications. Natural Hazards. 20; 1-.94
  • Tien Bui, D. Shahabi, H. Shirzadi, A. Chapi, K. Alizadeh, M. Chen, W. Mohammadi, A. Ahmad, B. Panahi, M. Hong, H. (2018). Landslide detection and susceptibility mapping by airsar data using support vector machine and index of entropy models in Cameron highlands, Malaysia. Remote Sens. 10; 1527.
  • Tsangaratos, P. Ilia, I. (2017). Applying machine learning algorithms in landslide susceptibility assessments. In Handbook of Neural Computation. 1: 433-457. Academic Press.

 

 

کاربرد سنجش از دور و GIS در علوم محیطی، شماره 0، سال اول ،پاییز 2092، صص 299-72

Application of remote sensing and GIS in environmental sciences, Vol. 1, No. 4, Fall 2022, pp. 81-100   999

  • Umar, Z. Pradhan, B. Ahmad, A. Jebur, M.N. Tehrany, M.S. (2014). Earthquake induced landslide susceptibility mapping using an integrated ensemble frequency ratio and logistic regression models in West Sumatera Province, Indonesia. Catena. 118; 124–135.
  • Wang, LJ. Guo, M. Sawada, K. Lin, J. Zhang, J. (2016). A comparative study of landslide susceptibility maps using logistic regression, frequency ratio, decision tree, weights of evidence and artificial neural network. Geosciences Journal. 20(1); 117-36.
  • Wubalem, A. (2021). Landslide susceptibility mapping using statistical methods in Uatzau catchment area, northwestern Ethiopia. Geoenvironmental Disasters. 8(1); 1-.12
  • Yi, Y. Zhang, Z. Zhang, W. Xu, C. (2019). Comparison of different machine learning models for landslide susceptibility mapping. In IGARSS 2019. IEEE International Geoscience and Remote Sensing Symposium. 9318-9321. IEEE.
  • Zhou, X. Wu, W. Lin, Z. Zhang, G. Chen, R Song, Y. Wang, Z. Lang, T. Qin, Y. Ou, P. Huangfu, W. (2020). Landslide risk zoning in Ruijin, Jiangxi, China. Natural Hazards and Earth System Sciences Discussions. 5; 1-.12
  • تاریخ دریافت: 12 آذر 1401
  • تاریخ بازنگری: 01 دی 1401
  • تاریخ پذیرش: 01 دی 1401