مقایسه الگوریتم‌های ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک در پهنه‌بندی خطر زمین‌لغزش در جاده مهاباد سردشت

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دکترای تخصصی، دانشیار، گروه آموزشی سنجش از دور و سیستم اطلاعاتی جغرافیایی، دانشکده علوم جغرافیایی، دانشگاه خوارزمی

2 دانشجوی کارشناسی ارشد، دانشکده علوم جغرافیایی، دانشگاه خوارزمی

چکیده

در تحقیق حاضر به ارزیابی و پهنه‌بندی خطر زمین‌لغزش در محدوده مهاباد تا سردشت با کاربرد مدل‌های تحلیلی مختلف از قبیل ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک پرداخته شده است. روش انجام تحقیق حاضر مبتنی بر روش توصیفی – تحلیلی و کاربرد مقایسه‌ای صحت الگوریتم‌های ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک بوده است. بر این اساس از داده‌ها و معیارهای مختلف محیطی در فرآیند تجزیه و تحلیل استفاده گردیده است. ابتدا بر اساس تعیین نقاط نمونه، سه مدل مذکور به منظور تهیه نقشه پهنه‌بندی زمین‌لغزش به اجرا درآمده است و سپس بر اساس نتایج، اقدام به ارزیابی و اعتبارسنجی نتایج مدل‌های مورد استفاده شده است. نتایج پهنه‌بندی زمین‌لغزش محدوده مورد مطالعه حاکی از این بوده است که به‌طورکلی نیمه جنوبی منطقه به دلیل تأثیر عواملی از قبیل ساختارهای متراکم گسلی، شیب بالاتر و تراکم بیشتر آبراهه از پتانسیل بالاتری نسبت به نیمه شمالی آن برخوردار است و بر اساس ماشین بردار پشتیبان 04/71 درصد، بر اساس جنگل تصادفی 44/53 درصد و بر اساس رگرسیون لجستیک 39/77 درصد از مجموع وسعت منطقه دارای حساسیت لغزشی متوسط به بالا بوده است. ارزیابی دقت حاصله برای الگوریتم‌ها بر اساس منحنی ROC چنین مشخص نموده است که ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون لجستیک به ترتیب مقدار صحت 76/0، 87/0 و 84/0 را به خود اختصاص داده‌اند و از این نظر الگوریتم جنگل تصادفی بهترین دقت را ارائه کرده است. همچنین شاخص Precision – Recall نیز به ترتیب برابر با 809/0، 873/0 و 844/0 به دست آمده است که بیانگر دقت بالاتر الگوریتم جنگل تصادفی نسبت به دو الگوریتم دیگر در زمینه پهنه‌بندی پتانسیل خطر وقوع زمین‌لغزش در مسیر مهاباد – سردشت می‌باشد.

کلیدواژه‌ها

عنوان مقاله [English]

Using machine learning-based models for landslide susceptibility mapping in Mahabad-Sardasht road

نویسندگان [English]

  • Javad Sadidi 1
  • Reza Maliki 2

1 PhD, Associate Professor, Educational Department of Remote Sensing and Geographical Information System, Faculty of Geographical Sciences, Khwarazmi University

2 M.Sc student , Faculty of Geographical Sciences, Kharazmi University

چکیده [English]

In this research, the landslide susceptibility mapping in the area of Mahabad to Sardasht road has been done using different algorithms. The research method is based on the comparison of support vector machine, random forest, and logistic regression algorithms. In this regard, various environmental data and criteria have been used. First, based on the determination of the sample points, the three algorithms have been implemented in order to prepare the landslide susceptibility map, and then comparison and validation of the results of the used models have been addressed. The landslide zoning results have indicated that in general, the southern parts of the region have a higher susceptibility than the northern parts due to the influence of factors such as dense fault structures, higher slope, and higher density of waterways, and based on the support vector machine, it is 71.04%. According to random forest, 53.44% and according to logistic regression, 77.39% of the total area has medium to high landslide susceptibility. The accuracy assessment of the algorithms based on the ROC curve has determined that the support vector machine, random forest, and logistic regression have obtained accuracy values of 0.76, 0.87, and 0.84, respectively, and from this point of view, the random forest algorithm provided the best accuracy. Moreover, the Precision-Recall is equal to 0.809, 0.873, and 0.844, respectively, which indicates the higher accuracy of the random forest algorithm than the other two algorithms in the field of landslide susceptibility mapping in the Mahabad-Sardasht road.In this research, the landslide susceptibility mapping in the area of Mahabad to Sardasht road has been done using different algorithms. The research method is based on the comparison of support vector machine, random forest, and logistic regression algorithms. In this regard, various environmental data and criteria have been used. First, based on the determination of the sample points, the three algorithms have been implemented in order to prepare the landslide susceptibility map, and then comparison and validation of the results of the used models have been addressed. The landslide zoning results have indicated that in general, the southern parts of the region have a higher susceptibility than the northern parts due to the influence of factors such as dense fault structures, higher slope, and higher density of waterways, and based on the support vector machine, it is 71.04%. According to random forest, 53.44% and according to logistic regression, 77.39% of the total area has medium to high landslide susceptibility. The accuracy assessment of the algorithms based on the ROC curve has determined that the support vector machine, random forest, and logistic regression have obtained accuracy values of 0.76, 0.87, and 0.84, respectively, and from this point of view, the random forest algorithm provided the best accuracy. Moreover, the Precision-Recall is equal to 0.809, 0.873, and 0.844, respectively, which indicates the higher accuracy of the random forest algorithm than the other two algorithms in the field of landslide susceptibility mapping in the Mahabad-Sardasht road.

کلیدواژه‌ها [English]

  • Landslide
  • Machine learning
  • Random forest
  • Support vector machine
  • Mahabad-Sardasht
  • تاریخ دریافت: 12 آذر 1401
  • تاریخ بازنگری: 01 دی 1401
  • تاریخ پذیرش: 01 دی 1401