نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیارگروه مهندسی عمران، واحد تبریز ، دانشگاه آزاد اسلامی، تبریز، ایران
2 دانشیار گروه مهندسی عمران دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد تبریز، تبریز،ایران
چکیده
نقشههای پهنهبندی سیل اطلاعات ارزشمندی را در رابطه با طبیعت سیلابها و اثرات آن بر اراضی دشت سیلابی ارائه میدهند. برای تهیه نقشه حساسیت به وقوع سیل، مجموعهای از عوامل مؤثر باید تعریف شود .مجموعه عوامل مؤثر بر سیلاب با استفاده از 13 عامل شامل ارتفاع، شیب، فاصله از رودخانه، شاخص رطوبت توپوگرافی، شاخص موقعیت توپوگرافی، شاخص زبری، سطح انحنای طولی یا عرضی، مقطع انحنای توپوگرافی، انحنای کلی،شاخص نرمال شده تفاوت پوشش گیاهی (NDVI)، کاربری اراضی، سنگ شناسی و بارندگی با توجه به استفاده از تجربیات کارشناسان و پژوهشگران در بررسیهای صورتگرفته، در حوضه شرقی آبریز دریاچه اورمیه استفاده شد. بعد ازآماده سازی لایههای موثر بر سیلاب و لایه نقطهای نقاط سیلخیز، و نیز انجام آزمون همخطی، در مرحله بعد از پنج روش رگرسیون خطی چندگانه، مدل حداقل مربعات جزئی، رگرسیون چندکی، رگرسیون ستیغی و رگرسیون با ثبات برای مدلسازی و پیشبینی استفاده شد. از منحنی مشخصه عملکرد (ROC)برای اعتبارسنجی نتایج استفاده گردید. نتایج این اعتبار سنجی نشان داد که مدلهای حداقل مربعات جزئی PLS)) و مدل رگرسیون خطی چندگانه ( MLR) با دارا بودن حداکثر مساحت زیرمنحنی (AUC)، ( به ترتیب 0.983و 0.997) و کمترین میزان انحراف معیار( به ترتیب 0.015و 0.018) بهتر عمل کرده اند. در بین این دو مدل هم PLS دارای نتایج کمی بهتر نسبت به MLR میباشد. در نهایت از مدل جنگل تصادفی برای مشخص کردن اهمیت عاملهای ورودی استفاده گردید، و مشخص گردید عاملهای ارتفاع، فاصله از آبراهه و درصد شیب تاثیرگذارترین عوامل روی سیلاب منطقه مورد مطالعه می-باشند.
تازه های تحقیق
در این تحقیق از پنج روش مهم یادگیری ماشین شامل رگرسیون خطی چندگانه، مدل حداقل مربعات جزئی، رگرسیون چندکی، رگرسیون ستیغی و رگرسیون با ثبات جهت پیش بینی مکانی خطر سیلاب استفاده گردید. در ادامه از منحنی ROC جهت اعتبارسنجی نتایج استفاده گردید. نتایج نشان دهنده عملکرد عالی هر 5 روش استفاده شده می باشد. در ادامه از مدل جنگل تصادفی جهت مشخص کردن اهمیت عاملهای ورودی استفاده گردید، و مشخص گردید عاملهای ارتفاع، فاصله از آبراهه و درصد شیب تاثیرگذارترین عوامل روی سیلاب منطقه مورد مطالعه می باشد.. در نهایت بهکارگیری تکنیکهای یادگیری ماشین و سیستم اطلاعات جغرافیایی به منظور بررسی پتانسیل و استعداد سیل، مخصوصاً در کشورهای در حال توسعه که دسترسی به اطلاعات و دادههای هیدروژئولوژیکی و ادافیکی[1]( اطلاعات مربوط به ویژگیهای خاک و ارتباط آن با عواملی مانند آب و هوا، دما، رطوبت و ... است) با مشکل و محدودیت مواجه است، پیشنهاد می شود. از آن جایی که سیل به عنوان یک پدیده فاجعهانگیز در کل جهان شناخته می شود، بنابراین تهیه نقشه حساسیت سیل به منظور مدیریت بهتر حوضههای آبخیز امری حیاتی و اجنتاب ناپذیر می باشد.
ارزیابی حساسیت سیل توسط بسیاری از محققین انجام شده است. در بین این تحقیقات نیاز به یک روش جامع و قابل اعتماد جهت شناسایی مناطق مستعد سیل بیش از پیش احساس می شود. نتایج به دست آمده از این تحقیق با نتایج Darabi و همکاران (2014)، Siahkamari و همکاران (2018)، و نیز با نتایج Khosravi و همکاران (2018)، همخوانی دارد. نتایج مدل PLS که دارای بالاترین سطح زیرنمودار ROCبود، نشان داد که 32 و 15 درصد از مساحت منطقه مورد مطالعه دارای خطر سیلاب زیاد و خیلی زیاد می باشد. آگاهی از خصوصیات مورفومتریک یک حوضه، همراه با داشتن اطلاعات از شرایط آب و هوایی منطقه می تواند تصویر نسبتا دقیقی از کارکرد کمی و کیفی سیستم هیدرولوژیک حوضه و هم چنین، وضعیت حاکم بر آن را از نقطه نظرهای مختلف به دست آورد. یافتههای این تحقیق حاکی از آن است که دقت تکنیکهای یادگیری ماشین در شناسایی مناطق دارای استعداد سیل مناسب می باشد. بنابراین استفاده ازاینارزیابی خطر سیل، مفید و قابل اعتماد است که با نتایج مطالعات Tehrany و همکاران (2014) مطابقت دارد. هم چنین این نتیجه با نتایج Zhao و همکاران (2018)، و نیز Kanani-Sadat و همکاران (2019) مطابقت دارد. در این تحقیق، رویکردی ارائه شده است که با به کارگیری برخی متغیرهای موثر بر وقوع سیل، که این پارامترها برآیند عوامل مختلف محیطی و انسانی هستند، میتوان به کاهش خسارتها و تلفات ناشی از سیل کمک کرد. با توجه به نقشههای پیشبینی خطر سیل، اقدامات مدیریتی مناسبی میتوان برای کاهش خسارتها و تلفات ناشی از سیل انجام داد.
با توجه به نتایج حاصل از تحلیل خطرپذیری سیلاب حوضههای آبریز با استفاده از الگوریتمهای یادگیری ماشین و عاملهای هیدروژئومورفولوژیکی، پیشنهاد میشود که در ادامه کار، به موارد زیر توجه شود:
6- محدودیت های تحقیق
در مورد محدودیتهایی که در تحقیق مورد نظر میتواند وجود داشته باشد، میتوان به موارد زیر اشاره کرد:
- دادههای کم: تعداد دادههای موجود در مورد خطرپذیری سیلاب در حوضهی مورد مطالعه، ممکن است کم باشد و به همین دلیل نمیتواند تمامی جنبههای خطر را پوشش دهد.
- نویز در دادهها: دادههایی که برای تحلیل استفاده میشوند، ممکن است دارای نویز باشند و این موضوع میتواند به دقت نتایج تاثیر بگذارد.
- کیفیت دادهها: کیفیت دادههای جمعآوری شده، به طور مستقیم بر دقت نتایج و پایداری مدلهای پیشنهادی تاثیر میگذارد.
- تحلیل پویایی: تحلیل خطرپذیری سیلاب، به طور کلی یک پروسه پویایی است و ممکن است تحلیل یکباره و ثابت در زمان، نتایج دقیقی ارائه ندهد.
- انتقال پذیری: ممکن است مدلهای پیشنهادی برای تحلیل خطرپذیری سیلاب حوضهی مورد مطالعه، قابلیت انتقال پذیری به حوضههای دیگر را نداشته باشند.
- پوشش جغرافیایی: ممکن است بخشی از حوضهی آبریز، برای جمعآوری دادهها یا انجام تحلیل، در دسترس نباشد و این موضوع ممکن است باعث شود که دادههای تحلیلی کامل نباشند.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Flood risk Analysis of Watersheds Using Machine Learning Algorithms and Hydrogeomorphological Factors (Case study: Eastern Catchment Area of Lake Urmia)
نویسندگان [English]
1 Assistant professor, Department of Civil Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran
2 Associate Professor, Department of Civil Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran
چکیده [English]
Flood zoning maps provide valuable information about the nature of flood and its effect on floodplain lands. A set of effective factors must be defined to map flood susceptibility or, in general, to develop a model for assessing natural disaster risk. The factors affecting flood were used in eastern catchment area of lake Urmia which include altitude, slope, distance from the river, topographic moisture index, topographic position index, roughness index, curvature level, topographic curvature section, total curvature, NDVI index, land use, lithology and rainfall according to the experiences of experts and researchers reported in previous studies. After preparing the effective layers on the flood and the point layer of the flood points, as well as performing the linear test, five methods including Multiple Linear Regression, Partial Least Squares Model, Quantile Regression, Ridge Regression and Robust Regression were used for modeling and predictions. Then the ROC curve was used to validate the results. The results of this validation showed that the partial least squares (PLS) and multiple linear regression (MLR) models with the maximum area under the curve (AUC) (0.983 and 0.997, respectively) and the lowest standard deviation (0.015 and 0.018, respectively) ) have performed better. Among these two models, PLS has slightly better results than MLR. Finally, a random forest model was used to determine the importance of the input factors, and it was found that the factors of height, distance from the waterway and slope percentage are the most influential factors on floods in the study area.
کلیدواژهها [English]
نقشههای پهنهبندی سیل اطلاعات ارزشمندی را در رابطه با طبیعت سیلابها و اثرات آن بر اراضی دشت سیلابی ارائه میدهند. برای تهیه نقشه حساسیت به وقوع سیل، مجموعهای از عوامل مؤثر باید تعریف شود .مجموعه عوامل مؤثر بر سیلاب با استفاده از 13 عامل شامل ارتفاع، شیب، فاصله از رودخانه، شاخص رطوبت توپوگرافی، شاخص موقعیت توپوگرافی، شاخص زبری، سطح انحنای طولی یا عرضی، مقطع انحنای توپوگرافی، انحنای کلی،شاخص نرمال شده تفاوت پوشش گیاهی (NDVI)، کاربری اراضی، سنگ شناسی و بارندگی با توجه به استفاده از تجربیات کارشناسان و پژوهشگران در بررسیهای صورتگرفته، در حوضه شرقی آبریز دریاچه اورمیه استفاده شد. بعد ازآماده سازی لایههای موثر بر سیلاب و لایه نقطهای نقاط سیلخیز، و نیز انجام آزمون همخطی، در مرحله بعد از پنج روش رگرسیون خطی چندگانه، مدل حداقل مربعات جزئی، رگرسیون چندکی، رگرسیون ستیغی و رگرسیون با ثبات برای مدلسازی و پیشبینی استفاده شد. از منحنی مشخصه عملکرد (ROC)برای اعتبارسنجی نتایج استفاده گردید. نتایج این اعتبار سنجی نشان داد که مدلهای حداقل مربعات جزئی PLS)) و مدل رگرسیون خطی چندگانه ( MLR) با دارا بودن حداکثر مساحت زیرمنحنی (AUC)، ( به ترتیب 0.983و 0.997) و کمترین میزان انحراف معیار( به ترتیب 0.015و 0.018) بهتر عمل کرده اند. در بین این دو مدل هم PLS دارای نتایج کمی بهتر نسبت به MLR میباشد. در نهایت فاصله از آبراهه و درصد شیب تاثیرگذارترین عوامل روی سیلاب منطقه مورد مطالعه میباشند.