در این مطلب مزایای درخت های تصمیم مثل FTA و ETA را نسبت به روش های دیگر بررسی خواهیم کرد که برای کارشناسان HSE ، ایمنی و بهداشت حرفه ای در زمینه ارزیابی ریسک مهم و ضروری است.
1) قوانين توليد شده و به كارگرفته شده قابل استخراج و قابل فهم می باشند.
2) درخت تصمیم، توانایی کار با داده هاي پيوسته و گسسته را دارد. (روش های دیگر فقط توان کار با یک نوع را دارند. مثلاً شبکه های عصبی فقط توان کار با داده های پیوسته و قوانین رابطه با داده های گسسته)
3) درخت تصمیم از نواحي تصميم گيري ساده استفاده می کند.
4) مقايسه هاي غيرضروري در این ساختار حذف می شود.
5) از ويژگي هاي متفاوت براي نمونه هاي مختلف استفاده می شود.
6) احتياجي به تخمين تابع توزيع نيست.
7) آماده سازی داده ها برای یک درخت تصمیم، ساده یا غیرضروری است. (روش های دیگر اغلب نیاز به نرمال سازی داده یا حذف مقادیر خالی یا ایجاد متغیرهای پوچ دارند)
8) درخت تصمیم یک مدل جعبهء سفید است. توصیف شرایط در درختان تصمیم به آسانی با منطق بولی امکان پذیر است در حالی که شبکه های عصبی بدلیل پیچیدگی در توصیف نتایج آنها یک جعبهء سیاه می باشند.
9) تایید یک مدل در درخت های تصمیم با استفاده از تست های آماری امکان پذیر است. (قابلیت اطمینان مدل را می توان نشان داد)
10) ساختارهای درخت تصمیم برای تحلیل داده های بزرگ در زمان کوتاه قدرتمند می باشند.
11) روابط غیرمنتظره یا نامعلوم را می یابند.
12) درخت های تصمیم قادر به شناسایی تفاوت های زیرگروه ها می باشند.
13) درخت های تصمیم قادر به سازگار کردن داده های فاقد مقدار می باشند.
معايب درختان تصمیم
1) در مواردي كه هدف از یادگیری، تخمين تابعي با مقادير پيوسته است مناسب نيستند.
2) در موارد با تعداد دسته های زياد و نمونهء آموزشي كم، احتمال خطا بالاست.
3) توليد درخت تصميم گيري، هزينه محاسباتي بالا دارد.
4) هرس كردن درخت هزينه بالايي دارد.
5) در مسائلي كه دسته های ورودي با نواحي مكعبي به خوبي جدا نشوند و دسته ها همپوشانی داشته باشند، خوب عمل نمي كنند.
6) در صورت همپوشانی گره ها تعداد گره های پاياني زیاد می شود.
7) در صورتی که درخت بزرگ باشد امکان است خطاها از سطحی به سطحی دیگر جمع شوند (انباشته شدن خطاي لايه ها بر روي يكديگر).
8) طراحي درخت تصميم گيري بهينه، دشوار است. کارایی یک درخت دسته بندی کننده به چگونگی طراحی خوب آن بستگی دارد.
9) احتمال تولید روابط نادرست وجود دارد.
10) بازنمایی درخت تصمیم دشوار است.
11) وقتی تعداد دسته ها زیاد است، می تواند باعث شود که تعداد گره های پایانی بیشتر از تعداد دسته های واقعی بوده و بنابراین زمان جستجو و فضای حافظه را افزایش می دهد.