۲مدلها و الگوریتمهای داده کاوی
در این بخش قصد داریم مهمترین الگوریتمها و مدلهای داده کاوی را بررسی کنیم. بسیاری از محصولات تجاری داده کاوی از مجموعه از این الگوریتم ها استفاده می کنند و معمولا هر کدام آنها در یک بخش خاص قدرت دارند و برای استفاده از یکی از آنها باید بررسی های لازم در جهت انتخاب متناسبترین محصول توسط گروه متخصص در نظر گرفته شود.نکته مهم دیگر این است که در بین این الگوریتم ها و مدل ها ، بهترین وجود ندارد و با توجه به داده ها و کارایی مورد نظر باید مدل انتخاب گردد.
۲-۲-۱ شبکه های عصبی[۱]
هر شبکه عصبی شامل یک لایه ورودی[۲]میباشد که هر گره در این لایه معادل یکی از متغیرهای پیش بینی میباشد. گرههای موجود در لایه میانی به تعدادی گره در لایه نهان[۳]وصل میشوند. هر گره ورودی به همه گرههای لایه نهان وصل می شود.
گرههای موجود در لایه نهان میتوانند به گرههای یک لایه نهان دیگر وصل شوند یا میتوانند به لایه خروجی[۴]وصل شوند.
لایه خروجی شامل یک یا چند متغیر خروجی می باشد
هر یال که بین نود هایX,Y میباشد دارای یک وزن است که با Wx,y نمایش داده می شود. این وزن ها در محاسبات لایه های میانی استفاده میشوند و طرز استفاده آنها به این صورت است که هر نود در لایه های میانی (لایه های غیر از لایه اول) دارای چند ورودی از چند یال مختلف میباشد که همانطور که گفته شد هر کدام یک وزن خاص دارند.
هر نود لایه میانی میزان هر ورودی را در وزن یال مربوطه آن ضرب می کند و حاصل این ضربها را با هم جمع می کند و سپس یک تابع از پیش تعیین شده (تابع فعالسازی) روی این حاصل اعمال می کند و نتیجه را به عنوان خروجی به نودهای لایه بعد میدهد.
وزن یالها پارامترهای ناشناختهای هستند که توسط تابع آموزش [۵]و داده های آموزشی که به سیستم داده می شود تعیین میگردند.
تعداد گرهها و تعداد لایه های نهان و نحوه وصل شدن گرهها به یکدیگر معماری(توپولوژی) شبکه عصبی را مشخص می کند.کاربر یا نرم افزاری که شبکهعصبی را طراحی می کند باید تعداد گرهها ، تعداد لایه های نهان ، تابع فعالسازی و محدودیتهای مربوط به وزن یالها را مشخص کند[۳].
[۱]Neural Networks
[۲]Input Layer
[۳]Hidden Layer
[۴]Output Layer
[۵]Training method