2-2- متدهای یادگیری تجمعی………………………………………………………………………………………….. 11
2-2-1- تعاریف مفاهیم اولیه…………………………………………………………………………………… 11
2-2-2- درخت بوستینگ…………………………………………………………………………………………….. 13
2-2-3- درخت بگینگ…………………………………………………………………………………………………. 13
2-3- رندوم فارست……………………………………………………………………………………………………….. 15
2-3-1- مراحل توسعهی رندوم فارست………………………………………………………………………… 16
2-3-2- تئوریهای مرتبط با رندوم فارست………………………………………………………………….. 19
2-3-3- رندوم فارست برای رگرسیون………………………………………………………………………… 22
2-3-4- مزایا و کاربردهای رندوم فارست……………………………………………………………………. 23
2-4- نتیجه گیری………………………………………………………………………………………………………… 24
فصل سوم. پیشینه تحقیق
3-1- مقدمه…………………………………………………………………………………………………………………. 26
3-2- تعریف مسئله………………………………………………………………………………………………………. 26
3-3- روشهای مبتنی بر آنالیزهای سری زمانی…………………………………………………………………. 29
3-4- روشهای مبتنی بر مدلهای شبکه عصبی…………………………………………………………………. 32
3-5- روشهای مبتنی بر الگوریتمهای دادهکاوی………………………………………………………………. 34
فصل چهارم. معرفی تکنیک پیشنهادی
4-1- مقدمه…………………………………………………………………………………………………………………. 40
4-2- خصوصیات کلی پایگاه داده……………………………………………………………………………………….. 41
4-3- پایگاه دادهی مورد استفاده………………………………………………………………………………………….. 42
4-3-1- دادهی آموزشی…………………………………………………………………………………………………. 44
4-3-2- دادهی آزمایشی………………………………………………………………………………………………. 44
4-4- تکنیک پیشنهادی………………………………………………………………………………………………………. 45
4-4-1- بررسی توزیع جریانهای ترافیکی…………………………………………………………….. 47
4-4-2- مرحله پیش پردازش و استخراج ویژگی…………………………………………………….. 50
4-4-3- مرحله شناسایی و تقسیم بندی به Context های مختلف………………………. 52
4-4-4- مرحله یادگیری با بکارگیری Context-Aware Random Forest……………….
فصل پنجم. نتایج تجربی
5-1- مقدمه…………………………………………………………………………………………………. 59
5-2- پایگاه داده……………………………………………………………………………………………… 60
5-3- معیارهای ارزیابی…………………………………………………………………………………. 61
5-3-1- معیار ارزیابی خطای پیشبینی………………………………………………………………… 61
5-3-2- مقایسه کارآیی معیارهای سنجش فاصله بر روی مشاهدات ترافیکی…… 62
5-4- بررسی تناسب الگوریتم رندوم فارست در مقایسه با دیگر متدها………………………… 64
5-5- تنظیمات اعمال شده در پیاده سازی الگوریتم (تنظیم پارامترها)……………………… 66
5-6- ارزیابی سایز گردآمدگی بر روی دادهی اعتبارسنجی……………………………………………… 67
5-7- استخراج مجموعههای نمونههای آموزشی…………………………………………………………. 70
5-8- نتایج یادگیری الگوریتم بر روی مجموعههای نمونههای آموزشی…………………….. 72
فصل ششم. نتیجهگیری
خلاصه مطالب و نتیجه گیری…………………………………………………………………… 75
فهرست منابع و مآخذ……………………………………………………………………………….. 78
چکیده:
امروزه موفقیت سیستمهای حمل ونقل هوشمند، نه تنها به اطلاعات وضعیت فعلی ترافیک، بلکه تا حد زیادی به آگاهی از وضعیت ترافیکی دقایق آینده وابسته است. از اینرو، تحقیقات زیادی در زمینه پیشبینی کوتاهمدت وضعیت ترافیکی انجام شده است. هرچند تاکید اکثریت آنها، تنها بر روی اعمال الگوریتمهای مختلف بمنظور یادگیری دادههای ترافیکی و ارائهی مدل، بر اساس دادههای جمعآوری شده از وضعیت فعلی و پیشین میباشد. حال آنکه، در جهت رسیدن به الگوریتمی کارا، لازم است تا ماهیت نوساناتی و وابسته به زمان دادهها نیز در روند یادگیری مدل لحاظ شود. در این راستا، این پایان نامه با مطالعه توزیع جریانهای ترافیکی، سعی در جداسازی رفتارهای مربوط به پریودهای اوج و غیراوج ترافیکی و همچنین استفاده از مفاهیم و دانش بدست آمده برای آموزش مدلهای متمایز متناظر با رفتارهای مختلف ترافیکی دارد. شایان ذکر است که حتی در صورتیکه زمان مرتبط با دادهها صریحاً در اختیار نباشد، روش پیشنهادی با بررسی توزیع داده، روند جریانهای ترافیکی را تشخیص میدهد. بدین ترتیب، رندوم فارست بعنوان مدل پیشبینیکننده، از زمینه دادهی مورد آموزش باخبر بوده و بر این اساس احتمال گیراُفتادن آن در بهینهی محلی کمتر میشود. به منظور ارزیابی روش ارائه شده، آزمایشاتی بر روی دادهی بخش ترافیک مسابقه بین المللی دادهکاوی سال 2010 انجام شد. نتایج حاصل، مؤید کارایی و مقیاس پذیری روش پیشنهادی در مقایسه با دیگر نتایج بدست آمده توسط تیمهای برتر مسابقه، میباشد.
فصل اول: مقدمه
1-1- تعریف مسئله
امروزه، با توجه به گسترش روزافزون مطالبات حملونقل و بروز مشکلات ناشی از افزایش ترافیک شهری، ازجمله آلودگی هوا، آلودگی صوتی، مصرف سوخت، اتلاف وقت و انرژی و هزینههای تحمیلی آنها، ارائه راهکار مناسب درجهت روان شدن ترافیک از اهمیت ویژهای برخوردار است. از طرفی باتوجه به محدودیتهای امکانات شهرسازی در مقابل تقاضای انبوه وسایل نقلیه، لازم است تا تمهیداتی کاربردی و امکانپذیر برای حل این معضل درنظر گرفته شود. ازآنجا که تاکنون فناوری اطلاعات[1] نقش مؤثری درعرصههای مختلف صنعتی ایفا کرده است، ورود این تکنولوژی در زمینهی سیستمهای حملونقل نیز بعنوان راهکاری مناسب مورد توجه قرارگرفت و منجر به پدیدآمدن سیستمهای حملونقل هوشمند[2] شد. در واقع تکنولوژی فناوری اطلاعات به عناصر سیستم حملونقل این امکان را میدهد تا با بکارگیری حسگر[3]ها و میکروچیپها و ارتباط آنها از طریق تکنولوژی بیسیم[4]، تبدیل به یک سیستم هوشمند شوند. امروزه سیستم حملونقل هوشمند با تشکیل سامانهای متشکل از حسگرهای دریافت داده، سامانههای پردازش اطلاعات و سامانههای ارائهی اطلاعات به استفاده کنندگان، گامی مؤثر در راستای مدیریت سیستم حملونقل و استفاده هوشمندانه از زیرساختارهای موجود، برداشته است [1]. بطور مثال این سیستم با بکارگیری فناوریهای متفاوتی همچون هدایت خودرو و سیستم کنترل چراغهای راهنمایی، تابلوهای اعلان ترافیک، دوربین سرعتسنج و سیستم خودکار شناسایی شمارهی خودرو گرفته تا سیستمهای پیشرفته و پیچیدهتری که بطور همزمان اطلاعات متفاوتی مانند وضعیت آب و هوا، وضعیت ترافیک، وضعیت جادهها را از منابع متفاوت یکپارچه میکند، کنترل این حوزه را بدست گرفته است. از جمله دستاوردهای مهم بکارگیری سیستم حملونقل هوشمند میتوان به کاهش ترافیک، کاهش حوادث و تصادفات، امکان انتخاب مسیرهای بهینه با توجه به وضعیت مسیرها، مدیریت حملونقل عمومی و وسائل نقلیهی امدادی و همچنین امکان اخذ الکترونیکی مواردی همچون عوارض، هزینهی پارکینگ و خرید بلیط که منجر به صرفه جویی در سوخت وانرژی و کاهش هزینههای تحمیلی میشود، اشاره کرد. عموماً سیستمهای حمل ونقل هوشمند را تحت عنوان پنج گروه اصلی بررسی میکنند که هرکدام حوزههای مختلف از این سامانه را شامل میشوند؛
الف) سامانههای پیشرفتهی اطلاعات مسافرتی[5](ATIS) که وظیفهی آن فراهم آوردن اطلاعات وضعیت فعلی ترافیکی و جوّی جادهها، تصادفات و تعمیرات جادهای و همچنین اطلاع رسانی به مسافران و کاربران بمنظور استفادهی بهینه از مسیرهای موجود و برقراری تعادل ترافیکی میباشد.
ب) سامانههای پیشرفتهی مدیریت ترافیک[6] (ATMS)که اطلاعات ترافیکی جمعآوری شده از منابع مختلف را بررسی و یکپارچه کرده و از طریق ابزارهای کنترل ترافیک مانند سینگالهای ترافیکی، کنترل رمپ[7] ورودی بزرگراه ها به منظور حفظ تراکم و تابلوهای اطلاع رسانی متغیر موجود در جادهها، کنترل جریان ترافیکی را در دست میگیرند.
ج) سامانههای پرداخت الکترونیکی[8] (EPS) که شامل سیستم جمعآوری الکترونیکی عوارض[9](ETC)، سامانههای پرداخت عوارض بمنظور استفاده از خطوط ویژهی وسایل نقلیه پرسرنشین[10] توسط وسایل تک سرنشین و همچنین قیمتگذاری مسیر[11] و خطوط پرترافیک میباشد.
د) سامانههای پیشرفته و هوشمند حملونقل همگانی[12] (APTS)اموری در جهت تسهیل ارائهی خدمات حملونقل عمومی همچون تعیین موقعیت خودکار[13] وسیله نقلیه و اطلاع رسانی به مسافران، خدمات رزرو و تعیین کرایه را نیز شامل میشود.
ه) سامانههای پیشرفتهی کنترل وسائل نقلیه(AVCS)[14] که شامل سامانهی انطباق هوشمند سرعت[15](ISA)، سامانههای هشدار و پیشگیری از تصادفات میشوند.
در حوزهیAITS وATMS، پیشبینی کوتاه مدت ترافیک از عناصر مهم موفقیت سیستمهای حملونقل هوشمند محسوب میشود، چرا که در راستای کنترل ترافیک نه تنها وضعیت فعلی ترافیک بلکه وضعیت آیندهی ترافیک نیز حائز اهمیت است. از این رو الگوریتمهای پیشبینی ترافیک مورد توجه ویژهای در میان محققان این حوزه قرار گرفتند.
2-1- چالشهای مسئله
همانطور که پیشتر بیان شد، مراکز کنترل ترافیک بر اساس جمعآوری آمار و اطلاعات ترافیکی، پردازش و یکپارچه سازی آنها، تصمیمات لازم جهت مدیریت و کنترل ترافیک را اتخاذ میکنند. در راستای بهبود کنترل ترافیک، ATIS و ATMS بعنوان اصلیترین اجزاء سیستم حملونقل هوشمند، علاوه بر وضعیت فعلی ترافیک، به وضعیت آینده ترافیک نیز احتیاج دارند. ازینرو پیشبینی وضعیت آینده ترافیک از جمله مباحث مهم برای این مراکز به حساب میآید تا با استفاده از آن استراتژیهای لازم جهت جلوگیری از تراکم و هشدار به رانندگان جهت انتخاب مسیر بهینه، صورت گیرد. تاکنون تحقیقات متعددی در خصوص پیشبینی وضعیت ترافیکی آینده انجام شده است که در واقع با استفاده از دادههای ثبت شده از وضعیت فعلی ترافیک، ترافیک مربوط به زمانهای آتی را پیشبینی میکنند.
بطور معمول دادههای جمعآوری شده در حوزهی ترافیک، بصورت سریهای زمانی[16] در اختیار ما قرار میگیرند که در واقع شامل رکوردهای مختلفی هستند که در بازه های زمانی مساوی و در طی اندازهگیریهای متوالی بدست میآیند. با استفاده از دادههای فعلی و گذشته، مقادیر آنها در آینده پیشبینی میشوند [2]. تاکنون تکنیکهای متفاوتی در زمینهی پیشبینی ترافیک بکار گرفته شده است که از جملهی آنها میتوان به روشهای کالمن فیلترینگ[17] [4,3]، متدهای آماری غیرپارامتریک [5,6] [18]، روشهای یادگیری متوالی[7] [19]، مدلهای شبکهعصبی[20] [8-11] و آنالیزهای سریهای زمانی[13-17] اشاره کرد. از مهمترین چالشهای اعمال این الگوریتمها، حجم بالای دادههای ترافیکی است که منجر شده تا اخیراً گرایش تحقیقات به سمت استفاده از الگوریتمهای داده کاوی[21] باشد.
همانطور که میدانیم تکنیکهای داده کاوی قابلیت استخراج اطلاعات از دادههایی با حجم بسیار بالا همچون دادههای ترافیکی را دارا هستند. از میان آنها روشهای مبتنی بر درختهای تصمیمگیری[22] بطور گستردهای در حوزهی ترافیک مورد استفاده قرار گرفته است[18,19]. همچنین متدهای یادگیری تجمعی[23] همانند بگینگ و بوستینگ با توجه به کارایی بالا، مورد توجه ویژهای واقع شدند. ایدهی اصلی آنها ساخت مجموعهای از