دکتر مرتضی عتباتی
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده:
مشتقات رنگ های آزو سنتزی تهیه می شوند که دارای گروه عاملی N=N می باشند و کاربرد اصلی آنها در صنایع غذائی و نساجی است. قسمت آروماتیکی تعیین کننده رنگ است.
در این کار از الگوریتم کلونی مورچه و مدل رگرسیون خطی جهت پیشگویی λmax یک سری30- تایی از مشتقات رنگ های آزو استفاده شده است. در ابتدا پس از بهینه سازی ساختار مولکولی توسط نرم افزار Hyper Chem، در مجموع 1521 توصیف کننده به وسیله نرمافزارهای Hyper Chem و Dragon محاسبه گردید. توصیف کننده ها به عنوان ورودی به برنامه الگوریتم مورچه داده شدند. به منظور به دست آوردن بهترین نتیجه با درصد خطای پایین و توصیف کننده های مناسب، برنامه الگوریتم مورچه را چند بار اجرا کرده و در اجراهای مختلف پارامترهای آن از جمله تعداد مورچه های اولیه، پارامتر تبخیر و تعداد دورها بهینه شدند. 5 توصیف کننده که بالاترین همبستگی را با λmax رنگ های آزو داشتند، توسط الگوریتم مورچه انتخاب شدند. از این توصیف کننده های انتخاب شده، برای ساختن مدل خطی مناسب جهت پیشگویی λmax ترکیبات مورد نظر استفاده شد. این روش نتایج خوبی را در هر دو سری آموزش (9346/0=2R) و پیشگویی (8419/0=2R) فراهم آورد. با توجه به موارد ذکر شده، معلوم گردید الگوریتم مورچه طراحی شده روشی مناسب جهت انتخاب توصیف کننده ها برای مدل سازی و پیشگوییλmax مشتقات رنگ های آزو میباشد.
کاپساسین ماده داروئی است که از فلفل قرمز استخراج می شود و مصارف داروئی ازجمله درمان انواع سرطان، آرتروز، رماتیسم مفصلی، زخم معده دارد.
با استفاده ازروش های آموزش آماری ماشین یک رابطه کمی ساختار- فعالیت برای کاپساسین برقرار شده است .99 مولکول کاپساسین مطابق روش قسمت اول رسم شد و 1206 توصیف کننده محاسبه گردید.
برای کاهش تعداد توصیف کننده ها ابتدا از روش های PCA، ICA و Fuzzy Clustering استفاده کردیم که صحت از حدود 62-61% بالاتر نرفت. در رهیافت دیگری از تئوری اطلاعات و معیار” بیشترین ارتباط، کمترین تقلیل پذیری” استفاده شد و پس از بهینه سازی توصیف کننده ها 100 توصیف کننده انتخاب شد. در مرحله بعد مجموع توصیف کننده ها با استفاده از الگوریتم Wrapper بهینه سازی شد که مجموعا 13 توصیف کننده انتخاب شد و صحت برای طبقه بندی به پنج دسته فعالیت بسیار ضعیف ، ضعیف، متوسط ، خوب و فعالیت عالی84% بدست آمد.در کارهای قبلی ]72[ تنها با تقسیم مولکول به سه قسمت و طبقه بندی به فعال و غیر فعال، صحت نزدیک به 80% آمده بود. اما در کار حاضر بدون تقسیم بندی مولکولی و با تکیه به روش های محاسباتی صحتی بالاتر از کارهای سابق به دست آمد که نشانگر مناسب بودن و برتری روش های تئوری اطلاعات و SVM بر روش های قدیمی تر می باشد.
فصل اول: پیشگوئی maxλ مشتقات رنگ های آزو با استفاده از الگوریتم مورچه
1-1- مقدمه
بشر هوشمند
و صاحب تفکر همیشه برای یافتن راهی که زندگی اش را متحول و کامل گرداند، از طبیعت الهام گرفته است.
با گذشت قرن ها، احساس نیاز به الهام گرفتن از طبیعت اسرارآمیز و دوست داشتنی و صد البته منظم، قانونمند و دارای شعور فطری، شدت پیدا کرده است. به گونه ای که از ریزترین موجودات همچون ویروس تا غول آساترین کهکشان ها، برای انسان که همیشه در تکاپوی حقیقت و دانش است، همه، معلمان و راهنمایان خوبی محسوب گردیدهاند، چرا که طبیعت همیشه رو به سوی کمال دارد.
آنچه کاملاً مشهود است، به نظر می آید جهان هستی از جزء تا کل با یک حرکت آرام ولی پیوسته که به ظاهر تصادفی است رو به یک نقطه بهینه درحال حرکت است. در حقیقت طبق نظریه داروینی، طبیعت در حال بهینه کردن مسائل است.
به طور مثال اگر بخواهیم حجم معینی آب را از کوهستان به دریا منتقل کنیم و تمام ویژگیها و معادلات مربوط به سختی، نوع، دما، جنس و سایر مشخصات آب و محیط اطراف را تعیین کرده و با این معادلات مسیر را بیابیم دقیقاً به همان مسیر جویبارها و رودخانهها میرسیم که در طبیعت جریان دارند.
بدیهی است که خداوند معلمی است که دانش آموزش، انسان را از طریق نشانههایش در طبیعت به طور کامل هدایت میکند.
هم اکنون کار روی توسعه سیستمهای هوشمند با الهام از طبیعت، از زمینههای پرطرفدار هوش مصنوعی است. الگوریتم ژنتیک[1] که با استفاده از ایده تکامل داروینی و انتخاب طبیعی مطرح شده روش بسیار خوبی برای یافتن مسائل بهینهسازی است. ایده تکاملی داروینی بیانگر این مطلب است که هر نسل نسبت به نسل قبل دارای تکامل است و آنچه در طبیعت رخ میدهد، حاصل میلیونها سال تکامل نسل به نسل موجوداتی مانند مورچه است.
حشراتی مانند مورچه، موریانه، زنبور که به صورت کلونی زندگی میکنند، بر رفتار به ظاهر بینظمشان نظم و قانونمندی خاصی حکمفرماست که دانشمندان و محققان را به خاطر این پیچیدگی منظم و راهگشا در حل مسائل بهینه سازی، شیفته خود ساخته است.
2-1- کمومتریکس
بدست آوردن داده تجزیهای یکی از مراحل اصلی تجزیه میباشد، تا اواخر دهه پنجاه قرن بیستم این مرحله به عنوان مشکلترین بخش یک تجزیه به حساب میآمد، همچنین زمان عمده یک تجزیه شیمیائی مربوط به جمعآوری دادههای تجزیهای میشد.
اما ازآغاز دهه شصت قرن بیستم، زمانی که دستگاههای مدرن وارد آزمایشگاهها و مراکز تحقیقاتی گردید، این مشکل برطرف شد و در نتیجه استفاده از چنین دستگاههای پیشرفته تعداد زیادی داده از یک نمونه بدست میآید. جهت ثبت و ذخیرهسازی چنین دادههای وسیعی نیاز به وسیلهای بود که بتواند از عهده چنین کاری برآید، به طور همزمان با ظهور دستگاههای پیشرفته تعداد زیادی داده از یک نمونه بدست آمد و استفاده از کامپیوتر نیز به عنوان ابزاری جهت ثبت و ذخیره دادههای حاصل از یک تجزیه شیمیائی رشد چشمگیری یافت، در نتیجه اتصال کامپیوتر به دستگاههای آزمایشگاهی ثبت و ذخیره نمودن دادهها که قبلاً به عنوان مشکلترین بخش یک تجزیه بوده تبدیل به سادهترین مرحله گردید. ولی مشکل دیگری که به دنبال چنین پیشرفتی، ظاهر گردید، نحوه برخورد با چنین حجم وسیعی از داده بود که باید به اطلاعات تبدیل میشدند.
برای مدتهای طولانی، ریاضی و آمار برای تفسیر نتایج آزمایشها به کار گرفته میشدند. ولی با ظهور نرمافزارهای پیشرفته رایانه ای تحول شگرفی در نحوه استفاده ریاضی و آمار در حل مسائل شیمیایی به وجود آمد. به طوری که استفاده از ریاضی ، آمار و کامپیوتر در شیمی منجر به ظهور شاخهای جدید به نام کمومتریکس[1] گردید. اگرچه شیمیدانهای تجزیه بیش از سایر همکارانشان با این شاخه آشنا هستند و از آن بهره میبرند، ولی در رشتههای مرتبط با شیمی از جمله علوم داروئی، بیوشیمی و غیره نیز کاربردهای فراوانی دارد ]5-1[.
برای اولین بار در سال 1971 سوانت ولد[2] اصطلاح “کمومتریکس” را به کار برد و آن را هنر استخراج اطلاعات شیمیائی از دادههای تجزیهای دانست . در سال 1974 با همکاری کوالسکی[3] انجمن بینالمللی کمومتریکس تأسیس شد ]6[.
در سال 1982 کوالسکی و فرانک[4] کمومتریکس را شاخهای از علم شیمی که در طراحی آزمایشهای بهینهسازی، برقراری ارتباط بین نتایج تجربی با متغیرهای آزمایش و همچنین استخراج اطلاعات از سیستمهای شیمیایی با استفاده از ریاضی، آمار و کامپیوتر تعریف کردند ]7[.
ماسارت[5]، کمومتریکس را یک روش شیمیائی میداند که از منطق ریاضیات و آمار برای رسیدن به اهداف زیر بهره میجوید ]8[:
1) طراحی با انتخاب فرآیندهای تجربی بهینه شده
2) دسترسی به حداکثر اطلاعات مناسب شیمیائی از طریق داده های تجربی
3) بدست آوردن اطلاعات در زمینه سیستمهای شیمیائی
براون[1] سردبیر مجله کمومتریکس معتقد است کمومتریکس قسمتی از علم شیمی است که کوشش در پاسخگوئی به سوالات مربوط به سنجشهای شیمیائی دارد ]9[. سوالاتی از قبیل:
1) اندازه گیری کجا و چگونه باید انجام پذیرد؟
2) سیگنال[2] و نویز[3] کدامند؟
3) چگونه می توان از اندازهگیری، اطلاعات مناسب را بدست آورد؟
4) منشأ خطاها در نتایج حاصل از اندازه گیریها چیست؟
انجمن بینالمللی کمومتریکس (ICS) تعریف جامعی از کمومتریکس ارائه میدهد. براساس تعریف این انجمن کمومتریکس علم برقراری ارتباط بین سنجشهای انجام شده بر روی یک سیستم یا فرایند شیمیائی و حالتی از سیستم میباشد. این ارتباط از طریق کاربرد روشهای آماری و ریاضی صورت میپذیرد.
به هر حال، شاید بتوان اهداف کمومتریکس را چنین بیان نمود که:
با استفاده از کمومتریکس، عوامل موثر و بر همکنش آنها در یک فرایند شیمیائی (اعم از یک فرایند تجزیهای و غیره) مورد شناسائی قرار گرفته و با حداقل آزمایشها، بهینهسازی می شوند. بدست آوردن ارتباط بین عوامل موثر و پاسخ سیستم از دیگر اهداف کمومتریکس میباشد. در نهایت، تبدیل دادههای حاصل به اطلاعات نیز هدف نهائی کمومتریکس میباشد. واضح است رسیدن به چنین اهدافی نیازمند کمک گرفتن از ریاضی، آمار و کامپیوتر است ]10[.
بسیاری از مسائلی که در کمومتریکس با آنها مواجه می شویم به دلیل پیچیدگی فوق العاده با روش های دقیق قابل حل نیست به زبان علوم کامپیوتر، چنین مسائلی را “چند جمله ای نامعین سخت[4]” می گویند.
زمان لازم برای حل دقیق چنین مسائلی با زیاد شدن تعداد ورودی ها ، به شدت زیاد میشود ، در چنین مواردی لازم است از “تقریب های خوب[5]” استفاده کنیم، یکی از این تقریبهای خوب الگوریتم های هیوریستیک می باشند که از آن برای برقراری رابطه ساختار – خاصیت بهره خواهیم جست ]11[.
3-1- الگوریتم هیوریستیک
هیوریستیکها[1] عبارت از معیارها، روشها یا اصولی برای تصمیمگیری بین چندین خط مشی و انتخاب اثربخشترین آن ها برای دستیابی به اهداف مورد نظر می باشند. سیستمهای پیچیده اجتماعی، تعداد زیادی از مسائل دارای طبیعت ترکیباتی را پیش روی ما قرار میدهد. به عنوان مثال مسیر کامیونهای حمل و نقل باید به شکل بهینه تعیین شود. تئوری پیچیدگی[2] به ما میگوید که مسائل ترکیباتی اغلب چند جمله ای[3] نیستند. این مسائل در اندازههای کاربردی و عملی خود به قدری بزرگ هستند که نمیتوان جواب بهینه آنها را در مدت زمانی قابل قبول به دست آورد. با این وجود، این مسائل باید حل شوند و بنابراین چارهای نیست که به جوابهای با تقریب بهینه بسنده نمود.
الگوریتمهائی داریم که میتوانند یافتن جوابهای خوب در فاصله مشخصی از جواب بهینه را تضمین کنند که به آنها الگوریتمهای تقریبی میگویند. الگوریتمهای دیگری هستند که تضمین میدهند با احتمال بالا جواب “نزدیک بهینه[4]” تولید کنند که به آنها الگوریتمهای احتمالی گفته میشود. جدای از این دو دسته، میتوان الگوریتمهائی را پذیرفت که هیچ تضمینی در ارائه جواب ندارند اما بر اساس شواهد و سوابق نتایج آنها، به طور متوسط بهترین تقابل کیفیت و زمان حل برای مسئله مورد بررسی را به همراه داشتهاند. به این الگوریتمها، الگوریتمهای هیوریستیک گفته میشود.
هیوریستیکها نتیجه برقراری اعتدال بین دو نیاز هستند: نیاز به ساخت معیارهای ساده و تمایز درست بین انتخابهای خوب و بد.
خاصیت هیوریستیکهای خوب این است که ابزار سادهای برای تشخیص خط مشیهای بهتر ارائه می دهند. در حالی که این الگوریتمها الزاما، تشخیص خط مشیهای اثربخش را تضمین نمیکنند اما اغلب به صورت شرط کافی این تضمین را فراهم میآورند.
بیشتر مسائل پیچیده نیازمند ارزیابی تعداد انبوهی از حالتهای ممکن برای تعیین یک جواب دقیق میباشند. زمان لازم برای یافتن یک جواب دقیق اغلب بیشتر از یک طول عمر است. هیوریستیکها