جلسه دفاع پایان نامه: سیدمحمدجواد سیدعلی روته، گروه کنترل
خلاصه خبر:
عنوان پایان نامه: طراحی یک تصمیم ساز مبتنی بر یادگیری تقویتی برای انتخاب بهترین ایستگاه شارژ یک خودروی الکتریکی در ترافیک پویا
ارائه کننده: سید محمدجواد سیدعلی روته استاد راهنما: دکتر وحید جوهری مجد استاد ناظر داخلی: دکتر مهدی سجودی استاد ناظر خارج از دانشگاه: دکتر مهدی پورقلی (دانشگاه شهید بهشتی) تاریخ: 1403/04/12 ساعت: 10 مکان: دانشکده مهندسی برق و کامپیوتر دانشگاه تربیت مدرس، اتاق 6.37 ، آزمایشگاه کنترل هوشمند
چکیده: گسترش استفاده از خودروهای الکتریکی به سیستم های کارامد برای بهینه سازی فرایند انتخاب ایستگاه شارژ، بویژه در محیط های شهری با ترافیک پویا نیاز دارد. اکثر پژوهش های صورت گرفته در این حوزه بر روی بهینه سازی برنامه های شارژ، بدون توجه به شرایط ترافیکی تمرکز دارند؛ و یا داده های ترافیکی آنها پیچیدگی لازم برای مدل کردن ترافیک را ندارد. همچنین در این پژوهشها عدم قطعیت موجود در ترافیک به درستی در نظر گرفته نشده است و در بهترین حالت فقط از یک داده ی قطعی به دست آمده از ترافیک واقعی استفاده شده است. در این پژوهش یک رویکرد جدید برای طراحی یک سیستم تصمیم گیری با استفاده از الگوریتم های یادگیری تقویتی، برای تعیین بهترین ایستگاه شارژ ارائه میکنیم و با استفاده از داده های ترافیکی غنی به دست آمده از رابط برنامه نویسی کاربردی ویز، به مسئله ی تغییر پویای ترافیک در آن می پردازیم و محیط مورد نظر برای تعامل با عامل را تماماً بر اساس اطلاعات واقعی شبیه سازی می کنیم. ما در این پژوهش الگوریتم های یادگیری کیو، سارسا، داینا-کیو و داینا-کیوپلاس را پیاده سازی و ارزیابی می کنیم. الگوریتم های یادگیری کیو و سارسا یک دید کلی از کارایی روش های مبتنی بر ارزش در این مسئله ارائه می کنند و الگوریتم های داینا-کیو و داینا-کیوپلاس تأثیر برنامه ریزی را در افزایش کارایی تصمیم ساز، نشان می دهند. نتایج به دست آمده نشان میدهد که به طور کلی، الگوریتم داینا-کیوپلاس با ایجاد تعادل مناسب بین اکتشاف و بهره برداری، بهتر از سایرین عمل می کند.