در یک مطالعه جدید ، محققان MIT الگوریتم یادگیری ماشینی را به نمایش گذاشته اند که میتواند ناوگان وسایل نقلیه خودران را به گونه ای کنترل کند که به هنگام نزدیک شدن و عبور از میان یک تقاطع دارای چراغ راهنما، ترافیک را به آرامی هدایت کند.
محققان MIT برای کمک به وسایل نقلیه خودران و اجتناب از توقف در پشت چراغ قرمز از هوش مصنوعی استفاده میکنند .
هیچکس پشت چراغ قرمز از انتظار لذت نمیبرد . اما تقاطعهای دارای چراغ راهنما فقط یک مزاحمت ناچیز برای رانندگان نیستند ; وسایل نقلیه در حالی که منتظر سبز شدن چراغ هستند سوخت را هدر میدهند و گازهای گلخانهای ساطع میکنند.
چه میشود اگر رانندگان بتوانند دقیقا ً سفرهای خود را به نحوی تنظیم نمایند تا هنگاهی که چراغ سبز است به محل تقاطع برسند ؟ در حالی که این ممکن است برای راننده انسانی تنها موفقیتی شانسی باشد , ولی با کمک هوش مصنوعی که برای کنترل سرعت آن استفاده میشود می توان از این ويژگی به طور مداوم استفاده کرد .
در یک مطالعه جدید ، دانشمندان MIT الگوریتم یادگیری ماشینی را به نمایش گذاشته اند که میتواند یاد بگیرد ناوگان خودروهای خودران را به گونه ای کنترل کند که به هنگام نزدیک شدن و عبور از میان یک تقاطع دارای چراغ راهنما ، ترافیک را به آرامی هدایت کند .
بر طبق شبیهسازی ها , این کار مصرف سوخت و انتشار گازهای گلخانهای را کاهش میدهد همچنین میانگین سرعت خودرو بهبود مییابد. اگر همه ماشینها در جاده خودران باشند، این تکنیک بهترین نتیجه را دریافت میکند. اما حتی اگر تنها ۲۵ درصد از الگوریتم کنترل خود استفاده کنند , هنوز هم منجر به فواید قابلتوجه در مصرف سوخت و انتشار گازهای گلخانهای میشود .
کاترین وو، نویسنده ارشد و گیلبرت دبلیو وینسلو، استاد یار توسعه شغلی در گروه مهندسی عمران و محیط زیست و عضو موسسه داده، سیستمها و جامعه (به اختصارIDSS) و آزمایشگاه اطلاعات و سیستمهای تصمیمگیری (به اختصارLIDS) می گویند: این مبحثی است که ورود و برنامه ریزی بر روی آن بسیار با ارزش است . زندیگ هیچ کس با گیر کردن در پشت چراغ قرمز بهتر نمی شود ! هیچ مانعی برای فن آوریهایی که با عث بهبود شرایط آب و هوایی و در نتیجه بالا بردن کیفیت زندگی مردم میشود ، وجود ندارد .
ویندولا جایواردانا ، دانشجوی کارشناسیارشد در رشته مهندسی برق و دانشکده مهندسی برق و علوم رایانه ، نویسنده اصلی این تحقیق است . این تحقیق در کنفرانس کنترل اروپا ارائه خواهد شد .
پیچیدگی های تقاطع
در حالی که ممکن است انسان ها بدون تامل از عملکرد مکانیزم کنترل چراغ های راهنمایی ، بارها از مقابل چراغ سبز عبور می کنند، تقاطع ها میتوانند بسته به تعداد مسیرها , نحوه عملکرد سیگنالها , تعداد وسایل نقلیه و سرعت آنها , حضور عابران پیاده و دوچرخه سواران و غیره انواع مختلفی از سناریو ها را ارائه دهند .
روشهای معمول برای برخورد با مشکلات کنترل تقاطع , از مدلهای ریاضی برای حل یک تقاطع ساده و ایدهآل استفاده میکنند . این روش روی کاغذ خوب به نظر میرسد , اما احتمالا ًدر دنیای واقعی کارایی کمی دارد , زیرا که الگوهای ترافیک اغلب نامنظم و نامرتب هستند .
کاترین وو و ویندولا جایواردانا روش های مرسوم را تغییر دادند و با استفاده از تکنیک بدون مدل به نام یادگیری تقویتی عمیق به این مشکل رسیدند . یادگیری تقویتی یک روش آزمون و خطا است که در آن الگوریتم کنترل می آموزد که رشته ای از تصمیمات را اتخاذ کند و تا زمانی که یک توالی خوب پیدا کند , به نتیجه برسد . با یادگیری تقویتی عمیق ،این الگوریتم از فرضیات آموخته شده توسط یک شبکه عصبی، برای یافتن میان برهایی به دنباله های مناسب استفاده می کند، حتی اگر میلیاردها احتمال وجود داشته باشد .
وو توضیح میدهد که این روش برای حل یک مساله در افق طولانی مدت مفید است ; الگوریتم کنترلی باید بیش از ۵۰۰ دستورالعمل کنترل سرعت را برای یک وسیله نقلیه در طول یک دوره زمانی طولانی صادر کند .
او اضافه میکند : " ما قبل از اینکه بدانیم که کار خوبی برای کاهش انتشار گازهای گلخانهای و رسیدن به محل تقاطع با سرعت مناسب انجام دادهایم , باید طراحی روش و نحوه اجرای آنرا درست انجام دهیم . "
اما یک مسئله وجود دارد . محققان سیستمی میخواهند که استراتژی را گسترش دهند که مصرف سوخت را کاهش داده ولی در عین حال زمان سفر نیز کاهش یابد . این اهداف می توانند متناقض باشند.
برای کاهش زمان سفر , ما میخواهیم خودرو به سرعت حرکت کند , اما برای کاهش انتشار گازهای خروجی, ما میخواهیم ماشین کند شود یا اصلا ًحرکت نکند . وو میگوید : " نتیجه این رقابت میتواند برای عامل یادگیری بسیار گیجکننده باشد . "
در حالی که حل این مشکل خود به طور کلی چالش برانگیز است , محققان راه حلی را با استفاده از تکنیکی که به عنوان شکلدهی پاداش شناخته شدهاست , به کار گرفتند . با شکل دادن پاداش , آنها اطلاعاتی را به سیستم میدهند که خود سیستم قادر به یادگیری آن نیست . در این حالت , هر زمان که وسیله نقلیه توقف کامل میکند , سیستم بطور اتوماتیک آن را جریمه میکند , بنابراین باید یاد بگیرد که از آن اقدام اجتناب کند .
تست ترافیک
زمانی که آنها یک الگوریتم کنترل موثر ایجاد کردند , با استفاده از یک پلت فرم شبیهسازی ترافیک با یک تقاطع تکی , آن را ارزیابی کردند .الگوریتم کنترل برای ناوگانی از وسایل نقلیه خودران پیوسته به کار گرفته میشود که میتوانند با چراغهای راهنمایی پیش رو ارتباط برقرار کند تا فاز سیگنال و اطلاعات زمانبندی را دریافت کرده و محیط اطراف خود را مشاهده کند. الگوریتم کنترل به هر وسیله نقلیه نشان می دهد که چگونه شتاب بگیرد و سرعتش را کاهش دهد.
با نزدیک شدن وسایل نقلیه به تقاطع، سیستم آنها هیچ ترافیک توقف و حرکتی ایجاد نکرد. (ترافیک توقف و حرکت زمانی اتفاق میافتد که خودروها به دلیل توقف ترافیک پیش رو مجبور به توقف کامل شوند) در شبیهسازیها، خودروهای بیشتری در یک فاز چراغ سبز از آن عبور کردند که عملکرد بهتری نسبت به مدلی داشت که رانندگان انسانی را شبیهسازی میکند . در مقایسه با سایر روشهای بهینهسازی که برای جلوگیری از ترافیک توقف و حرکت طراحی شدهاند، تکنیک آنها منجر به کاهش مصرف سوخت و آلایندگی کمتری شد. اگر هر وسیله نقلیه در جاده خودران باشد، سیستم کنترل آنها می تواند مصرف سوخت را تا 18 درصد و انتشار دی اکسید کربن را تا 25 درصد کاهش دهد و در عین حال سرعت سفر را تا 20 درصد افزایش دهد.
او ( خانم کاترین وو ) می گوید :"یک مداخله منفرد که کاهش ۲۰ تا ۲۵ درصدی در سوخت و تولید گازهای گلخانهای دارد واقعا ً باور نکردنی است . اما چیزی که جالب توجه است , و واقعا ً امید به دیدن آن را داشتم , این مقیاس بندی غیر خطی است . اگر ما تنها ۲۵ درصد وسایل نقلیه را کنترل کنیم 50 درصد از مزایای کاهش سوخت و آلایندگی را به ما می دهد. این بدان معناست که ما مجبور نیستیم تا زمانی که به 100 درصد خودروهای خودران برسیم صبر کنیم تا از این روش بهرهمند شویم ."
در آینده ، محققان میخواهند که اثرات متقابل بین چندین تقاطع را مطالعه کنند . آنها همچنین برای بررسی این که چگونه تقاطع مسیرهای مختلف ( تعداد مسیرها , سیگنالها , زمانبندی و غیره ) میتوانند زمان سفر , آلاینده ها و مصرف سوخت را تحتتاثیر قرار دهند , برنامهریزی میکنند . علاوه بر این , آنها قصد دارند مطالعه کنند که چگونه سیستم کنترل آنها میتواند ، زمانی که وسایل نقلیه خودران و رانندگان انسانی در جاده مشترکا حضور دارند ، بر ایمنی تاثیر بگذارد . به گفته وو , برای مثال , با وجود اینکه وسایل نقلیه خودران ممکن است متفاوت از رانندگان انسانی رانندگی کنند , خیابانهای آرامتر و جادههای با سرعت ثابت میتوانند باعث بهبود ایمنی شود .
در حالی که این کار هنوز در مراحل اولیه خود است , وو این رویکرد را به عنوان موردی میبیند که میتواند در کوتاهمدت به طور عملی تری به اجرا درآید .
هدف از این کار تاثیر مهم در ایجاد حرکت پایدار است . ما میخواهیم هر چه زودتر به این هدف دست یابیم , ولی طراحی این سیستمها مانند حل کردن هیولای بزرگی از جبر و ریاضیات هستند . او میگوید : " تشخیص نقاط مداخله که تغییرات کوچکی در سیستم دارند اما تاثیر قابلتوجهی دارند , چیزی است که صبح مرا بیدار میکند . "
اثر اخیر پروفسور کاترین وو نشان میدهد که چگونه رانندگی سازگار با محیط زیست یک چارچوب یکپارچه برای کاهش مصرف سوخت فراهم میکند در نتیجه انتشار کربن دیاکسید را به حداقل میرساند و همچنین نتایج خوبی را در میانگین زمان سفر ارائه می دهد . اوزان تونگوز، استاد مهندسی برق و کامپیوتر در دانشگاه کارنگی ملون ، که در این تحقیق شرکت نداشت ، میگوید : " به طور خاص ، رویکرد یادگیری تقویتی در کار وو ، با استفاده از استفاده از تکنولوژی وسایل نقلیه خودران متصل ، یک چارچوب عملی و جذاب برای محققان ایجاد میکند . "
مطالب مرتبط
افراد دارای مهارت در این زمینه
در صورتی که در این زمینه تخصص یا مهارتی دارید، پس از ثبت نام در سایت و تکمیل فرم مشخصات شخصی ، پروفایل خود را به لیست زیر اضافه نمایید .