造車工藝

MIT發(fā)現(xiàn)新機(jī)器學(xué)習(xí)方法 可避免自動(dòng)駕駛汽車在紅燈前怠速

ainet.cn   2022年05月18日

       據(jù)外媒報(bào)道,麻省理工學(xué)院(MIT)的研究人員在一項(xiàng)新研究中展示了一種機(jī)器學(xué)習(xí)方法。該方法可以學(xué)習(xí)控制自動(dòng)駕駛車隊(duì),使車隊(duì)在接近并通過帶有信號燈的十字路口時(shí),能夠順暢行駛。


圖片來源:麻省理工學(xué)院

       通過仿真,研究人員發(fā)現(xiàn)他們的機(jī)器學(xué)習(xí)方法可以減少燃料消耗和排放,同時(shí)提高平均車速。如果道路上的所有汽車都是自動(dòng)駕駛的,該技術(shù)可實(shí)現(xiàn)最佳效果。但即使只有25%的汽車是自動(dòng)駕駛汽車,通過使用該全新控制算法仍然會帶來可觀的燃料和排放效益。

十字路口錯(cuò)綜復(fù)雜
       雖然人類可能會不經(jīng)思考就通過十字路口的綠燈,但根據(jù)車道的數(shù)量、信號的運(yùn)行方式、車輛的數(shù)量及其速度、行人和騎自行車的人的存在等,十字路口可能會出現(xiàn)數(shù)十億種不同的場景。
       解決十字路口控制問題的典型方法是使用數(shù)學(xué)模型來解決一個(gè)簡單、理想的十字路口。但該方法在現(xiàn)實(shí)世界中可能不會成立,因?yàn)榻煌J酵ǔ7浅;靵y。
       資深作者、土木與環(huán)境工程系Gilbert W. Winslow職業(yè)發(fā)展助理教授Cathy Wu和 研究主要作者、電氣工程與計(jì)算機(jī)科學(xué)系的研究生Vindula Jayawardan使用一種深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning)的無模型技術(shù)解決了這個(gè)問題。強(qiáng)化學(xué)習(xí)是一種試錯(cuò)法,可使控制算法學(xué)習(xí)做出一系列決策。當(dāng)找到一個(gè)好的序列時(shí),算法就會得到獎(jiǎng)勵(lì)。通過深度強(qiáng)化學(xué)習(xí),該算法利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的假設(shè)可找到良好序列的捷徑,即使存在數(shù)十億種可能性。
       Wu解釋說該技術(shù)對于解決長期問題很有用,如控制算法必須在很長一段時(shí)間內(nèi)向車輛發(fā)出超過500條加速指令。此外,研究人員希望該系統(tǒng)能夠?qū)W習(xí)一種減少燃料消耗并限制對旅行時(shí)間影響的策略。這些目標(biāo)可能是相互矛盾的。
       雖然要全面解決這個(gè)問題具有挑戰(zhàn)性,但研究人員采用了一種稱為獎(jiǎng)勵(lì)塑造(reward shaping)的技術(shù),可為系統(tǒng)提供了一些無法自行學(xué)習(xí)的領(lǐng)域知識。在這種情況下,只要車輛完全停止,研究人員就會對系統(tǒng)進(jìn)行懲罰,因此系統(tǒng)會學(xué)會避免這種行為。

流量測試
       一旦研究人員開發(fā)出有效的控制算法,就會使用具有單個(gè)十字路口的交通模擬平臺對其進(jìn)行評估。該控制算法應(yīng)用于互聯(lián)的自動(dòng)駕駛車輛車隊(duì),其中這些車輛可以與即將到來的交通信號燈進(jìn)行通信,以接收信號相位和時(shí)間信息并觀察其周圍環(huán)境。該控制算法會告訴每輛車如何加速和減速。
       當(dāng)車輛接近十字路口時(shí),研究開發(fā)的系統(tǒng)沒有造成任何走走停停的交通行為。(當(dāng)汽車由于前方交通停止而被迫完全停止時(shí),就會發(fā)生走走停停的交通行為)。在仿真中,更多的汽車在綠燈期間通過,優(yōu)于模擬人類駕駛員的模型。與其他同類優(yōu)化方法相比,該全新技術(shù)會減少更多燃料消耗和排放。如果路上的每輛車都是自動(dòng)駕駛汽車,新的控制系統(tǒng)可以減少18%的油耗和25%的二氧化碳排放,同時(shí)將行駛速度提高20%。
       未來,研究人員希望研究多個(gè)十字路口之間的相互作用效應(yīng)。他們還計(jì)劃探索不同的交叉路口設(shè)置(車道數(shù)量、信號、時(shí)間等)是如何影響行程時(shí)間、排放和燃料消耗的。此外,研究人員計(jì)劃研究當(dāng)自動(dòng)駕駛汽車和人類司機(jī)共享道路時(shí),其控制系統(tǒng)如何影響安全性。例如,盡管自動(dòng)駕駛汽車的駕駛方式可能與人類駕駛員不同,但較慢的道路和速度更穩(wěn)定的道路可以提高安全性。
       雖然這項(xiàng)工作仍處于早期階段,但Wu認(rèn)為該方法可以在短期內(nèi)實(shí)現(xiàn)應(yīng)用。

(轉(zhuǎn)載)

標(biāo)簽:自動(dòng)駕駛 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
優(yōu)傲機(jī)器人下載中心
億萬克
專題報(bào)道