AI研究人員的一個目標(biāo)是想辦法讓機器學(xué)習(xí)模型更容易解釋,這樣就可以理解它們?yōu)槭裁纯梢宰龀鲱A(yù)測。Google AI的研究人員已經(jīng)展示了如何建立一個能夠分析烘焙食譜的可解釋的機器學(xué)習(xí)模型。該機器學(xué)習(xí)模型可以開發(fā)自己的新食譜,而且建立該模型不需要任何數(shù)據(jù)科學(xué)專業(yè)知識。
Sara Robinson在谷歌云端從事人工智能工作。在大流行期間,她喜歡烘焙,并將她的AI技能轉(zhuǎn)向了這個愛好。她首先收集了一組食譜的數(shù)據(jù),并建立了一個TensorFlow模型,以吸收配料清單,并得出 "97%的面包,2%的蛋糕,1%的餅干"這樣的預(yù)測。
該模型能夠準(zhǔn)確地按類型對食譜進行分類,她提出了一個新的食譜,確定這個食譜50%是餅干,50%是蛋糕。它被稱為cakie。羅賓遜說,人工智能的配方很美味,味道就像她想象的那樣,如果她告訴人工智能做一個蛋糕餅干混合體,會發(fā)生有趣的事情。
羅賓遜與另一位研究人員合作,用更大的數(shù)據(jù)集、新的工具和可解釋的模型建立了烘焙2.0模型,讓人們深入了解蛋糕、餅干和面包的制作過程。該模型提出了一種名為 "breakie"的新配方,這是一種面包餅干的混合體。研究人員使用的數(shù)據(jù)集包括16種核心成分和600種材料的配料單。
作為預(yù)處理的最后一部分,研究人員使用了一種數(shù)據(jù)增強技巧。數(shù)據(jù)增強是一種從已經(jīng)擁有的數(shù)據(jù)中創(chuàng)建新的訓(xùn)練例子的方法,例如,該人工智能被設(shè)計成對食譜的食用量不敏感,因此研究人員會隨機將配料量增加一倍和三倍。
機器學(xué)習(xí)模型可以預(yù)測食譜類型,并提供了一個對話,讓研究人員給模型命名,他們希望模型訓(xùn)練多長時間,并指出在訓(xùn)練中使用什么輸入特征。結(jié)果是一個模型能夠正確地預(yù)測它所得到的食譜的類別,并為最有助于其預(yù)測的成分指定重要性的分?jǐn)?shù)。
(轉(zhuǎn)載)