AI版《綜藝玩很大》讓一群AI玩“捉迷藏”，它們會想出啥戰術來？

本文出處: 遊研社

你永遠猜不到AI有多麼異想天開。

位於舊金山的人工智能研究機構OpenAI的科學家目前在驗證這樣一個假設：如果在虛擬世界中模擬自然界物種競爭的環境，是否也會產生更聰明、更複雜的人工智能？

為了驗證假設，他們再次用計算機模擬出了一個複雜的遊戲環境，這次的遊戲規則要更明確，你可以理解為“捉迷藏”。

研究人員在一個給定的開放空間下放置了多種工具，同時將一定數目的AI分為兩組，並給了他們完全對立的遊戲規則：

被稱為“隱藏者”的AI需要盡可能隱藏自己不被搜尋者探測到；而“搜尋者”的目標正好相反，需要找出所有在地圖中的“隱藏者”。當然，就想大家所熟悉的捉迷藏那樣，開始前，“隱藏者”會有幾秒鐘自由行動的時間來隱藏自己。

遊戲開始後，代表隱藏者的藍色小人一旦出現在敵方的視野範圍內，搜尋者便能得到一分獎勵。

除了基本的規則以外，研究人員沒有對AI進行任何的額外干預和調整，它們在模擬環境中的任何行為都是當前自我認定的最優解。

實驗剛開始，雙方都只會漫無目的地在地圖上移動，直到搜尋者發現找到隱藏者能帶來額外的獎勵時，AI的行為才變得有規律起來。

起初，研究人員將實驗分為了四個階段

第一階段。

在第一個階段下，隱藏者AI只會跑到地圖的方塊後來躲避搜尋者的視線

這個階段下的搜尋者很快也學會瞭如何繞到障礙物後尋找目標。

這個情況被模擬了2500萬次後，遊戲開始變得複雜起來。

藍色的小人開始移動地圖中的方塊讓自己更不容易被抓到。當它們發現搜尋者無法穿過方塊時，想出了個一勞永逸的辦法：

用兩個方塊堵住房間入口，搜尋者便再也無法找到他們

第二階段。

在之後的7500萬局模擬中，隱藏者靠這個技巧立於不敗之地，甚至學會瞭如何用方塊來給自己搭建一個安全的房間。這是研究人員所預測到的第二階段。

但遊戲又出現了新的轉機。搜尋者開始注意到地圖旁邊可移動的斜坡，在經過數次的嘗試之後，它們開始利用斜坡翻過牆壁並找到隱藏者，實驗開始進入第三階段。

第三階段。

不過戰術永遠是螺旋式上升的，很快，躲藏者又學會了在開始前將斜坡一併推進房間中並用方塊堵住入口：

至此，研究人員認為該實驗已經結束，搜尋者不可能再想出更好的解決方案，但在經過3.8億次嘗試後，搜尋者又琢磨出了一個新方法，出乎所有人的意料。

搜尋者找到了一個無法移動的斜坡，利用斜坡使自己站上方塊並推動方塊使自己跳入被隱藏者封閉的房間中。

為了應對這個辦法，數次失敗後，隱藏者又學會了新技能：在比賽開始前將每一個可移動的方塊和斜坡都鎖定住，以此使搜尋者再也無法使用工具。至此，這個AI的捉迷藏遊戲才正式結束。

正如研究人員最後總結的那樣：“一旦一方學會了新策略，就會給另一方帶來相應的壓力，就好像自然界中生物的進化過程一樣。”

研究人員希望通過這個實驗來探索AI適應環境的能力和自主發生的複雜行為，因此他們並沒有傳授AI如何使用工具的技巧。實驗中所有的行為都是AI通過大量的實驗自己掌握的。

簡單的規則，存在競爭關係的多個主體，再加上可以自由使用的工具，三者結合在一起使得AI能適應多種複雜的環境，研究人員在最後表示：“就想它們在最後做出的行為一樣，人工智能可以做出我們想不到的行為，或許在將來甚至能夠解決人類無法解開的難題。”

他說的確實沒錯，在一次實驗過程中，AI就幫他們找到了一個意料之外的穿牆Bug：

Reader Interactions