• Skip to primary navigation
  • Skip to main content
  • Skip to primary sidebar

雲爸的私處

  • 首頁
  • Apple
    • iPad
    • iPad Mini
    • iPhone
    • iPhone Case
    • Macbook
    • Mac 周邊
  • 手機
    • HTC
    • ASUS
    • Samsung
    • Moto
    • 小米
    • OPPO
    • LG
    • HUAWEI
    • Sony
    • NOKIA
    • InFocus
    • Google
  • 生活家電
    • 電視盒
    • 空氣清淨機
    • 液晶電視
    • 電動車
    • 行動電源
    • 行車紀錄器
  • 各類3C開箱文
    • 手機周邊
      • 手機周邊
      • 穿戴式裝置
    • 平板
    • 其他亂敗家的東西
    • 收藏逸品
    • 汽車3C
    • 相機攝影
  • 電腦
    • 迷你電腦
    • 遊戲主機
    • 主機板、顯示卡
    • 機殼電源
    • 儲存裝置讀卡機
    • 滑鼠鍵盤
    • 耳機/喇叭
    • VR 軟硬體
    • NAS雲端儲存
    • 網通產品
  • 筆記型電腦
  • 生活家電
  • 好用軟體
    • Android APP教學介紹
    • 軟體技術研討
    • 遊戲攻略
    • MIS技術
    • 開機USB+XPE
    • 防毒軟體
    • 繪圖軟體
  • 就是要出國
雲爸的私處 > 有趣的分享 > 網路蒐集的文章 > AI版《綜藝玩很大》讓一群AI玩“捉迷藏”,它們會想出啥戰術來?

AI版《綜藝玩很大》讓一群AI玩“捉迷藏”,它們會想出啥戰術來?

09 25, 2019 by 雲爸

本文出處: 遊研社

​

你永遠猜不到AI有多麼異想天開。

 

位於舊金山的人工智能研究機構OpenAI的科學家目前在驗證這樣一個假設:如果在虛擬世界中模擬自然界物種競爭的環境,是否也會產生更聰明、更複雜的人工智能?

為了驗證假設,他們再次用計算機模擬出了一個複雜的遊戲環境,這次的遊戲規則要更明確,你可以理解為“捉迷藏”。

研究人員在一個給定的開放空間下放置了多種工具,同時將一定數目的AI分為兩組,並給了他們完全對立的遊戲規則:

被稱為“隱藏者”的AI需要盡可能隱藏自己不被搜尋者探測到;而“搜尋者”的目標正好相反,需要找出所有在地圖中的“隱藏者”。當然,就想大家所熟悉的捉迷藏那樣,開始前,“隱藏者”會有幾秒鐘自由行動的時間來隱藏自己。

遊戲開始後,代表隱藏者的藍色小人一旦出現在敵方的視野範圍內,搜尋者便能得到一分獎勵。

除了基本的規則以外,研究人員沒有對AI進行任何的額外干預和調整,它們在模擬環境中的任何行為都是當前自我認定的最優解。

實驗剛開始,雙方都只會漫無目的地在地圖上移動,直到搜尋者發現找到隱藏者能帶來額外的獎勵時,AI的行為才變得有規律起來。

起初,研究人員將實驗分為了四個階段

 

第一階段。

在第一個階段下,隱藏者AI只會跑到地圖的方塊後來躲避搜尋者的視線

這個階段下的搜尋者很快也學會瞭如何繞到障礙物後尋找目標。

這個情況被模擬了2500萬次後,遊戲開始變得複雜起來。

藍色的小人開始移動地圖中的方塊讓自己更不容易被抓到。當它們發現搜尋者無法穿過方塊時,想出了個一勞永逸的辦法:

用兩個方塊堵住房間入口,搜尋者便再也無法找到他們

第二階段。

在之後的7500萬局模擬中,隱藏者靠這個技巧立於不敗之地,甚至學會瞭如何用方塊來給自己搭建一個安全的房間。這是研究人員所預測到的第二階段。

但遊戲又出現了新的轉機。搜尋者開始注意到地圖旁邊可移動的斜坡,在經過數次的嘗試之後,它們開始利用斜坡翻過牆壁並找到隱藏者,實驗開始進入第三階段。

第三階段。

不過戰術永遠是螺旋式上升的,很快,躲藏者又學會了在開始前將斜坡一併推進房間中並用方塊堵住入口:

至此,研究人員認為該實驗已經結束,搜尋者不可能再想出更好的解決方案,但在經過3.8億次嘗試後,搜尋者又琢磨出了一個新方法,出乎所有人的意料。

搜尋者找到了一個無法移動的斜坡,利用斜坡使自己站上方塊並推動方塊使自己跳入被隱藏者封閉的房間中。

為了應對這個辦法,數次失敗後,隱藏者又學會了新技能:在比賽開始前將每一個可移動的方塊和斜坡都鎖定住,以此使搜尋者再也無法使用工具。至此,這個AI的捉迷藏遊戲才正式結束。

正如研究人員最後總結的那樣:“一旦一方學會了新策略,就會給另一方帶來相應的壓力,就好像自然界中生物的進化過程一樣。”

研究人員希望通過這個實驗來探索AI適應環境的能力和自主發生的複雜行為,因此他們並沒有傳授AI如何使用工具的技巧。實驗中所有的行為都是AI通過大量的實驗自己掌握的。

簡單的規則,存在競爭關係的多個主體,再加上可以自由使用的工具,三者結合在一起使得AI能適應多種複雜的環境,研究人員在最後表示:“就想它們在最後做出的行為一樣,人工智能可以做出我們想不到的行為,或許在將來甚至能夠解決人類無法解開的難題。”

他說的確實沒錯,在一次實驗過程中,AI就幫他們找到了一個意料之外的穿牆Bug:

 




喜歡這篇文章的話,請幫這篇文章點個讚,或者到 雲爸的3C學園按個讚,快速得到最新的文章喔


有任何疑問,歡迎加入《3C問題互助團》社團這裡可以讓大家互相討論手機、電腦問題

不定時我也會在這邊舉辦抽獎,歡迎一起來聊聊

Filed Under: 有趣的分享, 網路蒐集的文章

Previous Post: « 1億像素主鏡頭 小米 MIX Alpha正式發布,屏占比180.6%。
Next Post: 全球首款240Hz更新率手機 SHARP AQUOS zero2 »

Reader Interactions

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Primary Sidebar

近期文章

開箱評測| 零死角攝影機皇降臨! vivo X90 Pro 雙晶片觀星旗艦

教你把SSA字幕轉成SRT格式,同場加映字幕簡轉繁

法式黑魂介面 BLVCK X WHTE,Android | iOS 都有

快更新! Ptt強制重設聯絡信箱,不然會永久失去Ptt帳號

一蘭拉麵扭蛋共4款,味集中個人座、“豚骨拉麵&楓玉”、、“楓玉盤子&呼叫按鈕”、“招牌磁鐵”

教你在安卓手機上玩PS2模擬器 – AestherSX2 以太模擬器,按圖施工保證成功

作者

大家好,我是《雲爸》 曾任三星學園講師達兩年經驗,也曾擔任 LG G Pro2 體驗會講師,浸淫文字十多年,熱愛與大家分享 3C、生活、以及生活大小事 專注於最新手機、平板、筆電以及使用者教學、系統與APP 介紹,以及最有趣的話題,不愛贅字也不囉嗦,精簡扼要的讓你明白,什麼是3C。
業務合作請來信:dacota@outlook.com

分類

展開全部 | 收合全部

瀏覽量

本日人氣:7,101
總瀏覽量:90,747,244

Copyright © 2023 · 雲爸的私處 All Rights Reserved. | 網頁維護:Fast Line 台灣速連