1:0,AlphaGo 打敗柯潔,用的處理器隻有上次的 1/10



烏鎮,5 月 23 日 14 點 52 分。AlphaGo 1,柯潔 0。機器再次在圍棋上打敗人類台中月子中心費用

柯潔是目前圍棋等級分排名世界第一的選手。AlphaGo 是 Google 下屬 Deepmind 開發的圍棋人工智能,因去年 3 月 4:1 戰勝圍棋世界冠軍李世乭成名。

比賽在上午 10 點半開始,下午 14 點 55 分裁判開始數子,比賽歷時 4 小時 25分。


柯潔執黑先手,佈局階段使用瞭 AlphaGo 之前所用,而人類棋手幾乎不會使用的開局“點三三”下法落子。柯潔途中上瞭一次廁所,和 AlphaGo 最終進行到官子階段,在第 286 手之後開始數子。根據雙方約定的中國式圍棋規則,黑方柯潔九段先手貼三又四分之三子之後以 180 又四分之三子,輸白方四分之一子,以圍棋對決中最微小的差距落敗。

接下來,柯潔還會在 5 月 25 日和 5 月 27 日與 AlphaGo 再下兩盤,在 5 月 26 日,數名中國頂尖職業圍棋選手還會組成團隊和 AlphaGo 進行兩盤團體和配對比賽。


在 AlphaGo 大敗李世乭,並且化名 Master 在線打敗柯潔之後,這次比賽的勝負沒什麼懸念,至少比去年李世乭賽前的期待要悲觀得多。





“一年前我期待李世乭 3:2 或者 4:1 戰勝 AlphaGo,我當時沒預料它那麼強大。今年的結果毫無疑問,AlphaGO 三場全勝。”阿爾伯塔大學教授喬納森 謝弗(Jonathan Schaeffer)賽前對《好奇心日報(www.qdaily.com)》表示。謝弗教授是人工智能專傢,曾帶隊制作跳棋和國際象棋程序。

博彩業的預測則是 AlphaGo 勝率 95.24%、柯潔 12.5%。AlphaGo 獲勝賠率 1.05、柯潔獲勝賠率 8。也就是說買 10 元柯潔獲勝,將能獲得 80 元;10 元買 AlphaGo 勝,就隻能拿回 10.5 元。

但這次令人意外的地方是,AlphaGo 背後的計算能力隻有此前對戰李世乭那會兒的 1/10。

比賽之後的新聞發佈會上,哈撒比斯在談到 AlphaGo 的技術細節時解釋說,去年戰勝李世乭時,AlphaGo 的程序需要依靠全世界 Google 很多機房提供計算能力。

而今天的 AlphaGo 的算力需求更小,它不再是分佈式運算,整個程序僅運行在一個單一的雲服務器裡。今天 AlphaGo 調用的算力隻有對弈李世乭那會兒的 1/10。

換句話說,同樣是戰勝人類頂尖棋手,AlphaGo 的程序性能提升瞭至少 10 倍。

比賽為期五天,“低調”莫名

除瞭柯潔和 AlphaGo 的三番棋對局,5 月 26 號還會進行兩場團體賽,分別是古力和 AlphaGo 配對,應戰連笑和 AlphaGo 的組合;另外一場是五位中國圍棋冠軍共同對戰 AlphaGo。

比賽在烏鎮西柵景區的互聯網國際會展中心舉行,安保嚴密。門口停著一輛浙江警方的 PTU 巡邏車、進門社有安檢、負責安保的武警和公安分佈在會展中心各處。

有 120 多傢中文媒體、十幾傢國外媒體在現場報道。媒體和工作人員,包括 Google 中國員工,都在比賽前半個月將個人信息上傳到政府網站,進行備案和審核。

一年前李世乭對陣 AlphaGo 時,比賽安排在首爾四季酒店,現場簇擁著媒體。

在賽前的開幕式上,數位中國政府官員和 Google(Alphabet)董事長埃裡克 施密特、Google 大中華區總裁石博盟、DeepMind 首席執行官丹密斯 哈薩比斯 (Demis Hassabis)登臺致辭。

“我很榮幸再次回到中國。各位眼前看到的,是一個非常棒的改變世界的機會。Alphabet 帶來的是在人工智能領域的新嘗試。”施密特說。


據稱是因為有關部門的要求,整場比賽在中國境內沒有視頻直播,曾在 4 月放出預告的 CCTV5 體育臺直播被換成籃球直播。

你能在 YouTube 上看到現場直播,有中英文語言版本。多傢網站曾轉播 YouTube 視頻,但比賽中途全部撤下。

圍棋是人腦在棋類上的最後防線

1996 年 2 月 10 日,IBM 研發的國際象棋超級計算機“深藍”嘗試挑戰當時的國際象棋世界冠軍,俄羅斯棋手加裡 基莫維奇 卡斯帕羅夫,這輪六局比賽卡斯帕羅夫保住瞭勝利,深藍總比分 2 比 4 落敗。

1997 年 5 月 3 日,國際象棋人工智能“深藍”的升級版“更深的藍”挑戰國際象棋世界冠軍加裡 基莫維奇 卡斯帕羅夫,以兩局勝利和三盤和棋,總比分 3.5 - 2.5 獲勝。

比賽前,美國《新聞周刊》在封面上印出“人腦最後防線”的標題。

但其實圍棋才是人腦在公平遊戲裡的最後防線。

圍棋棋盤一共有 361 個落子點,平均分配的話,一方棋子占據的位置加上活棋圍住的落子點隻要超過 180.5 個就會勝利。

規則雖然簡單,但是圍棋每一步的可能性都是天文數字,靠計算機窮舉原理上就是不可能的。

而在大眾看來,人工智能的思考能力不如人類,所以即使在卡斯帕羅夫敗給深藍之後,圍棋也被認為是計算機沒辦法“學會”的一門技藝。


Zen 圍棋 AI 在讓 5 子和讓 4 子的情況下兩次擊敗日籍九段棋手武宮正樹,AI 剛剛摸到瞭人類頂尖棋手的邊緣。


之後十多年裡,圍棋人工智能的棋藝相距人類圍棋大師甚遠。直到 AlphaGo。

計算性能的進步打敗瞭象棋大師,計算方法的進步打敗瞭圍棋大師

人工智能依托的電子計算機,從誕生之日起,就是比人類強大的多的計算工具。

人類的第一臺商用電子計算機,1946 年誕生於美國賓夕法尼亞大學的 ENIAC 和現在的電台中產後護理中心介紹腦相比非常笨重和遲鈍,但即使是這臺占地幾間大教室的老古董,每秒也可以進行 5000 到 10 萬次加法運算。

在這之後,電子計算機在半導體工業的發展下突飛猛進。1965 年,英特爾的創始人之台中產後之家介紹一戈登 摩爾發表瞭著名的“摩爾定律“,他提出,大規模集成電路上晶體管的數量,會隨著材料和工藝的進步逐漸增加,大約每隔兩年便會增加一倍,同時計算能力也提升一倍。

回過頭來看,從 1900 年到 2015 年這 100 多年,人類計算機機器的性能確實沿著“摩爾定律”發展。從 1900 年代用於人口普查的機械制表器每分鐘 150 次計算能力開始,到 2016 年 Nvidia 推出的 GeForce Titan X 顯卡,在火柴盒大小的芯片上已經集中瞭 80 億個晶體管。


關於戰勝卡斯帕羅夫的“深藍”有一種誤解,認為超級計算機深藍是靠單純的“窮舉”,通過計算所有的可能性來實現勝利。實際上,深藍的算力約為每秒 2 億步棋,想要窮盡國際象棋十的四十五次方這個級別的可能性需要十的二十九次方年的時間,這顯然不可能。

最終在公平遊戲中戰勝人類的 AlphaGo 同樣不依靠窮舉,現在看來,它也不是非常依賴電子計算機的發展。

2013 年開始,國際半導體發展路線圖組織的數據顯示,摩爾定律已經逐漸失效,每兩年增加一倍的計算裡已經逐漸擴大到瞭三年,隨著材料和工藝瓶頸,摩爾定律最終可能完全失效。

今天英特爾的處理器已經不能維持摩爾定律,每年的產品升級更多是在降低制造成本。

而 Nvidia 的性能提升則依賴於顯卡本身,因為顯卡對功率和散熱的需求不是那麼苛刻,頂級顯卡都是板磚那麼大的一塊,所以核心面積可以比 CPU 更大,晶體管更多,運算能力更強。

相比於過去 50 年的飛速發展,大規模集成電路最終可能進入原地踏步的境地。

AlphaGo 打敗人類,靠的是深度學習。上一個版本的 AlphaGo,每秒鐘可以計算幾百萬步棋,通過大量學習人類棋局,用這些經驗自我對弈產生新的經驗,用這些新經驗來下棋。

而後 AlphaGo 再利用蒙特卡羅樹搜索產生下一步對應台中市月子中心的下法,最後配合“亂下”產生的對局面的評估,最終取得勝利。更詳細的解釋,可以看這篇文章。

這次戰勝柯潔的 AlphaGo 一定用瞭新的算法和邏輯,才能在十分之一的算力裡完成戰勝人類頂尖棋手的圍棋水平。

“圍棋,我台中月子中心推薦還是喜歡跟人下。”柯潔在比賽結束後的發佈會這麼說道。



題圖來自 Google

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    tvmnnfpcxc 發表在 痞客邦 留言(0) 人氣()