国产色图av,国产精品无码av永久免费,亚洲aⅤ无码一区二区波多野按摩

當(dāng)前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

谷歌DeepMind團(tuán)隊(duì)圍棋類(lèi)AI新進(jìn)展：AlphaGo升級(jí)版AlphaZero強(qiáng)勢(shì)來(lái)襲

2018-12-07 11:08

AI銳見(jiàn)

關(guān)注

近日，據(jù)外媒報(bào)道，谷歌DeepMind團(tuán)隊(duì)帶來(lái)了一個(gè)全新的通用的版本。這個(gè)程序被稱(chēng)為AlphaZero，它教會(huì)自己在短短三天內(nèi)玩三種不同的棋盤(pán)游戲（國(guó)際象棋、圍棋和日本版國(guó)際象棋），沒(méi)有人為干預(yù)，這一描述成就的論文發(fā)表在《科學(xué)》雜志上。

谷歌DeepMind團(tuán)隊(duì)圍棋類(lèi)AI新進(jìn)展：AlphaGo升級(jí)版AlphaZero強(qiáng)勢(shì)來(lái)襲

DeepMind首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis說(shuō)“從完全隨機(jī)的游戲開(kāi)始，AlphaZero逐漸學(xué)會(huì)了什么是好的游戲，并形成了自己對(duì)游戲的評(píng)價(jià)。從這個(gè)意義上講，它不受人類(lèi)對(duì)游戲思考方式的限制�！�

AlphaZero是DeepMind旗下AlphaGo的直系后代。2016年，AlphaGo打敗了圍棋（人類(lèi)）世界冠軍李世石（Lee Sedol），成為世界各地的頭條新聞。AlphaGo并不滿(mǎn)足于此，去年獲得了一次重大升級(jí)，能夠在不需要人工干預(yù)的情況下自學(xué)獲勝策略。

谷歌DeepMind團(tuán)隊(duì)圍棋類(lèi)AI新進(jìn)展：AlphaGo升級(jí)版AlphaZero強(qiáng)勢(shì)來(lái)襲

通過(guò)一遍又一遍地與自己下棋，AlphaGo Zero （AGZ）訓(xùn)練自己在短短三天時(shí)間內(nèi)從零開(kāi)始，以0比100完勝最初的AlphaGo 100。它得到的唯一輸入是游戲的基本規(guī)則。

AlphaZero通過(guò)應(yīng)用大量處理能力，5，000張?zhí)幚韱卧═PU），相當(dāng)于一臺(tái)非常大的超級(jí)計(jì)算機(jī)，很快地學(xué)會(huì)了玩三種棋盤(pán)游戲中的每一種。

谷歌DeepMind團(tuán)隊(duì)圍棋類(lèi)AI新進(jìn)展：AlphaGo升級(jí)版AlphaZero強(qiáng)勢(shì)來(lái)襲

不像以前的國(guó)際象棋機(jī)器那樣以極快的速度處理人類(lèi)的指令和知識(shí)，AlphaZero會(huì)產(chǎn)生自己的知識(shí)，它只需幾個(gè)小時(shí)即可完成，其結(jié)果已超過(guò)任何已知的人或機(jī)器。

但是，AlphaZero的基本算法實(shí)際上僅適用于可以采取相當(dāng)數(shù)量的操作問(wèn)題。它還需要一個(gè)強(qiáng)大的環(huán)境模型，即游戲規(guī)則。

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶(hù)名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

圖片新聞

推薦商品