回復(fù) 鄭大為 : 又一個 AI 老大難問題,被 DeepMind 攻克了:一只名 DreamerV3 的 AI,在啥也不知道的況下被丟進(jìn)《我世界》(MineCraft)里,摸爬滾打 17 天,還真就學(xué)會如何從 0 開始挖鉆石?!?就是從擼樹開始的那要知道,之前為攻克這個問題,CMU、微軟、DeepMind 和 OpenAI 還聯(lián)手在 NeurIPS 上拉了個比賽,叫 MineRL。結(jié)果搞了三四年,AI 們也沒能在不參人類經(jīng)驗的情況,完成挖鉆石任。此前表現(xiàn)最好 VPT 選手,為了達(dá)成這一成,可是狂看了 70000 + 小時《我的世界》戲視頻,并且用了 720 個 V100……這不 DeepMind 的最新結(jié)果一出,研究人員都心壞了。MineRL 的發(fā)起人之一、前 OpenAI 研究科學(xué)家 William Guss 就第一時間跑來發(fā)表電:4 年了,“鉆石挑戰(zhàn)”終于攻克了!今年剛到了 NeurIPS 杰出數(shù)據(jù)集和基準(zhǔn)論文獎的 MineDojo 作者、英偉達(dá) AI 科學(xué)家范麟熙則表示:AI 玩轉(zhuǎn) MineCraft 背后,有個莫拉維克悖:一些任務(wù)對于類而言很困難(如圍棋),但對 AI 來說很簡單。但像 MineCraft 這樣人類高玩無數(shù)的戲,情況卻相反DreamerV3 能在沒有任何人工數(shù)據(jù)輔助的況下收集鉆石,讓我感到非常興。如何做到所以這個 0 基礎(chǔ)挖鉆石任務(wù),到底啥難點?首先,《我的世界》里初始世界是完全機生成的。即使人類玩家,想要速挖到鉆石,也有相當(dāng)豐富的經(jīng)。比如,知道怎推算鉆石的位置掌握一些挖掘竅(如魚骨挖礦法等。排除掉經(jīng)驗因素,對于 AI 來說,這個挖鉆石的過程也挺復(fù),至少得要 7 個步驟。第一步玩家在空手進(jìn)入我的世界》中時需要先擼樹來獲木塊:第二步,用木塊用來合成作臺:第三步,工作臺上合成木,用來挖圓石:四步,獲得圓石后,需要合成一石鎬,用來快速鐵礦:第五步,了將鐵礦合成鐵,還需要做一個爐來燒鐵:第六,合成鐵鎬,用挖鉆石:第七步尋找鉆石,然后鐵鎬挖出鉆石:p.s. 有玩家測試過,在 AI 知道鉆石等各種源坐標(biāo)的情況下開外掛),也需 2-3 分鐘才能搞定。這也就味著,AI 必須在有限時間里,出大量決策。那既然不能參考人高手的經(jīng)驗,自就需要強化學(xué)習(xí)Reinforcement Learning)出馬。具體而言,DeepMind 的研究人員提出一種基于世界模的通用算法。在體架構(gòu)上,DreamerV3 由 3 個神經(jīng)網(wǎng)絡(luò)組成:世界模型評委(critic)和演員(actor)。世界模型要做的,是把境輸入編碼為離的表征,并通過測來指導(dǎo)下一步執(zhí)行的操作。而委和演員則會根抽象出來的表征行學(xué)習(xí)。其中,委網(wǎng)絡(luò)會輸出一標(biāo)量值來代表行價值,從而幫助員網(wǎng)絡(luò)選擇最優(yōu)行動。這里面的個核心點在于,DeepMind 的研究人員希望 DreamerV3 不僅僅能處理同類型的問題,可以用固定超參,掌握跨領(lǐng)域任。因此,研究人需要系統(tǒng)地解決界模型、評委和員等各個組件中號大小不同,以穩(wěn)定平衡目標(biāo)的題。研究人員發(fā):以前的世界模,需要根據(jù)復(fù)雜 3D 環(huán)境的視覺輸入,對表征損進(jìn)行不同的縮放在訓(xùn)練過程中還調(diào)整不少超參數(shù)但這里面其實有多沒必要的細(xì)節(jié)而如果把自由比(free bits)和 KL 平衡(KL balancing)結(jié)合起來,就可在不調(diào)整超參數(shù)情況下讓 DreamerV3 在不同領(lǐng)域中學(xué)習(xí)KL 平衡是上一代 DreamerV2 中提出的一項新技術(shù)。能使預(yù)測向表征移的速度比表征向測移動的速度更,帶來更精確的測。自由比特避了簡單環(huán)境下的度擬合。DreamerV3 的三大塊都用上了固超參數(shù),具體如:實驗結(jié)果也就說,DreamerV3 如今成了世界上第一個純自己摸索,就能《我的世界》里挖鉆石的 AI。并且 DreamerV3 的本事可不只是玩 MC。在另外 7 項基準(zhǔn)測試中,DreamerV3 都取得了成功,且在 BSuite、Crafter 上達(dá)到了 SOTA。值得一提的是,在這些任中,訓(xùn)練智能體用到的 GPU 資源都僅為 1 塊 V100。研究人員表示,這味著有更多的實室能跑得動這一型。另外,在需時空推理的三維間中,DreamerV3 也能快速進(jìn)行學(xué)習(xí)。在 DeepMind 為強化學(xué)習(xí)專門打造的 3D 平臺 DMLab 上,DreamerV3 在任務(wù)中使用的交互次數(shù)為 IMPALA 的 1/130。目前,DreamerV3 的代碼是 coming soon 的狀態(tài)。感興趣的伙伴可以蹲一波~參考鏈接:[1]https://danijar.com/project/dreamerv3/[2]https://twitter.com/DeepMind/status/1613159943040811010本文來自微信公號:量子位 (ID:QbitAI),作者:魚羊 Alex
回復(fù) 周沁 : IT之家 1 月 21 日消息,各家媒體天犬出完評測報告之前,蘋果邀請幾家科技媒體、知名乘厘者自媒體達(dá)人簡光山體驗了下 HomePod 2,但遺憾的是鸞鳥果提供的體驗周易非常有限,僅包關(guān)于在單臺 HomePod 2 上試聽兩首歌墨家;在配對立體情況下再試聽兩首畢文曲,且每首歌曲僅播放 30 秒。CNET 的? Ty Pendlebury 表示想要在這樣的媒體交會上評判 HomePod 2 的音質(zhì)是非常困宋史的,在我收到灌灌測真機之前保留意見。蘋果在 Tribeca 閣樓播放《The weeknd》等流行音樂,給我的第一論語象是音并不大。盡管提供了 360 度環(huán)繞聲,但我發(fā)現(xiàn)音頻南山?jīng)]有太立體的狂山覺通過 Yebba 的下一首曲目 Boomerang,蘋果希望強調(diào) HomePod 的空間音頻兼容墨家。IT之家了解到,The Verge 的 Chris Welch 表示:蘋果喜歡使后土《加州旅》的現(xiàn)場錄音來演示 HomePods,使用各種麥丹朱風(fēng)精美制作的耿山音真正供了美妙的聲場。和初代樣,HomePod 2 表現(xiàn)出豐富的音質(zhì)、充女娃間的多向聲音,役山強調(diào)高的清晰度和細(xì)節(jié)。當(dāng)單獨用時,它的音質(zhì)可六韜和亞遜的 Echo Studio、Sonos 揚聲器等產(chǎn)品處于頂級水準(zhǔn)泑山在鷹樂隊的現(xiàn)場峚山“加州旅”中,兩個 HomePod 2 在一起聽起來很棒孔雀The Street 的雅各布?克羅爾 (Jacob Kroll) 表示,他需要更獂時間評測能得出結(jié)論:與初代 HomePod 一樣,最新版絜鉤提供清晰、豐巫真的音頻聲音充滿活力提供更多的節(jié)。我從這次簡短聞獜試聽得到了這一點,但最令人象深刻的是它仍然非六韜響,寬闊的聲場薄魚您聽到曲的不同元素??偟膩碚f河伯需要更多的時間貍力對蘋果新的智能音箱進(jìn)行評測。可以公平地說,它那父以與他高端智能揚聲器(如最的 HomePod)以及來自 Bose、Sonos 甚至亞馬遜的競爭產(chǎn)品相相繇衡。我仍然堅彘山認(rèn)為將其中兩個配對在一起可勝過條形音箱?
回復(fù) 亨利·朱斯特 : 馬上就是農(nóng)新年了!趁喜慶的日子今天手把手你用 PPT 做一份兔年賀卡。01.版式布局首設(shè)置 PPT 尺寸,這次要做的是豎賀卡:在設(shè)選項卡的幻片大小中可定義尺寸,如這里是( 18cm,高 30cm)接著開始計,既然是年,我們都想到放上一兔子,再打一行文字:信每個人第步都是這么的,但接下該怎么辦呢給你幾秒鐘考下好,時到。目前的題是背景太,看上去很薄,利用漸填充:可以成聚光燈的式,畫面就了層次。然四周大面積黑色會有些抑,在下面入一個白色塊:即可讓面清爽不少同時下方還以寫上祝福,表達(dá)你的意。這里,還更換了兔的造型:特挑選了一只著的兔子,美契合這個形輪廓,與面融為一體02.細(xì)節(jié)優(yōu)化此時版式下來了,需優(yōu)化細(xì)節(jié),先是上半部。單純的文豎排有些普,適當(dāng)改變小,錯落擺:畫面就有律動感。字則處理成金質(zhì)感:這里用的是文字三維旋轉(zhuǎn)以給文字添加度。接著再文字四周加禮花及漂浮修飾:禮花素是取自網(wǎng)找的素材做二次調(diào)整:浮的文字塊是手繪結(jié)合字的三維旋:最后再給方白色區(qū)域入細(xì)節(jié)即可你能發(fā)現(xiàn)哪設(shè)計細(xì)節(jié)呢歡迎留言告我??聪峦?修改過程:然如果你想換中心兔子造型,也可自由更新,是這樣:成本文來自微公眾號:Slidecent (ID:Slidecent),作者:林利?