呂堯和陸小亦在別墅一樓大廳,陪著王杉一起熬進度。
王杉在熬了30多個小時后,終于發出了成功的歡呼。
呂堯和陸小亦都是精神一振,然后迅速起身倆口王杉身邊恭喜道:“成功了?太好了啊!”
陸小亦恭喜完就關心王杉的身體:“你身體怎么樣?有什么什么不舒服的地方?外面就有醫護人員,要不要讓他們過來幫你檢查下?”
對王杉這種學神級別的存在,上面給到的關心和關注是難以想象的。
因為科研人員是最容易掌握的優質資源,他們沒什么野心,反而會帶來難以估量的價值,所以每一個類似的王杉的研究型學者都堪稱國寶。
但王杉卻擺著手,渾身上下是難以遏制的的亢奮:“不著急不著急,你們先來試試看我做的這個模型。”
“這是任務輸入端,你們可以嘗試輸入點什么。”
在王杉的電腦屏幕上是一個看著就很簡陋的對話框,對話框的最下面是文本輸入欄。
這是一個類似qq聊天框的東西,只不過ui遠不如qq聊天框精美,但ui在現階段并不重要。
呂堯看了眼陸小亦和王杉,然后坐到王杉的電腦椅里開始在輸入框里打字道:“你好啊。”
對話框上面有一個小圓圈轉了轉后,很快給出回復:“你好啊!什么事你找我,。”
呂堯挑眉,繼續輸入自然語言:“就是單純來聊聊,沒什么事。”
對話框上的小圓圈再次轉了轉后給出回復:“那我們可以聊聊詩歌,我會三百首唐詩,怎么樣?”
呂堯輕輕倒吸了一口涼氣,看向王杉:“王哥,這不是預設的答案吧?”
王杉激動道:“當然不是!”
陸小亦看著系統給出的回復有點摸不著頭腦:“這個回復看不出什么東西啊,比之前我在你們實驗室看到的東西都差遠了。”
王杉連連擺手:“不一樣的不一樣的,她才誕生多久啊,她的潛力很大的。”
說完王杉就開始科普道:“現在大部分的計算機深度學習模型都是通過積累數據然后通過分析輸入端的問題,進行檢索回復,這種深度學習模式是有弊端的。”
“舉個例子。”
“「我喜歡吃蘋果」和「蘋果手機真的很不錯」這兩句話里,雖然蘋果兩個字一樣,但代表的含義卻截然不同。”
“現在的任務是要給蘋果打標簽,我們都知道第一個「蘋果」是一種水果,第二個「蘋果」是蘋果公司,假設我們現在有大量的已經標記好的數據以供訓練模型,當我們使用全連接的神經網絡時,我們做法是把「蘋果」這個單詞的特征向量輸入到我們的模型中,在輸出結果時,讓我們的「標簽」里,正確的標簽概率最大,來訓練模型。”
“但我們的語料庫中,有的蘋果的標簽是水果,有的蘋果的標簽是公司。這將導致,模型在訓練的過程中,預測的準確程度,取決于訓練集中哪個標簽多一些,這樣的模型對于我們來說完全沒有作用。”
王杉開始自問自答的說道:“那么問題在哪兒呢?問題就出在了我們沒有結合上下文去訓練模型,而是單獨的在訓練「蘋果」這個單詞的「標簽」,這也是全連接神經網絡模型所不能做到的,所以后來就有了循環神經網絡這個深度學習模型。”
“但循環神經網絡卻也有自己的弊端,不管是「梯度消失」還是「梯度爆炸」,又或者是「全局建模」,「長期記憶」,乃至「擴展性」或「泛化能力」都有上限。”
王杉深深倒吸一口氣:“但現在!經過呂總的提點,加入「提煉重點」的算法后,也就是數學上的離散概率分布算法,通過加入這一算法后,原本循環神經網絡的弊端將得到極大的改善!”
“經過我十幾個小時的數據訓練,現在這個ai模型在「梯度傳播」,「全局建模」以及「長期記憶」方面都取得了跨越式的成長。”
王杉在講述他的成果時用了非常多的專業性詞匯,這讓一直努力想要跟上王杉思路的陸小亦十分吃力。
但全程認真聽完的她總之是明白了一件事,那就是他們的ai數據中心建設迎來了特別重要的一步。
所以陸小亦也激動起來:“所以咱們的ai模型是成功了嗎?”
王杉擺擺手:“那還差得遠了,現在這個模型只是表現出了不錯的解析能力,但學習能力,強度測試以及多層序列處理能力還沒有進行測試。”
“更別說這方面的專業數據分析學習,模型后期的建設還有很長的路要走呢。”
呂堯倒是能大概理解王杉話語里表達的意思,因為在十年后,ai是所有人都不得不面對和考慮的問題,甚至很多互聯網大佬都在說——你可以不懂ai技術,但你一定要會使用ai。