五分鐘了解DeepSeek

發布時間：2025-01-29 22:42:18 來源：林草價值網鏈

【】

近日，美科技股大跌，英偉達等與人工智能聯系緊密之公司的股價暴跌。這一切都是因為中國一個名不見經傳的初創AI公司推出的一款大語言模型引發的。這款大語言模型的名稱，就是DeepSeek R1。

什么來頭？什么樣的技術能夠引出太平洋對岸世界第一大股市的地震？

一早看美股，納斯達克指數下挫612點，跌幅3.07%。標普500下跌1.46%。一些主打人工智能或與人工智能聯系密切的公司股票大幅度下挫。英偉達下跌17%，博通下跌17.4%，甲骨文下跌13.8%，Vertiv Holdings慘跌29.9%，Vistra Corp更是下跌了28.3%。相比之下，與人工智能聯系較小的道瓊斯指數受到的影響較小，全日未降反而略升，微漲了0.65%，據認為這多半得益于債券收益率下降的防御性股票的上漲。

55(1).jpg

上圖受DeepSeek R1沖擊，納斯達克股指大跌

看來，DeepSeek引發的震蕩不小。

什么是DeepSeek？

中文名“深度探索”，是杭州一家人工智能初創公司。該公司由對沖基金經理梁文鋒于2023年7月份創立，其推出的DeepSeek R1，是一款大語言模型，幾乎可以和著名的競爭對手相匹敵，包括OpenAI的GPT-4、公司的Llama，以及谷歌公司的Gemini，而其開發成本只是這些巨無霸公司的百分之幾。該公司宣稱，其基礎AI模型的開發僅僅花了560萬美元，而同類美國公司在AI技術上的花費，少則數億美元，多則數十億乃至數百億美元。

不僅開發成本相對極低，而且還有另外兩個優勢：一個是對芯片功率要求相對低。考慮到美國近年以來一直以國家安全為由限制向中國供應大功率人工智能芯片，令美國科技節震驚的是，這意味著，DeepSeek多半能利用功率相對較低的AI芯片實現和那些使用昂貴大功率芯片一樣的表現。另一個優勢是耗能相對很小，因為它使用的芯片數量較少。

過往一年，DeepSeek曾經發布過多款有競爭力的AI模型，這些模型吸引了業界的關注。據《華爾街日報》報道，其V3模型提高了人們對該公司的一些認識。但最初業界認為，其內容受到本國政府及領導層敏感話題的限制，不可能走多遠。

然而，幾個月之后的2024年年底，它發布的R1，以其強大的算力攪動了科技界。尤其是它所透露的極低的開發成本，引起了全世界的關注。而且它是開源的，這意味著其他公司可以測試和構建該模型來改進它。

DeepSeek APP在各大應用程序商店推出以來，下載量一路飆升，1月27日，也就是星期一超過了ChatGPT，被下載近200萬次。這應被視為引發美科技股大跌的一個導火索。

何以DeepSeek引人注目？

人工智能是一種高能耗與高成本的技術，故而美國最強大的技術領導者正在出巨資收購核電公司，以便為其人工智能模型提供必要的電力。

公司近期宣布，2025年將在人工智能開發上投入650多億美元。OpenAI首席執行官Sam Altman不久前預測，人工智能行業將需要數萬億美元的投資來支持開發高需求芯片，以及為運行該行業復雜模型的耗電數據中心供電。

與美國頂尖人工智能模型類似的功能可以以如此小的成本實現，且可在能力較差的芯片上運行，這標志著這個行業對人工智能需要投資規模的巨大變化，雖然這項技術有很多懷疑論者和反對者，但其倡導者一直承諾有一個光明的未來：他們認為，人工智能將推動全球經濟進入一個新時代，使工作更高效，并在多個行業開辟新能力，為新的研究和開發鋪平道路。

特朗普的支持者、硅谷風險投資公司Andreessen Horowitz的聯合創始人Andreessen在X上的一篇推文中說，DeepSeek是“我見過的最驚人和最令人印象深刻的突破之一”！

如果這種潛在的改變世界的力量能夠以大幅降低的成本實現，它將為人類開辟了新的可能性，同時帶來新的威脅。

何以DeepSeek令美國朝野震驚？

這件事出乎美國政府和科技巨頭們的預料。

美國政府向來認為，它可以助力美國企業在關鍵技術領域的主導，這將有助于加強國家安全。就在卸任前一周，拜登還出臺了一系列法規，限制人工智能計算機芯片的出口，以防止中國等競爭對手獲得先進技術。

但DeepSeek對這一設想投下一個大大的問號，同時打破了美國科技天下無敵的光環。美國可能已經為自己爭取了時間，限制了芯片出口，但盡管采取了這些行動，其人工智能的領先優勢卻已急劇縮小了！

DeepSeek的橫空出世多半表明，技術封鎖并不一定意味著美國將獲勝。這也是對特朗普實施孤立主義及“美國優先”政策的一個最大挑戰。

DeepSeek會讓美國失去優勢嗎？

AI界對于DeepKeep公司宣布的如此之低的成本，迄今無人提出有力的異議。這是資本市場之所以恐慌的一個重要原因。一家不知名的公司能做出如此大的突破，意味著它花費的成本再高也不會高過美國那些大公司。

華爾街多半是對這一發展趨向感到震驚，由此引發了股市大跌。

然而，這是否意味著美國AI公司的優勢正在失去？對此，美國業界顯然并不這樣認為。

Truist公司分析師勒內（Keith Lerner）說：“DeepSeek模型的推出導致投資者質疑美國公司擁有的領先優勢，花費了那么多錢是否有利可圖？”，他認為，人工智能的支出依然將是巨大的，美國公司仍然是引領者。

雖然節省成本很重要，DeepKeep R1模型無疑是ChatGPT的強勁競爭對手，但它屬于以消費者為中心的大語言模型，尚未證明它能夠為目前仍然需要巨額基礎設施投資的行業處理一些緊迫而棘手的問題，在這類領域的AI模型，依然需要巨額投資。

人工智能市場研究公司Reflexivity總裁塞特（Giuseppe Sette）認為：由于美國擁有豐裕的人才和資本優勢，因此未來仍然是人工智能開發最有前途的'家園'，預計首個具有自我改進能力的人工智能將會在美國出現。

（本文主要參考了幾篇英文文獻及報道）

附錄：關于梁文鋒

由于這一突破，梁文峰一夜之間成名，被稱作中國的奧特曼（Sam Altman），與美國人工智能技術引領者奧特曼齊名。他是從做對沖基金起家的，但在對沖基金運作中使用了大量人工智能技術，并將投資收益反投入人工智能的開發。

百度百科是這樣介紹的：

梁文鋒，1985年出生于廣東省湛江市，2008年浙江大學本碩連讀畢業，獲信息與電子工程學學士和碩士學位。杭州幻方科技有限公司、DeepSeek創始人。

2008年起，梁文鋒開始帶領團隊使用機器學習等技術探索全自動量化交易。2015年，幻方量化正式成立。2019年，其資金管理規模突破百億元；同年，梁文鋒在當年的金牛獎頒獎儀式上發表主題演講《一名程序員眼里中國量化投資的未來》。2020年開始，幻方的AI超級計算機“螢火一號”正式投入運作。2021年，幻方投入十億建設“螢火二號”。2023年7月，幻方量化宣布成立大模型公司DeepSeek，正式進軍通用人工智能領域。2024年5月，DeepSeek發布了DeepSeekV2；同年12月27日，DeepSeek-V3面世。2025年1月20日， DeepSeek正式發布DeepSeek-R1模型；同日，梁文鋒參加了中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會，并在會上發言。

（2025/01/28晨讀記于海南博鰲）

55(2).jpg