奇米超碰,男男激情网站,少妇无码免费专区,九色视频老

  • 元宇宙:本站分享元宇宙相關(guān)資訊,資訊僅代表作者觀點(diǎn)與平臺(tái)立場(chǎng)無(wú)關(guān),僅供參考.

DeepSeek的“服務(wù)器繁忙”讓所有人抓狂 背后究竟是怎么回事

  • 2025年2月13日 18:56

來(lái)源:硅星人Pro

DeepSeek頻頻回復(fù)的“服務(wù)器繁忙,請(qǐng)稍后再試”,正在讓各地用戶抓狂。

此前不太被大眾所知的DeepSeek,因2024年12月26日推出對(duì)標(biāo)GPT4o的語(yǔ)言模型V3而聲名鵲起。在1月20日DeepSeek又發(fā)布對(duì)標(biāo)OpenAIo1的語(yǔ)言模型R1,之后因?yàn)椤吧疃人伎肌蹦J缴傻拇鸢竷?yōu)質(zhì)度高,以及其創(chuàng)新揭示出模型訓(xùn)練前期成本可能驟降的積極信號(hào),令該公司和應(yīng)用徹底出圈。之后,DeepSeekR1就一直在經(jīng)歷擁堵,它的聯(lián)網(wǎng)搜索功能間歇性癱瘓,深度思考模式則高頻率提示“服務(wù)器繁忙”,此類(lèi)現(xiàn)象讓大量用戶倍感困擾。

十幾日前,DeepSeek開(kāi)始經(jīng)歷服務(wù)器中斷,1月27日中午,DeepSeek官網(wǎng)已數(shù)次顯示“deepseek網(wǎng)頁(yè)/api不可用”,當(dāng)日,DeepSeek成為周末期間iPhone下載量最高的應(yīng)用程序,在美區(qū)下載榜超越了ChatGPT。

2月5日,DeepSeek移動(dòng)端上線26天,日活突破4000萬(wàn),ChatGPT移動(dòng)端日活為5495萬(wàn),DeepSeek為ChatGPT的74.3%。幾乎在DeepSeek走出陡峭增長(zhǎng)曲線的同時(shí),關(guān)于其服務(wù)器繁忙的吐槽紛至沓來(lái),全世界用戶都開(kāi)始遭遇問(wèn)幾個(gè)問(wèn)題就發(fā)生宕機(jī)的不便,各類(lèi)替代訪問(wèn)也開(kāi)始出現(xiàn),比如DeepSeek的平替網(wǎng)站,各大云服務(wù)商、芯片廠商和基礎(chǔ)設(shè)施公司都紛紛上線,個(gè)人部署教程也到處都是。但人們的抓狂卻沒(méi)有緩解:全球幾乎所有重要廠商都宣稱(chēng)支持部署了DeepSeek,但各地用戶卻依然在吐槽服務(wù)的不穩(wěn)定。

這背后到底發(fā)生了什么?1.習(xí)慣了ChatGPT的人們,受不了打不開(kāi)的DeepSeek

人們對(duì)“DeepSeek服務(wù)器繁忙”的不滿,來(lái)自于此前以ChatGPT為主的AI頂流應(yīng)用們,甚少出現(xiàn)卡頓。

自O(shè)penAI服務(wù)推出以來(lái),ChatGPT雖然也經(jīng)歷了幾次P0級(jí)別(最嚴(yán)重的事故級(jí)別)宕機(jī)事故,但總體來(lái)說(shuō),它相對(duì)可靠,已然在創(chuàng)新和穩(wěn)定性之間找到平衡,并逐步成為類(lèi)似傳統(tǒng)云服務(wù)的關(guān)鍵組成部分。

ChatGPT大范圍宕機(jī)次數(shù)并不算多

ChatGPT的推理過(guò)程相對(duì)穩(wěn)定,包括編碼和解碼兩個(gè)步驟,編碼階段把輸入文本轉(zhuǎn)換成向量,向量包含輸入文本的語(yǔ)義信息,解碼階段,ChatGPT使用先前生成的文本作為上下文,通過(guò)Transformer模型生成下一個(gè)單詞或短語(yǔ),直到生成符合需求的完整語(yǔ)句,大模型本身屬于Decoder(解碼器)架構(gòu),解碼階段就是一個(gè)個(gè)token(大模型處理文本時(shí)的最小單位)的輸出過(guò)程,每向ChatGPT提問(wèn)一次,就啟動(dòng)一次推理流程。

舉例來(lái)說(shuō),如果向ChatGPT提問(wèn),“你今天心情如何”,ChatGPT會(huì)對(duì)這句話進(jìn)行編碼,生成每層的注意力表示,根據(jù)之前所有token的注意力表示,預(yù)測(cè)得到第一個(gè)輸出token"我",之后進(jìn)行解碼,將“我”拼接到“你今天心情如何?”,后面得到“你今天心情如何?我”,得到新的注意力表示,然后預(yù)測(cè)下一個(gè)token:"的",之后按照第一步,第二步循環(huán),最終得到“你今天心情如何?我的心情很好!

編排容器的工具Kubernetes是ChatGPT的“幕后指揮官”,它負(fù)責(zé)調(diào)度和分配服務(wù)器資源。當(dāng)涌入的用戶承載完全超出Kubernetes控制平面的承受能力時(shí),就會(huì)導(dǎo)致ChatGPT系統(tǒng)的全面癱瘓。

ChatGPT發(fā)生癱瘓的總次數(shù)不算太多,但這背后是它依靠的強(qiáng)大資源作為支撐,維持穩(wěn)定運(yùn)轉(zhuǎn)背后是強(qiáng)大算力,而這是人們忽視的地方。

一般而言,由于推理處理的數(shù)據(jù)規(guī)模往往較小,因此對(duì)算力的要求不如訓(xùn)練般高。有業(yè)界人士估算指出,在正常大模型推理過(guò)程中,顯存的主要占用模型參數(shù)權(quán)重占大頭,大概占比在80%以上,F(xiàn)實(shí)情況是,在ChatGPT內(nèi)置的多個(gè)模型中,里面默認(rèn)模型尺寸都比DeepSeek-R1的671B要小,加上ChatGPT擁有比DeepSeek多得多的GPU算力,自然展現(xiàn)出比DS-R1更為穩(wěn)定的表現(xiàn)。

DeepSeek-V3與R1都是一個(gè)671B的模型,模型啟動(dòng)過(guò)程就是推理的過(guò)程,推理時(shí)的算力儲(chǔ)備需要與用戶量相襯,比如有1億用戶量就需配備1億用戶量的顯卡,不僅龐大,且與訓(xùn)練時(shí)的算力儲(chǔ)備獨(dú)立開(kāi)來(lái),并不相關(guān)。從各方信息看,DS的顯卡和算力儲(chǔ)備明顯不足,于是頻頻卡頓。

這種對(duì)比讓適應(yīng)了ChatGPT絲滑體驗(yàn)的用戶并不習(xí)慣,特別是他們對(duì)R1的興趣愈發(fā)高漲的當(dāng)下。2.卡,卡,還是卡

而且,仔細(xì)對(duì)比,OpenAI和DeepSeek遇到的情況是很不同的。

前者有微軟做后盾,作為OpenAI的獨(dú)家平臺(tái),微軟Azure云服務(wù)搭載了ChatGPT、Dalle-E2圖像生成器、GitHubCopilot自動(dòng)編碼工具,此后,這一組合成為了云+AI的經(jīng)典范式,并快速普及成為業(yè)界標(biāo)配;后者雖是初創(chuàng),卻大部分情況下依靠自建數(shù)據(jù)中心,與谷歌類(lèi)似,而不依賴第三方云計(jì)算提供商。硅星人查閱公開(kāi)信息后發(fā)現(xiàn),DeepSeek在任何層面都沒(méi)有跟云廠商芯片廠商開(kāi)啟合作(雖然春節(jié)期間云廠商紛紛宣布讓DeepSeek模型跑在其上,但他們并沒(méi)有開(kāi)展任何真正意義的合作)。

而且,DeepSeek遇到了史無(wú)前例的用戶增長(zhǎng),這意味著它對(duì)應(yīng)激情況的準(zhǔn)備時(shí)間也比ChatGPT更少。

DeepSeek的良好性能來(lái)自其在硬件和系統(tǒng)層面做出的整體優(yōu)化。DeepSeek的母公司幻方量化,早在2019年就花了2億打造螢火一號(hào)超算集群,到22年就默默存儲(chǔ)萬(wàn)張A100顯卡,為了更高效的并行訓(xùn)練,DeepSeek自研了HAILLM訓(xùn)練框架。業(yè)界認(rèn)為,螢火集群可能采用了數(shù)千至數(shù)萬(wàn)張高性能GPU(如英偉達(dá)A100/H100或國(guó)產(chǎn)芯片),以提供強(qiáng)大的并行計(jì)算能力。目前螢火集群支撐了DeepSeek-R1、DeepSeek-MoE等模型訓(xùn)練,這些模型在數(shù)學(xué)、代碼等復(fù)雜任務(wù)中表現(xiàn)接近于GPT-4水平。

螢火集群代表著DeepSeek在全新架構(gòu)和方法上的探索歷程,也讓外界認(rèn)為,通過(guò)這類(lèi)創(chuàng)新技術(shù),DS降低了訓(xùn)練的成本,可以僅需西方最先進(jìn)模型幾分之一的算力,就訓(xùn)練出與頂級(jí)AI模型性能相當(dāng)?shù)腞1。SemiAnalysis經(jīng)推算指出,DeepSeek實(shí)際擁有龐大的算力儲(chǔ)備:DeepSeek共堆砌了6萬(wàn)張英偉達(dá)GPU卡,其中包括1萬(wàn)張A100、1萬(wàn)張H100、1萬(wàn)張“特供版”H800以及3萬(wàn)張“特供版”H20。

這似乎意味著R1的卡量比較充足。但實(shí)際上,作為推理模型的R1,對(duì)標(biāo)的是OpenAI的O3,這類(lèi)推理模型需要部署更多算力用于應(yīng)答環(huán)節(jié),但DS在訓(xùn)練成本側(cè)節(jié)約的算力,與推理成本側(cè)驟增的算力,孰高孰低,目前并不明確。

值得一提的是,DeepSeek-V3和DeepSeek-R1都是大語(yǔ)言模型,但運(yùn)作方式有差。DeepSeek-V3是指令模型,類(lèi)似ChatGPT,接收提示詞生成相應(yīng)文本進(jìn)行回復(fù)。但DeepSeek-R1是推理模型,用戶向R1提問(wèn)時(shí),它會(huì)首先進(jìn)行大量的推理過(guò)程,然后再生成最終答案。R1生成的token中首先出現(xiàn)的是大量的思維鏈過(guò)程,模型在生成答案之前,會(huì)先解釋問(wèn)題,分解問(wèn)題,所有這些推理過(guò)程都會(huì)以token的形式快速生成。

在耀途資本副總裁溫廷燦看來(lái),前述DeepSeek龐大的算力儲(chǔ)備是指訓(xùn)練階段,訓(xùn)練階段算力團(tuán)隊(duì)可規(guī)劃,可預(yù)期,不容易出現(xiàn)算力不足,但推理算力則不確定性較大,因?yàn)橹饕Q于用戶規(guī)模和使用量,相對(duì)來(lái)說(shuō)彈性較大,“推理算力會(huì)按照一定規(guī)律增長(zhǎng),但隨著DeepSeek成為現(xiàn)象級(jí)產(chǎn)品,短時(shí)間內(nèi)用戶規(guī)模和使用量爆炸性增長(zhǎng),這導(dǎo)致推理階段算力需求爆炸性增長(zhǎng),所以出現(xiàn)卡頓!

即刻上活躍的模型產(chǎn)品設(shè)計(jì)師,獨(dú)立開(kāi)發(fā)者歸藏認(rèn)同卡量是DeepSeek卡頓的主因,他認(rèn)為DS作為當(dāng)前在全球140個(gè)市場(chǎng)下載量最高的移動(dòng)應(yīng)用,現(xiàn)在的卡無(wú)論如何都撐不住,哪怕用新的卡也不行,因?yàn)椤靶碌目ㄗ鲈剖切枰獣r(shí)間”。

“英偉達(dá)A100、H100等芯片運(yùn)行一個(gè)小時(shí)的成本有公允的市場(chǎng)價(jià)格,DeepSeek從輸出token的推理成本上看是比OpenAI同類(lèi)模型o1便宜90%以上,這個(gè)跟大家的計(jì)算偏差不大,因此模型架構(gòu)MOE本身不是最主要問(wèn)題,但DS擁有的GPU數(shù)量決定了他們每分鐘最多可以生產(chǎn)提供的token數(shù),即便可以把更多GPU用來(lái)做推理服務(wù)用戶,而不用于預(yù)訓(xùn)練研究,但上限在那擺著!盇I原生應(yīng)用小貓補(bǔ)光燈的開(kāi)發(fā)者陳云飛持類(lèi)似觀點(diǎn)。

也有業(yè)界人士向硅星人提到,DeepSeek卡頓本質(zhì)在于私有云沒(méi)有做好。

黑客攻擊則是R1卡頓另一驅(qū)動(dòng)因素。1月30日,媒體從網(wǎng)絡(luò)安全公司奇安信獲悉,針對(duì)DeepSeek線上服務(wù)的攻擊烈度突然升級(jí),其攻擊指令較1月28日暴增上百倍。奇安信Xlab實(shí)驗(yàn)室觀察到至少有2個(gè)僵尸網(wǎng)絡(luò)參與攻擊。

但這種R1自身服務(wù)的卡頓,有一個(gè)看起來(lái)比較顯然的解決方案,是第三方提供服務(wù)。這也是我們?cè)诖汗?jié)期間目睹的最為熱鬧的景觀——各家廠商紛紛部署服務(wù),承接人們對(duì)DeepSeek的需求。

1月31日,英偉達(dá)宣布,NVIDIANIM已經(jīng)可以使用DeepSeek-R1,此前英偉達(dá)受DeepSeek影響,一夜市值蒸發(fā)近6000億美元。同天,亞馬遜云AWS的用戶可以在其人工智能平臺(tái),AmazonBedrock和AmazonSageMakerAI中部署DeepSeek最新R1基礎(chǔ)模型。隨后,包括Perplexity,Cursor在內(nèi)的AI應(yīng)用新貴,也批量接入DeepSeek。微軟則搶在亞馬遜、英偉達(dá)之前,率先把DeepSeek-R1部署在了云服務(wù)Azure和Github上。

2月1日大年初四開(kāi)始,華為云,阿里云,字節(jié)跳動(dòng)旗下的火山引擎和騰訊云也加入其間,他們一般提供的是DeepSeek全系、全尺寸模型部署服務(wù)。再之后是壁仞科技、瀚博半導(dǎo)體、昇騰、沐曦等AI芯片廠商,他們自稱(chēng)適配了DeepSeek原版或更小尺寸的蒸餾版本。軟件公司方面,用友、金蝶等是在部分產(chǎn)品中接入DeepSeek模型,增強(qiáng)產(chǎn)品力,最后是終端廠商如聯(lián)想、華為、榮耀旗下部分產(chǎn)品接入DeepSeek模型,用作端側(cè)個(gè)人助手和汽車(chē)智能座艙。

迄今,DeepSeek依靠自身價(jià)值吸引來(lái)了全面龐大的朋友圈,囊括海內(nèi)外云廠商、運(yùn)營(yíng)商、券商和國(guó)家級(jí)平臺(tái)國(guó)家超算互聯(lián)網(wǎng)平臺(tái)。由于DeepSeek-R1是完全開(kāi)源的模型,接入的服務(wù)商都成為了DS模型的受益方。這一方面極大抬高了DS的聲量,也同時(shí)造成了更為頻繁的卡頓現(xiàn)象,服務(wù)商和DS自身越來(lái)越受困于蜂擁而至的用戶,竟都沒(méi)有找到解決穩(wěn)定使用問(wèn)題之關(guān)鍵竅門(mén)。

考慮到DeepSeekV3與R1兩個(gè)模型原版都高達(dá)6710億參數(shù),適合跑在云上,云廠商本身具備更充足的算力和推理能力,他們上線DeepSeek相關(guān)部署服務(wù)是為降低企業(yè)使用的門(mén)檻,其部署DeepSeek模型后對(duì)外提供DS模型的API,相比DS自己提供是的API,本被認(rèn)為是可以提供比DS官方更好的使用體驗(yàn)。

但現(xiàn)實(shí)中,DeepSeek-R1模型自身運(yùn)行的體驗(yàn)問(wèn)題,在各家服務(wù)中都沒(méi)有得到解決,外界認(rèn)為服務(wù)商們并不缺卡,但實(shí)際上他們部署的R1,開(kāi)發(fā)者們對(duì)反應(yīng)體驗(yàn)不穩(wěn)定的反饋,頻度完全與R1相當(dāng),這更多在于能分配給R1進(jìn)行推理的卡量也并不太多。

“R1熱度保持在高位,服務(wù)商需要兼顧接入的其他模型,能提供給R1的卡很有限,R1的熱度又高,誰(shuí)家一上R1,又以相對(duì)較低的價(jià)格提供,就會(huì)被沖垮!蹦P彤a(chǎn)品設(shè)計(jì)師,獨(dú)立開(kāi)發(fā)者歸藏對(duì)硅星人解釋了原因。

模型部署優(yōu)化是一個(gè)涵蓋眾多環(huán)節(jié)的寬泛領(lǐng)域,從訓(xùn)練完成到實(shí)際硬件部署,涉及多層面工作,但對(duì)于DeepSeek的卡頓事件來(lái)說(shuō),原因可能更為簡(jiǎn)單,比如太大的模型和上線之前的優(yōu)化準(zhǔn)備不足。

一個(gè)熱門(mén)大模型上線之前,會(huì)遇到涉及技術(shù)、工程、業(yè)務(wù)等多方挑戰(zhàn),比如訓(xùn)練數(shù)據(jù)與生產(chǎn)環(huán)境數(shù)據(jù)的一致性,數(shù)據(jù)延遲與實(shí)時(shí)性影響模型推理效果,線上推理效率和資源占用過(guò)高,模型泛化能力不足,以及工程方面像服務(wù)穩(wěn)定性、API與系統(tǒng)集成等方面。

很多當(dāng)紅大模型上線之前都高度重視做好推理優(yōu)化,這是因?yàn)橛?jì)算耗時(shí)和內(nèi)存問(wèn)題,前者是指推理時(shí)延太長(zhǎng),造成用戶體驗(yàn)差,甚至不能滿足延遲需求,也就是卡頓等現(xiàn)象,后者是指模型參數(shù)量多,耗費(fèi)顯存,甚至單張GPU卡放不下,也會(huì)導(dǎo)致卡頓。

溫廷燦對(duì)硅星人解釋了原因,他稱(chēng)服務(wù)商提供提R1服務(wù)遇到挑戰(zhàn),本質(zhì)是DS模型結(jié)構(gòu)特殊,模型太大+MOE(專(zhuān)家混合結(jié)構(gòu),一種高效計(jì)算的方式)架構(gòu),“(服務(wù)商)優(yōu)化需要時(shí)間,但是市場(chǎng)熱度是有時(shí)間窗口的,所以都是先上再優(yōu)化,而不是充分優(yōu)化后上線!

R1要想穩(wěn)定運(yùn)行,如今核心在于推理側(cè)的儲(chǔ)備和優(yōu)化之能力。DeepSeek需要做的是,找到方式把推理的成本降下來(lái),把卡的輸出,單次輸出token的數(shù)量降下來(lái)。

與此同時(shí),卡頓也說(shuō)明DS本身的算力儲(chǔ)備很可能也沒(méi)有SemiAnalysis所述龐大,幻方基金公司要用卡,DeepSeek訓(xùn)練團(tuán)隊(duì)也要用卡,能排出來(lái)給用戶的卡一直不多。按照目前發(fā)展情形看,短期內(nèi)DeepSeek未必有動(dòng)力花錢(qián)租服務(wù),繼而免費(fèi)提供給用戶更好的體驗(yàn),他們更可能等到第一波C端商業(yè)模式梳理清晰之后,再考慮服務(wù)租賃的議題,這也意味著,卡頓還會(huì)持續(xù)不短的時(shí)間。

“他們大概需要兩步動(dòng)作:1)做付費(fèi)機(jī)制,限制免費(fèi)用戶模型用量;2)找云服務(wù)廠商合作,用上別人的GPU資源!遍_(kāi)發(fā)者陳云飛給出的臨時(shí)解法在業(yè)界頗有共識(shí)。

但目前來(lái)看,DeepSeek對(duì)自己這個(gè)“服務(wù)器繁忙”問(wèn)題顯得并不太著急。做為一家追逐AGI的公司,DeepSeek似乎不愿太著眼于這蜂擁而來(lái)的用戶流量?赡苡脩魝?cè)谖磥?lái)不短時(shí)間里還是要習(xí)慣面對(duì)“服務(wù)器繁忙”的界面了。

Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM

天堂资源在线字幕| 国产精品一区二区久久夜夜嗨| 亚洲中字幕新| 国产日韩免费AV| 日韩精品人妻一区二区无码视频| 久久国产自啪| 97国产精品一区二区三区| 亚洲激情成人网站| 欧美一区二区线视频| 国产涩涩涩涩| 久久国产精品一区二区三区香蕉 | 日韩欧美熟妇一中文| 欧美日韩国产不卡一二区| 丁香五月成人在线| 开心五月综合精品| 人人妻婷婷| 自拍偷自拍图片亚洲精品| 美女禁片免费观看| 久久久老司机精品| 岛国AV无码免费无禁网站麦芽| 少妇视频在线观看不卡| 一本不卡亚洲| 五月综合久久| 亚洲精品无码久久久久yw| 精品久久97| 天天操天天透人人透| 婷婷六月综合色| 亚洲最大av网站每日更新| 欧美国产性A| 亚洲国产中出无码| 狠狠色 综合色区| 天天爽夜夜爽人人爽免费| 亚洲无遮挡免费视屏| 波多野结衣人妻| 亚洲另类一二三区| 无码人妻精一区二区三区| 婷婷激情久久精品五月天| 欧美一区区| 欧美色色综合| 亚洲日韩熟女精品小说| 欧美有一道有码免费|