DEEPSEEK: DESTPKA DERBASEKEKEKEKEKE AI XWED

Koma Aipu Waton

Pêşkêş

Xemgîniya domdar di nav pêşbaziya modelên mezin de, peydakirên cloud pêşbaziyê ji bo parvekirina bazarê, û hilberînerên çîmentoyê yên dijwar - bandorên kûr ên kûr berdewam dike.

Her ku festîvala biharê nêzîk dibe, heyecanê derdora kûr bi hêz bimîne. Betlaneya vê dawiyê hestek girîng a pêşbaziyê di hundurê pîşesaziya Tech de, bi gelek nîqaş û analîzkirina vê "pisîk" re ronî kir. Valley Silicon bi têgihîştina krîzê ya bêpergal e: parêzvanên çavkaniyên vekirî dîsa li ser nerînên xwe disekinin, û tewra venebûnê ji nû ve vedihewîne ka stratejiya wê ya çavkaniya wê bijare ye. Paradîgmaya nû ya lêçûnên computasyonê yên jêrîn di nav çîpên çîpek mîna NVIDIA-yê de, di dîroka bazara sûkê ya Single-Rojê de tomar kiriye, dema ku saziyên hukûmetê li gorî çîpên ku ji hêla Deepseek ve hatine bikar anîn lêpirsîn dikin. Di nav nêrînên hevbeş ên kûr ên kûr ên li ser derûdor, domdarî, ew bi mezinbûna awarte re rû bi rû ye. Piştî destpêkirina modela R1, serîlêdana têkildar di trafîkê de hebek dîtiye, ku nîşan dide ku mezinbûnê di sektorên serlêdanê de bi serweriya serlêdanê ya AI-ya pêşîn ajot. Hêjeya erênî ev e ku dê DEEPSEEK dê gengaziyên serlêdanê berfireh bike, pêşniyar dike ku di pêşerojê de li ser chatgpt be. Ev guherîn di çalakiyên vê dawiyê yên Openai de hatî xuyang kirin, di nav de modela sedemek bi navê O3-Mini ji bo bersivdayîna bikarhêneran, û her weha nûvekirinên paşîn ên ku zincîra ramanê O3-Mini jî çêkiriye azad kirin. Piraniya bikarhênerên derveyî ji bo van geşedanan spasiya kûr eşkere kirin, her çend ev fikir wek kurteyek jî xizmet dike.

Bi xweşbîn, diyar e ku Deepseek lîstikvanên navxweyî yek dike. Bi baldariya xwe li ser kêmkirina lêçûnên perwerdehiyê, pêşkêşkerên çîmentoyê yên berbiçav, peydakirina cloudê ya navîn, û gelek destpêkirina bi awayekî çalak tevlî ekosîstan dibin, ji bo karanîna modela deepseek bandorker in. Li gorî kaxezên kûr, perwerdehiya bêkêmasî ya modela V3 hewce dike ku tenê demjimêrên tenê 2.788 mîlyon H800 GPU hewce dike, û pêvajoya perwerdehiyê pir aram e. MOE (tevliheviya pisporan) mîmariya ji bo kêmkirina lêçûnên pêş-perwerdehiyê ji hêla faktorek deh re li gorî LLAMA 3 bi 405 mîlyar parameters. Niha, V3 yekem modela naskirî ya gelemperî ye ku di moe de bîhnxweşiya wusa bilind nîşan dide. Wekî din, MLA (Hişmendiya Multi Layer) bi taybetî, nemaze di aliyên sedem de dixebite. "Sparster MOE, Mezinahiya Batchê ya mezintir di dema sedemên ku bi tevahî KVCACHE tê bikar anîn de ye; Bi tevahî, Serkeftina Deepseek di kombînasyona teknolojiyên cûda de, ne tenê yek yek. Industry Insiders Kapasîteyên Endezyariya Tîmê Deepseek pesnê xwe didin, ji bo ku hûn bi tevahî hûrgulî encamên danûstendinê bigihîjin hevsengiya xwe Rêwîtiya çavkaniya kûr a Deepseek pêşkeftina gelemperî ya modelên mezin çêdike, û tê pêşbînîkirin ku heke modelên mîna wêneyan, vîdyoyan, vîdyoyan berfireh bikin, ev dê bi girîngî li ser pîşesaziyê bilez bike.

Derfetên ji bo karûbarên sedemên sêyemîn

Daneyên ku ji ber ku serbestberdana wê, di nava 21 rojan de ji nû ve bikarhênerên çalak ên rojane, bi tevahî bikarhênerên çalak ên rojane 22.15 mîlyon bikarhênerên çalak ên danûstendinê hatine girtin, bi vî rengî diçe serîlêdana zûtirîn, li 157 welatan di 157 welatan de. Lêbelê, dema ku bikarhêneran di navbirî de ketin, hackerên cyber bi neheqî êrîşî serîlêdana kûr in, dibe sedema tengaviyên girîng li ser serverên xwe. Analystên pîşesaziyê bawer dikin ku ev bi beşek ji ber kartên damezrandina kûr ji bo perwerdehiyê dema ku nebûna hêza computasyonê ya bes ji bo sedemê ye. In pîşesaziyek insider ai teknolojiya AI Teknolojî agahdar kir, "Pirsgirêkên dubare dikarin bi hêsanî ji bo kirrûbirra kirrûbirra makîneyan werin çareser kirin; di dawiyê de, ew bi biryarên kûr ve girêdayî ye." Ev di balê balê dikişîne ser teknolojiya li hember hilberînê. Deepseeek bi piranî ji bo xwe-domdariyê bi piranî ve girêdayî ye, ku fînansek piçûk a derveyî wergirtiye, di encamê de zexta tîrêjê ya dravî ya kêm û hawîrdora teknolojîk a paqij. Heya niha, di ronahiya pirsgirêkên jorîn de, hin bikarhêneran li ser medyaya civakî biparêzin ku li ser medyaya civakî bilind bikin an taybetmendiyên dravî danasîn da ku rehetiya bikarhêner zêde bikin. Wekî din, pêşdebiran dest pê kirine dest bi karanîna api an api api an sêyemîn ji bo xweşbîniyê kirin. Lêbelê, platforma vekirî ya Deepseek herî dawî ragihand, "Resourcesavkaniyên serverê yên heyî kêm in, û Reqayên Servîsa API-yê hatine sekinandin."

 

Ev bê guman ji bo vendorên partiya sêyemîn di sektora binesaziya AI de bêtir derfetan vedike. Di van demên dawî de, hejmarên navxweyî yên navxweyî û navneteweyî Modelê apis-apseek li ser Giants-ê li derveyî Microsoft û Amazon di nav yekemîn de bûn ku beşdarî dawiya Januaryile bûn. Rêberê navxweyî, ewrên Huawei, tevgera yekem çêkiriye, bi hevkariya Sedemiyê ya AI-ê re di 1-ê Sibatê de ragihand. Pargîdaniyên mezin ên sê teknîkî (Baidu, Alibaba, Tencent) û Bytedance - Limition-ê Daxuyaniyên Sibatê yên Vendê Dike Kiryarên qirêj ên vendorên cloudê di navbera Microsoft azure û OpenAi de, li wir, piştî destpêkirina chatgpt-ê, li derûdora Microsoft-ê li derveyî ekosîstema Microsoft. Di vê mînakê de, DEEPSEEK tenê di derheqê germê hilberê de derbas nebûye lê di heman demê de modelên çavkaniya vekirî li dû serbestberdana O1 jî, mîna serbestberdana li derdorê Llama 3-ê ye.

 

Di rastiyê de, pêşkêşvanên cloudê jî wekî deriyên trafîkê ji bo serlêdanên AI di cih de ne, tê vê wateyê ku têkiliyên kûr bi pêşdebiran wergerîne. Rapor destnîşan dikin ku ewraya Baidu Smart li ser 15,000 xerîdaran hebû ku Modela Deepseek bi riya platforma Qianfan li ser roja destpêkirina modela bikar bînin. Wekî din, çend pargîdaniyên piçûktir çareseriyê pêşkêş dikin, di nav de herikîna Sekicon-basch, teknolojiya Chuchen, Teknolojiya Chuchen, û pêşkêşkerên cihêreng ên Ai infra ku ji bo modelên Deepseek dest pê kiriye. Nirxandina Teknolojiyê ya AI fêr bûye ku derfetên xweşbîn ên DEECHSEEKê di du deveran de heye. Wekî din, xweşbîniya MLA girîng e. Lêbelê, du Modelên Deepseek hîn jî di Optimîzasyona Damezrandinê de li hin pirsgirêkan rû didin. "Ji ber mezinahiya modela û gelek parameter, xweşbîniyê bi rastî tevlihev e, nemaze ji bo cîbicîkirina herêmî, Hêlîna herî girîng di nav sînorên kapasîteya bîranînê de ye. "Em nêzîkatiyek hevkariyê ya heterogjen e ku bi tevahî bikar bînin û çavkaniyên din ên hevbeş ên li ser CPU / Dram bikar bînin, dema ku parçeyên dendik li GPU dimînin," wî bêtir diyar kir. Rapor destnîşan dike ku çarçoweya çavkaniya Chuanjing di serî de stratejiyên cihêreng û operatorên cihêreng di nav veguherînên veguherîner ên xwerû de vedihewîne, bi karanîna rêbazên enfeksiyonê bi karanîna rêbazên mîna cudagraph. Deepseeek ji bo van destpêkirinê derfet çêkiriye, wekî ku feydeyên mezinbûnê eşkere dibin; many firms have reported noticeable customer growth after launching the DeepSeek API, receiving inquiries from previous clients looking for optimizations. Insiders Insiders destnîşan kir, "Di demên borî de, hinekî komên damezrandî yên pargîdaniyên mezin ên ji bo pîvana biharê, û heya niha jî ji bo danasîna karûbarên biharê yên ku ji bo danasîna karûbarên me yên kûr hatine girtin. Niha, ew xuya dike ku DEEPSEEK performansa binpêkirina modêlê her ku diçe mezintir dike û bi pejirandina berfireh a modelên mezin, ev dê bandor li pêşkeftina di pîşesaziya AI ya infra girîng de berdewam bike. Ger modela kûr-astek dikare li herêmek kêm were damezrandin, ew ê ji hewildanên veguherîna dîjîtal a dîjîtal re eleqedar bibe. Lêbelê, pirsgirêkan didomîne, dibe ku hin xerîdar di derheqê kapasîteyên mezin ên mezin de hêviyên mezin bigirin, ew eşkere bikin ku performansa balansê û lêçûnê di karbidestiya pratîkî de girîng dibe. 

Ji bo binirxînin ka Deepseek ji Chatgpt çêtir e, pêdivî ye ku ji cûdahiyên xwe, hêz, û dozan bikar bînin. Li vir berhevokek berbiçav e:

Taybetmendî / aliyek Deepseek ChatGPT
Hebûnî Ji hêla pargîdaniyek çînî ve hatî pêşve xistin Ji hêla Openai ve hatî pêşve xistin
Modela çavkaniyê Çavkaniya vekirî Xwedî
Nirx Bikaranîna belaş; Vebijarkên gihîştina api erzantir Buhayê an bihayê karanîna dravî
Gazîtî Pir xweşbînî, destûr dide ku bikarhêneran tweak bikin û li ser wê ava bikin Xirabkirina tixûbdar heye
Performansa di karên taybetî de Excel li hin deverên mîna danasîna daneyên analît û agahdariyê Bi tevahî bi performansa xurt di nivîsandina afirîner û peywirên danûstendinê de
Piştgiriya ziman Balê xurt li ser ziman û çanda Chineseînî Piştgiriya zimanê fireh lê ji me-navend
Mesrefa perwerdehiyê Mesrefên perwerdehiya kêmtir, ji bo karîgeriyê xweşbîn kirin Mesrefên perwerdehiya bilindtir, hewceyê çavkaniyên computasyonê yên berbiçav
Guhertina bersivan Dibe ku bersivên cûda pêşkêş bike, dibe ku ji hêla jeopolitical ve bandor kirin Bersivên domdar ên li ser daneyên perwerdehiyê
Temaşevanên armanc Mebest li pêşdebir û lêkolîneran ku dilxweşiyê dixwazin Armanca bikarhênerên giştî li kapasîteyên danûstandinê digerin
Dozan bikar bînin Ji bo nifşên koda û karên bileztir Îdeal ji bo çêkirina nivîsê, bersivên bersivan, û di diyalogê de mijûl dibin

Perspektîfek krîtîk li ser "astengkirina NVIDIA"

Heya niha, ji bilî Huawei, çend hilberînerên çîmentoyê yên navmalîn ên mîna mijarên Moore, Muxi, Biran Teknolojî, û zhixin Tianxu jî li du modelên Deepseek jî adapteyî ne. Hilberînerek çîpek ji Ai Technology Review re got: "Struktura Deepseek nûbûnek nû dike, lê belê ew llm dimîne. Lêbelê, nêzîkatiya MOE-ê di warê hilanînê û belavkirinê de daxwazên bilind hewce dike, bi pêbaweriya lihevhatinê dema ku di dema adaptasyonê de hewceyê çareseriyê ye. "Naha, hêza computasyonê ya navxweyî di nav karanîna û aramî de nabe, ku beşdariya kargeha orjînal ji bo sazkirina jîngehê ya nermalavê, pirsgirêkek pîşesaziyê, li ser bingehê ezmûna pratîkî got. Bi hevdemî, "Ji ber pîvana mezin a parameter R1, hêza komputasyonê ya navxweyî ji bo paraleleliyê pêdivî ye. Wekî din, huweperi 910b niha nikare piştgiriyê bide FP8-ê ya ku ji kûr ve girêdayî ye." Yek ji roniyên V3 Modela V3 danasîna çarçoweya perwerdehiya rastîn a FP8-ê ye, ku bi bandorek bi rengek zehf mezin ve hatî pejirandin, nîşana destkeftiyek girîng e. Berê, lîstikvanên mezin ên mîna Microsoft û Nvidia xebata têkildar pêşniyar dikin, lê guman di nav pîşesaziyê de di derheqê fezayê de dimîne. Tête famkirin ku li gorî berjewendiya seretayî ya Int8, FP8-ê ye ku hejmartina post-perwerdehiyê ye ku di gava ku bi girîngî bileziya enfeksiyonê bi girseyî de bigihîje hema hema winda dibe. Dema ku li gorî FP16-ê berhev bikin, FP8 dikare li ser H100-ê di H100-ê de du caran bilezkirina H20 û zêdetirî 20 caran bileztir bike. Nemaze, wekî nîqaşên li derdora hêzê ya navmalî Yek rastiyek bêserûber ev e ku bi rastî di nirxa bazara NVidia de daketiye, lê ev guhartin di derbarê yekrêziya hêza hêza komputasyona bilind a NVIDIA de pirsan zêde dike. Di derheqê berhevkirina komîteyên kompleksê de têne pejirandin, lê dîsa jî ji bo NVIDIA-yê dijwar dimîne ku di senaryoyên perwerdehiyê de bi tevahî were guhertin. Analîzkirina karanîna kûr a Cuda nîşan dide - yên ku ji bo danûstendinê an rasterast kartên torê têne bikar anîn - ji bo cîbicîkirina gpusê ya birêkûpêk ne pêkan e. Nîgarên Pîşesaziyê tekez dikin ku Mîna Nvidia tevahiya Ecosystemê Cuda ne tenê ji hêla xwe ve, û ptx (darvekirina paralelî) ya rêwerzan ku employên kûr ên Ecosystemê Cuda ne. "Di kurteya kurt de, hêza komputasyona Nvidia nikare bi taybetî di perwerdehiyê de bi rengek hêsantir be. Nirxandina Teknolojiyê. Bi tevahî, ji helwestek enfeksiyonê, merc ji bo çîpên modêlên mezin ên navmalîn teşwîq dikin. Derfetên ji bo hilberînerên navborî yên navxweyî yên di nav rastiya enfeksiyonê de ji ber hewcedariyên pir zêde yên perwerdehiyê, yên ku têketinê asteng dikin eşkere ye. Analîstên ku bi hêsanî kartên enfeksiyonên navxweyî digirin têr dike; Heke hewce be, makîneyek din jî gengaz e, di heman demê de modelên perwerdehiyê ji bo birêvebirina hejmareke zêde ya makîneyan dibe ku bibe barê giran, û rêjeyên çewtiyên bilindtir dikarin encamên perwerdehiyê bandor bikin. Trainings di heman demê de daxwazên pîvanê yên taybetî jî hene, dema ku daxwazên li ser komên ji bo enfeksiyonê ne hişk in, bi vî rengî hewcedariyên GPU hêsantir dikin. Heya niha, performansa karta H20 ya NVIDIA-ê ji Huawei an Cambrian derbas nabe; Hêza wê di kulikê de ye. Li ser bingeha bandora tevahî ya li ser bazara hêzê ya computasyonê, hûn yang, di nav hevpeyivînan de, bi giranî dikarin bi navgîniya danûstendinê û serlêdanan re têkildar bikin, daxwaziya bazarê bi zorê tê. Li ser vê yekê dê bi berdewamî daxwazek domdar di bazara hêza komployê de ajot. " Wekî din, daxwaza bilind a sedem û karûbarên tunekirinê bi perestgeha komputerê ya navxweyî re eleqedar e, ku ji bo çêkirina mitîngê ji bo hilberîneran ji bo hilberîneran li ser astên cuda yên ekolojîk ên computasyonê yên navxweyî diafirîne. " Teknolojiya Luchen bi Cloud Huawei re hevkarî kir da ku li ser bingeha hêzên Komputasyonê yên Navxweyî yên ku li ser bingeha karûbarên navxweyî yên ku li ser bingeha APIS û Cloud-ê hatine destnîşan kirin, ji wan re sedemên DEEDSEEK R1 bi hevkarî kir. You Yang Optimîzmê di derbarê pêşerojê de diyar kir: "Baweriya kûr bi çareseriyên di navbêna malê de, teşwîqkirin û veberhênana mezintir di kapasîteyên komploya navxweyî de diçin."

微信图片 _20240614024031.jpg1

Xelasî

Ka kûrtir "çêtir e" ji chatgpt ve girêdayî hewcedariyên taybetî û armancên bikarhênerê ve girêdayî ye. Ji bo peywirên ku hewceyê fleksibility, lêçûnek kêm, û adetbûnê, dibe ku kûrtir be. Ji bo nivîsandina afirîner, lêpirsîna giştî, û navbeynkarên danûstendinê yên heval-bikarhêner, chatgpt dibe ku pêşeng bavêje. Her alav ji armancên cihêreng re xizmet dike, ji ber vê yekê dê bijarte dê bi qasî ku tê bikar anîn bi tevahî ve girêdayî ye.

Çareseriya kabloya elv bibînin

Kabloyên kontrolê

Ji bo bms, otobus, pîşesazî, kabloya instrumentation.

Pergala kabloyê ya strukturandî

Torgil û Data, kabloya fiber-optîk, korda patch, modul, rû

2024 Pêşangeh û Bûyer

Avrêl - 18-ê 18-an, 2024 Rojhilata Navîn-Enerjî li Dubai

Avrêl - 18-ê 18-an, 2024 securika li Moskowê

Gulan.9, 2024 Hilberên nû & Teknolojî di Shanghai de bûyerê dest pê dike

Oct.22nd-25th, 2024 Ewlekariya Chinaînê li Pekînê

Nov.19-20, 2024 Cîhan Connect KSA


Demjimêra paşîn: Feb-10-2025