Pêşkêş

Ma hûn difikirin ku Grok3 dê "xala dawî" ya modelên pêş-perwerdekirî be?

Elon Musk û tîma xAI bi fermî guhertoya herî dawî ya Grok, Grok3, di weşana zindî de dest pê kirin. Berî vê bûyerê, gelek agahiyên têkildar, digel reklamên Musk ên 24/7, hêviyên gerdûnî ji bo Grok3 gihandin astên bêhempa. Tenê hefteyek berê, Musk di weşana zindî de dema ku li ser DeepSeek R1 şîrove dikir, bi bawerî got, "xAI li ber destpêkirina modelek AI ya çêtir e." Ji daneyên ku bi zindî hatine pêşkêş kirin, tê ragihandin ku Grok3 di pîvanên matematîk, zanist û bernamesaziyê de ji hemî modelên sereke yên heyî derbas bûye, Musk heta îdîa kir ku Grok3 dê ji bo karên hesabkirinê yên bi mîsyonên Marsê yên SpaceX ve girêdayî were bikar anîn, û pêşbînî kir ku "di nav sê salan de pêşketinên di asta Xelata Nobelê de" çêbibin. Lêbelê, ev niha tenê îdîayên Musk in. Piştî destpêkirinê, min guhertoya beta ya herî dawî ya Grok3 ceriband û pirsa hîleya klasîk ji bo modelên mezin pirsî: "Kîjan mezintir e, 9.11 an 9.9?" Mixabin, bêyî tu şert an nîşanan, Grok3 ya ku jê re herî jîr tê gotin hîn jî nekarî vê pirsê bi awayekî rast bibersivîne. Grok3 nekarî wateya pirsê bi awayekî rast destnîşan bike.

Ev ceribandin zû bala gelek hevalan kişand, û bi tesadufî, gelek ceribandinên wekhev ên li derveyî welêt nîşan dan ku Grok3 bi pirsên bingehîn ên fîzîk/matematîkê yên wekî "Kîjan top pêşî ji Birca Pîzayê dikeve?" têdikoşe, ji ber vê yekê, ew bi henekî wekî "zanayek ku naxwaze bersiva pirsên hêsan bide" hatiye binavkirin.

Grok3 baş e, lê ji R1 an o1-Pro ne çêtir e.

Grok3 di pratîkê de di gelek testên zanîna hevpar de rastî "têkçûnan" hat. Di dema çalakiya destpêkirina xAI de, Musk nîşan da ku Grok3 bikar tîne da ku çînên karakteran û bandorên ji lîstika Path of Exile 2 analîz bike, ku wî îdia dikir ku ew pir caran dilîze, lê piraniya bersivên ku ji hêla Grok3 ve hatine dayîn xelet bûn. Musk di dema weşana zindî de vê pirsgirêka eşkere ferq nekir.

Ev şaşî ne tenê delîlên din ji bo bikarhênerên înternetê yên derveyî welat peyda kir da ku Musk ji ber "dîtina cîgirek" di lîstikan de tinazên xwe pê bikin, lê di heman demê de fikarên girîng der barê pêbaweriya Grok3 di sepanên pratîkî de jî derxist holê. Ji bo "dehayek" wisa, bêyî ku şiyanên wê yên rastîn çi bin, pêbaweriya wê di senaryoyên sepanên pir tevlihev de, wekî erkên keşfa Marsê, hîn jî di gumanê de ye.

Niha, gelek ceribandêrên ku hefte berê gihîştina Grok3 bi dest xistin, û yên ku duh çend demjimêran şiyanên modelê ceribandin, hemî digihîjin encamek hevpar: "Grok3 baş e, lê ji R1 an o1-Pro ne çêtir e."

Perspektîfek Rexnegir li ser "Têkbirina Nvidia"

Di PPT-ya fermî ya di dema berdanê de hate nîşandan, Grok3 di Chatbot Arena de wekî "pir li pêş" hate nîşandan, lê ev teknîkên grafîkî bi jîrî bikar anîn: eksena vertîkal a li ser tabloya rêzbendiyê tenê encamên di navbera 1400-1300 de navnîş kir, ku cûdahiya orîjînal a 1% di encamên testê de di vê pêşkêşiyê de bi awayekî awarte girîng xuya dike.

Di encamên nirxandina modela rastîn de, Grok3 tenê %1-2 li pêş DeepSeek R1 û GPT-4.0 ye, ku ev yek bi ezmûnên gelek bikarhêneran di ceribandinên pratîkî de re têkildar e ku "tu ferqek berbiçav nedîtin." Grok3 tenê bi %1-2 ji cîgirên xwe derbas dibe.

Her çend Grok3 ji hemî modelên ku niha bi gelemperî têne ceribandin bilindtir xal girtibe jî, gelek kes vê yekê cidî nagirin: axir, xAI berê di serdema Grok2 de ji ber "manîpulekirina xalan" hatibû rexnekirin. Her ku tabloya rêzgirtinê şêwaza dirêjahiya bersivê ceza kir, xal pir kêm bûn, û ev yek bû sedem ku pisporên pîşesaziyê pir caran rexne li fenomena "xalkirina bilind lê şiyana kêm" bigirin.

Çi bi rêya "manîpulekirina" tabloya rêberiyê be, çi jî bi rêya hîleyên sêwiranê di wêneyan de, ew xAI û obsesyona Musk bi têgeha "serkêşiya komê" di kapasîteyên modelan de eşkere dikin. Musk ji bo van marjan bedeleke giran da: di dema destpêkirinê de, wî pesnê xwe da ku 200,000 GPU-yên H100 bikar aniye (di dema weşana zindî de îdia kir ku "zêdetirî 100,000") û bi tevahî 200 mîlyon demjimêran dema perwerdehiyê bi dest xistiye. Ev yek bû sedem ku hin kes bawer bikin ku ew ji bo pîşesaziya GPU-yê feydeyek din a girîng temsîl dike û bandora DeepSeek li ser sektorê wekî "bêaqil" bihesibînin. Bi taybetî, hin kes bawer dikin ku hêza hesabkirinê ya saf dê pêşeroja perwerdehiya modelan be.

Lêbelê, hin bikarhênerên înternetê xerckirina 2000 GPU-yên H800 di nav du mehan de ji bo hilberandina DeepSeek V3 berawird kirin, û hesab kirin ku xerckirina hêza perwerdehiyê ya rastîn a Grok3 263 carî ji ya V3 ye. Cûdahiya di navbera DeepSeek V3, ku 1402 xal wergirt, û Grok3 de hinekî kêmtir ji 100 xalan e. Piştî weşandina van daneyan, gelek kesan zû fêm kir ku li pişt sernavê Grok3 wekî "ya herî bihêz a cîhanê" bandorek bikêrhatî ya marjînal a eşkere heye - mantiqa modelên mezintir ku performansek bihêztir çêdikin dest pê kiriye ku vegera kêmbûnê nîşan bide.

Tewra bi "puanên bilind lê şiyana kêm", Grok2 ji bo piştgiriya karanînê gelek daneyên partiya yekem ên bi kalîte ji platforma X (Twitter) hebûn. Lêbelê, di perwerdehiya Grok3 de, xAI bi xwezayî rastî "ban"ê hat ku OpenAI niha pê re rû bi rû ye - nebûna daneyên perwerdehiya premium bi lez û bez kêrhatîbûna sînorî ya şiyanên modelê eşkere dike.

Pêşdebirên Grok3 û Musk bi îhtîmaleke mezin yekem kes in ku van rastiyan bi kûrahî fam dikin û destnîşan dikin, ji ber vê yekê Musk bi berdewamî li ser medyaya civakî behs kiriye ku guhertoya ku bikarhêner niha tecrûbe dikin "hîn jî tenê beta ye" û ku "guhertoya tevahî dê di mehên pêş de were berdan." Musk rola rêveberê hilberê yê Grok3 girtiye ser xwe, û pêşniyar kiriye ku bikarhêner li ser pirsgirêkên cûrbecûr ên ku di beşa şîroveyan de têne dîtin, nerînên xwe bidin. Dibe ku ew rêveberê hilberê yê herî zêde tê şopandin li ser Erdê be.

Lêbelê, di nav rojekê de, bê guman performansa Grok3 ji bo kesên ku hêvî dikirin ku ji bo perwerdekirina modelên mezin ên bihêztir xwe bispêrin "masûlkeyên hesabkirinê yên mezin" alarm dan: li gorî agahdariya Microsoft-ê ya ku bi gelemperî heye, GPT-4 ya OpenAI xwedî mezinahiya parametreyê 1.8 trîlyon parametre ye, ku ji deh qatan zêdetir ji GPT-3 ye. Gotegot destnîşan dikin ku mezinahiya parametreyê ya GPT-4.5 dibe ku hîn mezintir be.

Her ku mezinahiya parametreyên modelê bilind dibe, lêçûnên perwerdeyê jî pir zêde dibin. Bi hebûna Grok3 re, pêşbazên mîna GPT-4.5 û yên din ên ku dixwazin "pereyan bişewitînin" da ku bi riya mezinahiya parametreyan performansa modelê çêtir bi dest bixin, divê sînorê ku niha bi zelalî xuya dike bifikirin û bifikirin ka meriv çawa wê derbas bike. Di vê gavê de, Ilya Sutskever, zanyarê sereke yê berê li OpenAI, berê di Kanûna Pêşîn a borî de gotibû, "Perwerdehiya pêş-ku em pê dizanin dê bi dawî bibe," ku di nîqaşan de ji nû ve derketiye holê, û hewildanên ji bo dîtina rêya rastîn ji bo perwerdekirina modelên mezin zêde kiriye.

Nêrîna Ilya di pîşesaziyê de alarm da. Wî bi awayekî rast pêşbînî kir ku daneyên nû yên gihîştî dê biqedin, û ev yek bû sedema rewşek ku performans bi rêya bidestxistina daneyan nikare berdewam bike, û wê dişibihe xilasbûna sotemeniyên fosîl. Wî destnîşan kir ku "wek petrolê, naveroka ku ji hêla mirovan ve li ser înternetê hatî çêkirin çavkaniyek sînorkirî ye." Di pêşbîniyên Sutskever de, nifşê din ê modelan, piştî pêş-perwerdehiyê, dê xwediyê "xweseriya rastîn" û şiyanên aqilmendiyê yên "mîna mejiyê mirovan" be.

Berevajî modelên îroyîn ên pêş-perwerdekirî ku bi giranî xwe dispêrin hevahengiya naverokê (li ser bingeha naveroka modela berê hatî fêrkirin), pergalên AI yên pêşerojê dê bikaribin fêr bibin û rêbazên çareserkirina pirsgirêkan bi awayekî mîna "raman" a mejiyê mirovan saz bikin. Mirovek dikare bi tenê bi wêjeya pîşeyî ya bingehîn di mijarekê de jêhatîbûna bingehîn bi dest bixe, lê modelek mezin a AI hewceyê bi mîlyonan xalên daneyê ye da ku tenê bandora asta destpêkê ya herî bingehîn bi dest bixe. Tewra dema ku gotin hinekî were guhertin jî, dibe ku ev pirsên bingehîn bi rêkûpêk neyên famkirin, ku nîşan dide ku model bi rastî di warê îstîxbaratê de baştir nebûye: pirsên bingehîn lê çaresernekirî yên ku di destpêka gotarê de hatine behs kirin mînakek zelal a vê diyardeyê temsîl dikin.

Xelasî

Lêbelê, ji hêza hovane wêdetir, ger Grok3 bi rastî jî di eşkerekirina ji pîşesaziyê re ku "modelên pêş-perwerdekirî nêzîkî dawiya xwe dibin" de biserkeve, ev yek dê bandorên girîng li ser qadê bi xwe re bîne.

Dibe ku piştî ku gêjbûna li dora Grok3 hêdî hêdî kêm bibe, em ê bêtir bûyerên wekî mînaka Fei-Fei Li ya "mîhengkirina modelên performansa bilind li ser komek daneyên taybetî bi tenê 50 $" bibînin, ku di dawiyê de rêya rastîn a ber bi AGI ve kifş bikin.

Çareseriya Kabloya ELV Bibînin

Kabloyên Kontrolê

Ji bo BMS, BUS, Pîşesazî, Kabloya Amûran.

Li vir bitikîne

Sîstema Kabloya Strukturkirî

Tor û Dane, Kabloya Fîber-Optîkî, Korda Patchê, Modul, Plaqeya Rûyê

Li vir bitikîne

Nirxandina Pêşangeh û Bûyerên 2024

Dema şandinê: 19ê Sibatê, 2025

Ceribandina "Zîrektirîn li Cîhanê" Grok3

Pêşkêş

Grok3 baş e, lê ji R1 an o1-Pro ne çêtir e.

Perspektîfek Rexnegir li ser "Têkbirina Nvidia"

Xelasî

Kabloyên Kontrolê

Sîstema Kabloya Strukturkirî

16-18ê Nîsanê, 2024 Enerjiya Rojhilata Navîn li Dubayê

16-18ê Nîsanê, 2024 Securika li Moskowê

9ê Gulana 2024an, ÇALAKIYA DESTPÊKIRINA BERHEM Û TEKNOLOJIYÊN NÛ li Şanghayê

22-25ê Cotmeha 2024an SECURITY CHINA li Pekînê

19-20 Mijdar, 2024 CÎHANA GIRÊDAYÎ KSA