Hirdetés
-
GAMEPOD.hu
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
S_x96x_S
addikt
válasz Alogonomus #43497 üzenetére
> a perf/slot mutató ...
a párhuzamosítás a lényeg
... a single chip annyira nem túl sokat fejlődött,
... emiatt a consumer csúcs gaming kártyákba is
valószínüleg 2 chipet tesznek.-----------
https://stratechery.com/2024/nvidia-waves-and-moats/"What is interesting to note is that both training runs take the same amount of time — 90 days. This is because the actual calculation speed is basically the same; this makes sense because Blackwell is, like Hopper, fabbed on TSMC’s 4nm process, and the actual calculations are fairly serial in nature (and thus primarily governed by the underlying speed of the chip). “Accelerated computing”, though, isn’t about serial speed, but rather parallelism, and every new generation of chips, combined with new networking, enables ever greater amounts of efficient parallelism that keeps those GPUs full; that’s why the big improvment is in the number of GPUs necessary and thus the overall amount of power drawn."
árakban - az előző cikk szerzője kisebb nvidia árrést vár,
a verseny miatt.
"
What is interesting to note is that there are reports that while the B100 costs twice as much as the H100 to manufacture, Nvidia is increasing the price much less than expected; this explains the somewhat lower margins the company is expecting going forward. The report — which has since disappeared from the Internet (perhaps because it was published before the keynote?) — speculated that Nvidia is concerned about preserving its market share in the face of AMD being aggressive in price, and its biggest customers trying to build their own chips. There is, needless to say, tremendous incentives to find alternatives, particularly for inference."megj:
az AMD agresszív árazásával már ~7% AI piaci részesedést szerezhetett..
"AMD To Ship Huge Quantities Of Instinct MI300X Accelerators, Capturing 7% of AI Market"[ Szerkesztve ]
Mottó: "A verseny jó!"
-
félisten
na ez durva lesz .
[SXM-To-PCIe Adapter Board Will Let Users Convert NVIDIA’s Top H100 AI GPUs Into 1 or 2-Slot Graphics Cards]"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
Alogonomus
őstag
válasz S_x96x_S #43501 üzenetére
a párhuzamosítás a lényeg
... a single chip annyira nem túl sokat fejlődött,
... emiatt a consumer csúcs gaming kártyákba is
valószínüleg 2 chipet tesznek.Ez abszolút rendben is van így. Mármint persze jobb lenne, ha az érdemi fejlődéshez nem kellene duplázni a chipeket, de ha így sikerült, hát így sikerült. A probléma az, hogy állítólag a duplázott chipek, meg a speciális összeköttetés hatására a Blackwell kártyák ára annyival magasabb is lesz, mint amennyivel többet tudnak nyújtani számítási teljesítményben. Így pedig az előző generációhoz képest költség szempontjából nem lesznek kedvezőbbek, csak helytakarékosabbak lesznek.
-
S_x96x_S
addikt
válasz Busterftw #43503 üzenetére
> AMD előrejelzésen alapul a forrás,
> meg egy csomó "may" "might" "if"-en.
> Várjuk meg mennyi az annyi az év második felében .igazad van ,
a 7% még elég pesszimista is.
- mások 15-25% -ot becsülnek.
- vagy akár 20-30% -ot.---
Állítólag az nVidia elengedte (átengedte ) a HPC piacot a blackwell-el
és az AI-ra fókuszál.Ezt a csökkentett FP64 teljesítményből látható:
=== FP64 Tensor ===
A100 (80GB) = 19.5 TFLOPS
H100 = 67 TFLOPS
B200 = 40 TFLOPS
( via
At the other end of the spectrum, what also remains undisclosed ahead of the keynote address is FP64 tensor performance. NVIDIA has offered FP64 tensor capabilities since their Ampere architecture, albeit at a much reduced rate compared to lower precisions. This is of little use for the vast majority of AI workloads, but is beneficial for HPC workloads. So I am curious to see what NVIDIA has planned here – if B200 will have much in the way of HPC chops, or if NVIDIA intends to go all-in on low precision AI.)[ Szerkesztve ]
Mottó: "A verseny jó!"
-
-
D55
aktív tag
-
S_x96x_S
addikt
"NVIDIA's next-gen Vera Rubin AI GPU rumored for mid-2025,
compete with AMD Instinct MI400X"
https://www.tweaktown.com/news/97021/nvidias-next-gen-vera-rubin-ai-gpu-rumored-for-mid-2025-compete-with-amd-instinct-mi400x/index.html
https://en.wikipedia.org/wiki/Vera_RubinMottó: "A verseny jó!"
-
félisten
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
félisten
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
huskydog17
addikt
Erre kíváncsi leszek, hogy a gyakorlatban mit fog tudni, mármint ezzel mit tudnak nyerni a játékfejlesztők, az mindenképp dicséretes és egyben ígéretes, hogy nyílt forráskódú és van benne szabványos mód is.
Gameplay csatornám: https://www.youtube.com/channel/UCG_2-vD7BIJf56R14CU4iuQ
-
félisten
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
veterán
válasz TESCO-Zsömle #43517 üzenetére
Vannak a legkomolyabbak is -HUN name tag-el. Ott mestersegea unintelligencia van, eszememt szamitasi kapacitassal
-
hokuszpk
nagyúr
válasz TESCO-Zsömle #43522 üzenetére
így hajnalban nekem úgytűnik, hogy Álmos vérvonalát viszem ; remélem ebből nemlesz bajom
Első AMD-m - a 65-ös - a seregben volt...
-
veterán
válasz TESCO-Zsömle #43522 üzenetére
En a hulyeket sertegetem
-
félisten
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
félisten
válasz paprobert #43527 üzenetére
Itt kifejezetten az RT ben való előrelépést szorgalmazza ilyen szempontból. Ha jól értem az egész BVH struktúra ketté vagy inkábbb hármom felé lenne szedve legalább is nekem ebből, a 7.oldalból [link] hasonló jön le nekem.
Egyből amit folyamatosan használ és amit ritkábban használ az egy másodlagos tárban lenne, és két lépcsőbben előkészítené az első ciklusra.Lehet nem jól értelmeztem ,de sztem ilyesmiről lehet szó.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
paprobert
senior tag
Köszi a linket. 10 percet beleolvastam, igen, BVH streamingnek tűnik, különböző pool-okban.
VRAM-ot szabadít fel, cserébe pörgeti a CPU-t és foglalja az SSD-t.Ez eléggé konzol-mankónak tűnik. Ott legtöbbször nincs extra szabad RAM, de a Zen2 magok fele nem csinál semmit.
Ennek egy sok RAM-os PC-n már csak limitált értelme van, sok VRAM-mal pedig konkrétan semmi.
[ Szerkesztve ]
640 KB mindenre elég. - Steve Jobs
-
félisten
válasz paprobert #43529 üzenetére
Szerintem működhet éppen rendszermemórián is ha jól látom, ami PC-n azért elég jól jöhet ha kevés a Vram a kártyán. Pl a 4070 super -4070Ti egy elég bika kis kártyak, de kevés a Vram RT alatt néhány esetben.
Vagy Hát lehetséges hülyeség ,de az is lehet hogy a Microsoft érkező kézikonzoljában is támaszkodna erre valami belépő RT ben."A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
paprobert
senior tag
"PC-n azért elég jól jöhet ha kevés a Vram"
Kérdés, hogy mennyit tud lefaragni, és az, hogy mire be lesz vetve, lesz-e értelme vele PC-n zsonglőrködni.Túl sokáig maradt velünk a 2017-2019 körüli VRAM mennyiség a mainstreamben... Ez a gond egy évtizednyi technológiai fejlődést követően csak megoldódik, gondolnám... ugye Jensen?
640 KB mindenre elég. - Steve Jobs
-
-
M@trixfan
addikt
Ezt én is nézegetem, de nekem hátrébb lépve abszolút általánosságban nézve, az jön le RT fronton, hogy maga a zajszűrés és az elhanyagolás ami lehetővé teszi a valós idejű működést. Alapvetően még mindig nyers erőben van hiány az útvonalak számításához, nekem nagyon furcsa, hogy egy vram-nál sok nagyságrenddel lassabb SSD hogyan forradalmasítja ezt
twitter: MatrixfanLive | Ősidőktől a PH!-n
-
S_x96x_S
addikt
válasz M@trixfan #43533 üzenetére
> nekem nagyon furcsa, hogy egy vram-nál
> sok nagyságrenddel lassabb SSD hogyan forradalmasítja eztAmit fontos tudni:
- A (high-end) Blackwell már Gen6 -os lesz.
- És 2-3 év múlva már Optane kategóriájú ( ~ low latency) Gen6 -os extrém gyors M.2 SSD diszkek is elérhetőek lesznek.
- és már a Gen5 latency is sokkal szigorúbb mint a Gen4 ..vagyis ideális esetben
a Gen6-os GPU swappel a Gen6-os M.2 SSD-re.Mottó: "A verseny jó!"
-
nagyúr
válasz M@trixfan #43533 üzenetére
Egyrészt a "sok nagyságrend" a gen 5 esetében 1 és 2 között van.
Másrészt nem az számít, hogy mennyire gyors az SSD a VRAM sebességéhez képest, hanem hogy mennyire gyors a VRAM méretéhez képest. Egy gen 5 SSD egy 4070 memóriájának a tartalmát másodpercenként le tudja cserélni."We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."
-
félisten
válasz M@trixfan #43533 üzenetére
Nem értek hozzá, nem én találtam fel. de szerintem ahogy írtam feljebb is,amennyira tudom értelmezni a BVH lenne elosztva és nem kellene hogy a teljes struktúra bent legyen a Vramban hanem három lépcsőben kezelné a GPU,és elválasztaná azokat amiket folyamatosan és közvetlenül használ.Valószínűleg az új SSD-k lényegesen gyorsabban kezelnék a sokkal nagyobb sruktúrát mint a Vram mérete, leválasztana magának egy szeletet a GPU. DE ahogy néztem ez lehet éppen rendszermemória is, ami meg főleg alkalmas lehet erre.
Azért mondjuk egy 12 GB vramos kártya ha kapna + 16 GB rendszermemóriát vagy 32 GB közvetlen SSD tárhelyet vagy mindkettőt, lehet tudna vele már mit kezdeni legalább is a Microsoft szerint, főleg ha mondjuk ezt textúrázásra vagy egyéb vram igényes raszter dolgokra hazsnálhatná fel a felszabaduló helyet nem feltétlenül csak RT -re.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
D55
aktív tag
válasz S_x96x_S #43534 üzenetére
"ideális esetben a Gen6-os GPU swappel a Gen6-os M.2 SSD-re."
Itt nekem az nem fér teljesen össze, hogy pont egy high-end Blackwell ahol szerintem a VRAM sem lesz szűkös (meglepődnék, ha az 5090 nem kapna legalább 32 vagy akár 48 gigát), mid-range környékén meg nem igazán jellemző a vásárlóközönségre, hogy 1-2 évente a teljes configjukat cserélnék, sokkal inkább csak 3-4-5 évente.
[ Szerkesztve ]
-
M@trixfan
addikt
Köszi mindenkinek a választ, remélem oké ha így egyben válaszolok
Majd mindjárt nézem a Tom’s cikket, előtte hadd helyezzem perspektívába a dolgot! Egy 5090 esetében szerintem ilyesmi méretek várhatóak legalább, de érdemes megnézni az összes mem konfigot.Gen 1 GDDR7:
512-bit / 28 Gbps / 32 GB (Max Memory) / 1792 GB/sSK hynix's 40 Gbps modulokból:
384-bit / 40 Gbps / 36 GB (Max Memory) / 1920 GB/sPCIe 6.0 SSD: 32GB/s maximum
Ezt research nélkül is lehet érezni, hogy egy SSD köszönő viszonyban sincs egy grafikus memóriához képest és akkor még a latency-ről nincs is szó. A mem az elég valószínű ns tartományban mozog, az SSD-k pedig simán ms tartományúak. Akármilyen jó egy SSD, a rendszer memória gyorsabb. Szerintem még a buszon keresztül is. Vagy pl. egy olcsóbb kiegészítő dram pool a kártyán hamarabb eszébe jut az embernek.
Na de most már megnézem a Tom’s cikket, mert valamiért csak kitalálták ezt[ Szerkesztve ]
twitter: MatrixfanLive | Ősidőktől a PH!-n
-
félisten
válasz M@trixfan #43539 üzenetére
ha megnézed a szabadalmat kifejezetten írja hogy azokban az esetekben van értelme ha a VRAM szűk keresztmetszet. Egyértelmű, hogy 32 GB vram és 24 sem az.
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
S_x96x_S
addikt
házi AI szerver ...
"Building WOPR: A 7x4090 AI Server"
https://www.mov-axbx.com/wopr/wopr_concept.html
https://www.mov-axbx.com/wopr/wopr_risers.html
https://www.mov-axbx.com/wopr/wopr_power.html
https://www.mov-axbx.com/wopr/wopr_frame.html
https://www.mov-axbx.com/wopr/wopr_bom.htmlMottó: "A verseny jó!"
-
huskydog17
addikt
RTX 4060 ára lement 300 dollár alá külföldön:
GeForce RTX 4060 is now available for $279
Kíváncsiságból megnéztem az aktuális legolcsóbb kínálatot itthon, a legolcsóbb RTX 4060, az egy ventis Inno3D jelen hsz írása pillanatában 121 ezer pénzért vihető haza. Kezd egyre barátibb ára lenni a 4060-as szériának.
Gameplay csatornám: https://www.youtube.com/channel/UCG_2-vD7BIJf56R14CU4iuQ
-
S_x96x_S
addikt
A Blackwell - már hivatalos Gen6 támogatása után
érdekes visszaolvasni az 1 hónappal ezelőtti pletykákat .."
NVIDIA making this move makes sense, as it fully simplifies the supply chain... the company will require a single PCIe 6.0 16-pin power connector for every single GeForce RTX 50 series graphics card it makes.
All of the future GeForce RTX 50 series Founders Edition cards would roll out with the new PCIe 6.0 connector, as well as the company mandating the new PCIe 6.0 16-pin power connector to custom AIB models of upcoming RTX 50 series GPUs.
Read more: https://www.tweaktown.com/news/96270/nvidia-rumored-to-mandate-pcie-6-0-16-pin-power-connector-for-geforce-rtx-50-series-gpus/index.html"és már demózzák is .. a high-end -et ...
"Working PCIe 6.0 connectivity demoed at GTC — Astera Labs' Aries retimers currently power Nvidia's HGX systems with eight H100 GPUs, likely future Blackwell systems, too
PCIe 6.0 is critical for next-gen GPUs and CPUs."
( via Tom'sHW)Mottó: "A verseny jó!"
-
Mans20
addikt
válasz huskydog17 #43544 üzenetére
Még mindig drága, max 90- 100-nak kellene lennie.
-
nagyúr
válasz huskydog17 #43544 üzenetére
Az ASUS dual normális helyen 135-137, induláskor 132 volt...
"We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."
-
félisten
-
S_x96x_S
addikt
nVidia találgatós ..
( az ügyfelekért - mindent .. )
Mottó: "A verseny jó!"
-
félisten
válasz S_x96x_S #43549 üzenetére
Nem csodálom:
[Nvidia Hopper H200 breaks MLPerf benchmark record with TensorRT]
"Nvidia also highlighted its performance in MLPerf Llama 2 70B when compared with Intel's Gaudi2 NPU solution. According to Nvidia's charts, the H200 achieved its world record 31,712 scores in server mode with TensorRT-LLM enhancements. In offline mode, the chip scored 29,526 points. The H200's new scores are around 45% faster than what H100 could accomplish, thanks in a large part to having more memory bandwidth and capacity. In the same benchmark, using TensorRT as well, the H100 scored 21,806, and 20,556 in server and offline modes, respectively. Intel's Gaudi2 results by comparison were only 6,287 and 8,035 in server and offline modes.""A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
Új hozzászólás Aktív témák
Hirdetés
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az NVIDIA éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- alza vélemények - tapasztalatok
- Házimozi haladó szinten
- Mikrokontrollerek Arduino környezetben (programozás, építés, tippek)
- Fujifilm X
- Régi vágású miditorony a GameMax receptje szerint
- Fejhallgató erősítő és DAC topik
- Bluetooth hangszórók
- eBay-es kütyük kis pénzért
- Debrecen és környéke adok-veszek-beszélgetek
- AMD Ryzen 9 / 7 / 5 7***(X) "Zen 4" (AM5)
- További aktív témák...
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest