Új hozzászólás Aktív témák
-
Duck663
őstag
-
Duck663
őstag
Meg kell "kettőzni" a hálót. Az egyiken (nevezzük elsődlegesnek, vagy belső hálónak) a processzor magok vannak, ezek lehetnek a chipletek, ebbe simán belemehet akár 16 mag is. A második hálóhoz (nevezzük külső hálónak) pedig maguk a chipletek kapcsolódnak, abból pedig megint csak mehet jó pár, és ugyanerre mehet GPU is vagy bármilyen egyéb gyorsító, tetszőleges összeállításban, ami aztán kapcsolódik a memóriához, ugyanúgy mehet bele egy nagy cache is, meg bármi ami kell és ugyanúgy megvan a lehetőség arra, hogy egy chiplet hozható legyen AM4-re, TR-re és EPYC-re. Jó persze leírni könnyebb, mint megcsinálni, de ha a Tesla megoldotta az AMD-nek is meg kell tudnia oldani.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
-
Duck663
őstag
Abu, komolyan ne már! "Az egyes training node-ok minden irányban 512 GB/s-os adatátviteli tempóra képes buszon keresztül vannak összekötve. A lapkán belüli összesített sávszélesség egyébként a 10 TB/s-ot is elérheti." Ha ugyanez 16 magra van, nehogy már szűk keresztmetszet legyen. De ha mégis az leveszik 12-re. Arról nem beszélve, hogy nem ezt kell egy az egyben átvenni, hanem hasonlót kell építeni, saját igényeiknek megfelelően.
Itt ez a 3D V-Cache, gyönyörűen megmutatja, hogy teljesítmény marad a lapkákban (ezt megjegyeztem már korábban is), mert várnia kell az adatokra. A végtelenségig nem lehet növelni a cachek méretét. Az AMD-nek muszáj az adatokra várakozási időt csökkenteni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Mi sem egyszerűbb, minden mag kap saját L1 és L2-t, az L3 viszont már az elsődleges (belső háló) és másodlagos (külső háló) kapcsolódásánál található. Így minden egyes chiplet ilyen módon rendelkezik egy saját L3-mal, amit minden chipleten belüli mag, azonos sebességgel és késleltetés mellett ér el. Ezek után pedig még a memória előtt a másodlagos hálóhoz kapcsolható egy L4 is vagy akár HBM is, amelyet, minden egyes chiplet azonos sebességgel és késleltetés mellett ér el. A chipletenkénti L3 szükséges annak érdekében, hogy a másodlagos háló terheltségét kiegyensúlyozottabbá tegyék, viszont lehet, hogy a méretéből, a mostanihoz viszonyítva lehet faragni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
"Ha valódi megoldást akarsz, akkor kellene a hardverbe egyfajta tag directory, amitől a magok kérdezhetik, hogy melyik adat hol van a gyorsítótárban." Ez teljesen egyértelmű, ezt egy különálló rendszerrel kell megoldani, amiben az információ a hálótól függetlenül, de annak működését meghatározva száguldozik, nem csak azért, hogy az adatok helye meghatározható legyen, hanem azért is, hogy ne lehessen adatot lopni. De miután az itt haladó adatok csak metaadatok, itt már nincs szükség nagy sebességre.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Nincs végtelen skálázódás. De ezzel simán fel lehetne 256 magig is menni, egy tokon belül, úgy hogy megvan a memória koherencia, magas az elérhető memória sávszélesség, miközben a késleltetés is alacsony, sőt a különféle gyorsítók integrálási lehetősége is adott.
Közben pedig tovább lehet gondolni, hogyan léphetünk tovább, feljebb. Attól még, hogy van egy működő rendszerünk a kutatás nem áll(hat) meg, mert előbb-utóbb annak elérjük a határait és tovább kell lépni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Igen ám, csakhogy az a 40 mag az egyben volt, nem volt csoportokra osztva. Egyébként volt valami kísérleti processzoruk abban 80 mag volt és hálós rendszert használt. Az hogy mi lett vele azt nem tudom.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
A 3D V-Cache bizonyítja, hogy teljesítmény marad a processzorban, egyszerűen adatra vár, hiába skálázódik relatíve jól, ha már tulajdonképpen egy szálon is teljesítményt veszít, és mindezt a magas késleltetés miatt.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Épp erről van szó, hogy magas a késleltetés és azt csökkenteni KELL!!! Később ez még rosszabb lesz, ahogy tovább növelik a magszámot. Nem lehet végtelenségig pakolgatni a cacheket ide is és oda is, mert akkor azzal fog elszállni a tranzisztorszám. Arról nem is beszélve, hogy profitot kell termelniük. Az Intelnél látszik, hogy kezdik megrázni magukat, az AMD-nek addig kell erős piaci részesedést kiharcolnia, mert utána egy gőzhengerrel fogják szembetalálni magukat.
"drágán implementálható belső kommunikációs topológiákra" Azt meg meglátjuk a következő generációknál mennyire is volt drága.
"de közben ennek az összes előnyét elvesztik ott, hogy menni kell a memóriáig az adatért." Ezért írtam, hogy a külső hálóhoz mehet L4 vagy HBM, ha szükséges!
Hidd el, jól átgondoltam én ezt, nincs jó úton az AMD ezzel a felépítéssel. Teljesítményt hagy a processzorokban, ezt pedig nem lehet megengedni, ha csúcsra akarnak törni, minden téren és ott is akarnak maradni.Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
Új hozzászólás Aktív témák
- LEGJOBB ÁR! GAMER PC - RTX 3070 - Ryzen 5500 - 16GB DDR4 - 500GB Nvme SSD
- KÜLÖNLEGES AJÁNLAT 21,5 iMac 2013 Late i5, 16GB RAM, 1,25TB Fusion Drive
- BESZÁMÍTÁS! Lenovo Thinkcentre M720S i5 16GB 1TB SSD számítógép garanciával hibátlan működéssel
- 2db Iceriver KS0 KASPA bányagép + 180W új tápegység 2 év garanciával.
- i5 12400f 3070 gamer pc
- AKCIÓ! GAMER PC - RTX 3060Ti - i5 12400F/13400F - 16GB DDR4/DDR5 RAM - 500GB Nvme SSD
- AKCIÓ! ÚJ! GAMER PC - RTX 3060 12GB - i5 10400F/11400F - 16GB DDR4 - 250GB M.2 Nvme SSD - 1TB HDD
- AKCIÓ! GAMER PC - GTX 1070 8GB - i5 10400F/11400F - 16GB 3000MHZ DDR4 - 240GB SSD - 500GB HDD
- AKCIÓ! GAMER PC - RTX 2060 SUPER 8GB - i5 10400F/11400F - 16GB RAM - 240GB SSD - 1TB HDD
- Asztali számítógép
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen