Keresés

Új hozzászólás Aktív témák

  • do3om

    addikt

    válasz Petykemano #27832 üzenetére

    Meg kell keresnem hogy mennyire le van maradva az AMD-hez képest az NV gyártástechnologia?
    ;]
    Itt hangzott el a PH-n, nem egyszer, az AMD sokkal jobb technologiát kap a GF-től. Abu itt van talán emlékszik is rá ki irt erről sokat. ;] Talán én is emlékszem de már itt az is baj ha a régi be nem teljesült dolgokat előveszi az ember szóval nem írom le.

    Ha érdekel valami szerelési anyag írj privátot. Eladó Schneider Mágneskapcsoló 18,5kW/38A

  • Abu85

    HÁZIGAZDA

    válasz Petykemano #27832 üzenetére

    AZ év világos semmi köze ezeknek a gyártástechnológiákhoz. A Samsung is pont ugyanazt az LPP node-ot használja, mint a GloFo. Sőt, a GloFo-nál az LPP hamarabb kész lett, mert ők nem foglalkoztak az LPE-vel.

    A variálható wavefrontméret egyáltalán nem tudja lekapcsolni a SIMD-et. Hogyan is tudná, ahhoz be kellene fizikailag is kapuzni az ALU-kat, ennyire kis egységekre kapuzni a hardvert sosem érte meg. A variálható wavefrontméret csak azt teszi lehetővé, hogy a wavefront mérete ne fixen 64 szál legyen, hanem akár kevesebb. Semmi mást nem tud ez a funkció. Ezzel egyébként megoldható, hogy két 32 szálas wavefront párhuzamosan fusson. De ez a legtöbb programban eleve nem probléma, mert a konzolra írt kód miatt eleve a GCN kiépítésére van illesztve a optimalizálás, illetve innen a legegyszerűbb a többi hardverhez is hozzáilleszteni a wave méreteit.

    A fogyasztásnak ahhoz van köze, hogy a GCN tud egy rakás olyan funkciót, amelyhez más architektúra hozzá sem tud szagolni. A legtöbb fogyasztás onnan ered, hogy gyűrűs buszra van felfűzve az összes multiprocesszor és a hozzájuk tartozó megosztott egységek zöme. Ez a kiépítés sokkal többet fogyaszt, mintha úgy lenne strukturálva a rendszer, hogy logikailag több GPU-ra fel lehetne osztani, viszont cserébe nem csak a legacy kódokkal gyors, hanem azokkal a függvényekkel is, amelyeket kér a Microsoft például a global ordered append csoportban. Ez a direkt célja egyébként magának a felépítésnek is, hogy a wave-ek feldolgozásának sorrendje a wave-ek kreálásának sorrendjében történjen meg. Ez egy igény volt, amikor a Microsoft és a Sony kérte a konzolba a belsőséget Jobban mondva persze a fő igény a gyors prefix sum volt, ami rengeteg párhuzamos algoritmus alapja, de erre az AMD egy olyan megoldást dolgozott ki, amely egymenetes globális prefix sumot valósít meg nulla sávszélesség igénnyel. Ehhez kellett a rendkívül speciális felépítés és a GDS, valamint nemrég az utasítás-előbetöltés. Utóbbira nincs direkten szükség, de hatékonyabbá teszi a működést. Erre a global ordered append csoportra mondta régebben az Intel egyik rendszerprogramozója, hogy nem tartja annyira jónak a PC-re hozni, mert nem igazán lehet se az Intel, se az NV hardvereire jó implementációt írni. Amíg ugyanis az AMD simán ír a GCN-re egy sávszélt nem is piszkáló verziót, addig az Intel és az NV hardverén két pofára le fogja zabálni a sávszélt. Ez azért káros, mert ha a VRAM-ba mennek a köztes adatok, akkor legalább hatszor akkor sávszél kell egy emulált megvalósításhoz, mintha a chipen belül maradna minden adat.
    Érthető egyébként az elégedetlenség, mert se az Intel, se az NV nem tud ugyanabba a kategóriába hatszor gyorsabb memóriát rakni, tehát az egyetlen reális út, ha mennek ők is a piszok mód fogyasztó belső buszok felé. És mondjuk ez a Vega számára azért kellemes, mert az AMD az GCN5-tel áttér a NoC-ra, ami jóval kevesebbet fogyaszt, mint a gyűrűs kiépítés.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák