Keresés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    Ha jól értem, akkor tehát lenne a kupak alatt 4 teljes értékű, önállóan is működőképes lapka, amiben van egyenként 2db DDR5 vezérlő és 4 GMI
    A 4 lapka 3 GMI-n keresztül egymáshoz kapcsolódik - ahogy az EPYC jelenleg is teszi.
    A Milanban viszont lenne egy 5. lapka, ami nem teljesértékű, önállóan is működőképes, 32 maggal és 4GMI-vel és ez csatlakozna 1-1 GMI-n keresztül a másik 4 lapka 4. GMi interfészére. Értelemszerűen ennek nem lenne közvetlen memóriahozzáférése.

    Kicsit kreténül hangzik, ennél én az Infinity fabrictól többet vártam.

    Nekem Az a megközelítés jobban skálázhatónak tűnik, ha kihagyjuk a képből az önállóan is működőépes lapkákat és olyan 8 vagy 16 magos lapkákat gyártunk, ami GMI-n keresztül egy olyan lapkához csatlakozik, amelyik az I/O műveletekért felel egy hatalmas cache-sel.

    EPYC Masterplan

    az EPYC-ben az egyik drága és diszfunkcionalitáshoz vezető probléma nagy valószínűséggel pont a huzalozás - vagyis hogy távol vannak egymástól a lapkák. De a lapkák nyilvánvalóan kellően nagyok jelenleg ahhoz, hogy mondjuk ne nagyon lehessen interposerre tenni, mert ahhoz hatalmas interposerre lenen szükség >1000mm2

    7nm-en ez lehet, hogy némileg javul, de mivel egy lapkában található L3 cache-t magonként megkétszerezik

    más fejlesztésekkel együtt könnyen lehet, hogy az 7nm-es lapka méret is közelíteni fogja a 200mm2-t

    Viszont ha a lapkák nem teljes értékűek lennének, hanem különálló kisebb lapkákba lenne szervezve 8x8 csak a magokat és GMI-ket tartalmazó lapka és középre csak DDR, PCIe, és más IO kommunukációval rendelkező lapka, amiket interposeren keresztül GMI köt össze, akkor kis interposer is elég, az összes lapka lehet kisebb és a huzalozás is rövidebb, vagyis kisebb energiát használ és kisebb késleltetéssel.

    Butterdonuts

    Hátránya persze, hogy mainstreamben is csak interposerrel, vagy nem használható.

    Találgatunk, aztán majd úgyis kiderül..

  • Petykemano

    veterán

    válasz h_143570 #8 üzenetére

    Igen. Ez nem feltétlenül mond ellent annak, amit én írtam. Bármelyik lapka lehetne nem 16 CPU magos önálló életet is élni tudó cpu lapka, hanem egy APU, vagy GPU, vagy FPGA, vagy tensor.
    Az epyc jelenleg egy mindent mindennel összekötő háló.
    Egy 5. lapka elhelyezése az elbeszélés alapán lehetséges lapkánként 4 GMI-vel és akkor még mindig minden mindennel össze van kötve.

    A butterdonut elrendezés a tesztek alapján az a elrendezés és összekötés, ami úgy a leghatékonyabb, hogy nincs minden mindennel összekötve - értelemszerűen 4-5-nél több lapkás kialakítás esetén.
    (Bár ez már beleviszi azt is, hogy maga a memóriavezérlő, tehát a vezérlőlapka lehetne az interposerben)

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák