Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Oliverda #2 üzenetére

    Az nem jelent semmit. Azt ki is kell használni. A HBM2 memóriáknál sincs olyan lapka, ami ne támogatna ECC-t, mégse aktív minden gyorsítón. Az, hogy ezt a szabvány kötelező részévé teszed, még nem jelent automatikus működést. Ahhoz platformszintű támogatás kell majd, vagy esetleg egy memóriamodulra helyezett chip erre a feladatra. Ha ezek nincsenek meg, akkor ugyanúgy nem lesz ECC, függetlenül attól, hogy a megvásárolt memórialapkák megfelelnének hozzá.

    A szabványalkotók a HBM és a DDR új specifikációinál azt akarták elérni, hogy a memóriagyártóknak ne legyen más választásuk, így kötelező ECC-t támogató memórialapkákat tervezniük, de az már nem kötelező, hogy ez a funkció működjön is egy rendszerben.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Oliverda #5 üzenetére

    Jaj... oké segítek...

    Az on-die ECC azt jelenti, hogy egy adatbájtonként kötelező alkalmazni egy ECC bitet. Ettől a memória még nem tud ECC-t számolni, csak tárolja az információt. Az ECC valós támogatásáról vagy egy memórialapkán kívüli apró chip gondoskodik a tényleges modulon, vagy maga a platform (CPU és alaplap kombó). Ha egy modulon nincs erre külön lapka, és a platform sem támogatja, akkor ugyan bájtonként elméletben lehet egy ECC bit, de lószart sem tud vele kezdeni a rendszer, mert nincs támogatva a compute.

    Ugyanez a követelmény megvan a HBM2 specifikációban, de ott is csak a memóriára vonatkozik. Ha a rendszer nem biztosítja ez egy extra bitnyi információt, akkor a tárterület számára csak úgy bájtonként van és ennyi.

    Amit Linus felvetett, azt ez a specifikáció nem oldja meg, mert ha mondjuk az Intel nem kezdi el támogatni, akkor a DDR5 memóriákon is csak lehet bájtonként egy extra bitnyi információ, aminek örülünk, de szart sem tudunk vele kezdeni, ha nem lesz a tárterületre leszámolva. A modulra helyezett ECC compute pedig elég drága. A végfelhasználói piac árérzékeny, ott inkább platformszintű támogatás kellene, olyasmi, amit az AMD csinál, akár nem hivatalosan.

    Szóval a specifikáció annyit csinál, hogy előírja a kötelező ECC biteket bájtonként, vagyis a memóriagyártóknak úgy kell terveznie a memórialapkákat, hogy ennek ott kell a hely. De a specifikáció maga az ECC számításáról nem gondoskodik.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Oliverda #7 üzenetére

    Ez nem megoldás. Nekünk valós ECC kell, ami a teljes modulon működik. A lapkaszintű valójában semmit sem ér, mert ilyeneket már eleve csinálnak a gyártók most is, csak nem szabványos formában. Ez viszont nem helyettesíti a modulra működő ECC-t, ami azért igen sok bitig tud hibát javítani. Már a DDR4 lapkák esetében is nagy a bithibák száma, amit nem szabványos technológiával oldanak meg. Mindenki csinálja, mert 10 nm-es osztályú memóriákat nem lehet ezek nélkül gyártani.

    Amiről Linus beszél az egy teljesen más követelmény. Nem a gyártást segíti, hanem a működést, és ahhoz annyi nem elég, hogy egy bitnyi információt tudjunk javítani. Sok bitnyit kell a teljes modulra.

    A HBM2-nek van egy ugyanilyen követelménye, ugyanezért. Ott is az történt, hogy az első generációs HBM-hez már voltak gyári megoldások a problémára, amire a HBM2 hozott szabványost. De ettől, hogy volt bájtonként egy ECC bit, még nem működött automatikusan a teljes stackre, kellett hozzá a rendszerszintű támogatás, mert a teljes stackre azt számolni is kellett, amit a szabvány nem biztosít. Itt sem biztosít ilyet a szabvány a teljes modulra. Ehhez kellenek külön kiegészítések, noha az már előrelépés, hogy a memóriákat eleve ECC-re kell tervezni, csak magától teljes modulra még így sem fog működni.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • E.Kaufmann

    addikt

    válasz Oliverda #12 üzenetére

    De úgy rémlik, jelezni tud több bites hibát. Arra pl pont jó, hogy inkább dob BSOD-t vagy hátast a rendszer, minthogy pl f@ßságot írjon ki a lemezre. Vagy rosszul gondolom?

    Le az elipszilonos jével, éljen a "j" !!!

  • Emilió

    junior tag

    válasz Oliverda #12 üzenetére

    Igazad van. De amit tudsz, csak nem írod le: A ddr5 ECC azért nem jó, mert az az intelnek idén lesz, az amd-nek meg nem. A ddr4 ECC végfelhasználóknak meg azért jó, mert a threadripper tudja, az intel hedt meg nem. Ennyike. :C

    A józan ész nem ajándék, hanem büntetés, mert nap mint nap meg kell küzdened azokkal, akiknek nincs. Főleg a kis trollokkal, akik lenyúlják az idézeted, és azt hiszik, ettől okosnak tűnnek majd.

  • Abu85

    HÁZIGAZDA

    válasz Oliverda #12 üzenetére

    A gyártástechnológiai fejlődéssel növekszik a bithibák száma, és ezeket transzparens megoldásokkal kezeli az összes gyártó már ma is. De ez nem helyettesíti a teljes modulra vonatkozó ECC-t, az egy teljesen más probléma, és más megoldás kell rá.

    Pont arról ír Torvalds, hogy nem felesleges. Elég komoly érveket is írt, amik ellen a memóriagyártók kb. annyit tudnak felhozni, hogy "csak".

    #18 Emilió : Az on-die ECC nem egyenlő a teljes modulra vetített ECC-vel. Utóbbit mindenképpen kell támogatni platformszinten. Ez csak úgy nem tud működni egy memóriamodulon, hacsak nem raknak a modulra egy külön lapkát, az ECC compute-hoz, de az nagyon drága.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák