Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Jack@l #46972 üzenetére

    Bizony. A gyakorlatban kinyerhető számítási kapacitás legnagyobb gyilkosa az adatmozgás a lapkán belül. Nem véletlen, hogy minden optimalizálási útmutató arról szól, hogy ezt hogyan lehet csökkenteni. Mert ahhoz, hogy egy ADD/MUL/MAD operációt végrehajtson egy ALU mindössze egyetlen ciklus alatt, el kell vinni az operációhoz szükséges adatot a regiszterekbe. Az már nem csak egy ciklus, GPU-knál akár 100 ciklus is lehet. Tehát tulajdonképpen a teljes lapka 100 ciklusig is dolgozhat azon, hogy egy ciklus alatt végrehajtson egy egyszerű operációt. Ilyen szempontból az az ADD/MUL/MAD "szinte ingyen van".

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák