Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz leviske #44 üzenetére

    A HSA-s JPEG dekódoló nagy része nem párhuzamosítható. Abból nehéz nagy gyorsulást elérni. Annak már van amúgy egy OpenCL verziója is, de csak a nem HSA-s APU-khoz. Persze az eléggé speciális kód.

    Az AVX-szel nem érdemes a HSA-t hasonlítani. Az AVX hatékony kihasználása a legtöbb cég számára vállalhatatlanul nehéz, és nem fér bele erre költeni. Egyszerűbb HSA-t vagy ma még C++ AMP-t használni és az automatikusan használ AVX/AVX2-t, kiemelten hatékony autóvektorizálással. Annál kézi optimalizálással a gyakorlatban nem lehet 10%-nál nagyobb gyorsulást elérni.

    Az AVX1/2 egyébként lényeges lesz, ahogy érkezik az OCL 2, az új C++AMP és a HSA runtime. Mindhárom nagyon jól tud kódot generálni rá. Sokkal jobban, mint az Intel gyári fordítója.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák