Keresés

Új hozzászólás Aktív témák

  • ricsi99

    addikt

    válasz DraXoN #39 üzenetére

    Mind1 minek hívod a gyereket... lassabb ,nem is kicsivel....
    Ez a töbszálú kezelés persze lehetséges ,nem vagyok profi szoftweres így bármi szöveget kiadnak akkor bizti úgy van... én meg öreg csataló vagyok és old school programokat is futtatok ami eléggé csak egyszálas (le is korlátozom mert úgy a tuti) és ott is érezhető a különbség... ami szomorú hogy nagyon sok laptop amit kiadnak azért gyengébb mint az én ocskavasam és azokon még erősebben érezhetőbb ezek az optimizációk... aztán meg "lükének" néznek ,ha nem a friss wint ajánlom... de ez már más kérdés

    Egy Gyűrű mind fölött, Egy Gyűrű kegyetlen, Egy a sötétbe zár, bilincs az Egyetlen...

  • Busterftw

    veterán

    válasz DraXoN #45 üzenetére

    Ahogy kb semminek sem.
    Legyen az egy bongeszo, Windows, jatek.

  • #25954560

    törölt tag

    válasz DraXoN #54 üzenetére

    "Ennek csak az lehet az oka, hogy kód nem lett teljesen AMDre optimalizálva korábban. "
    nem csak az lehet az oka :) bar egyreszt egyetertek veled.

    a psf csak zen3-mal jott be, tehat ha vannak is trukkok, amiben tud segiteni a fordito, egyreszt lehet h csak a legmodernebb verziok tudjak, masreszt nem kizart h explicite engedelyezni is kene forditaskor ha a fordito nem teszi meg es a phoronix-os ~100 alkalmazas --with-tune=generic -kel forgott, sima gcc10.2. nem mondom h mas eredmeny lett volna mas forditoval vagy maskepp parameterezve, de nem kizart. a teszt igy is ervenyes, hiszen tudni lehet h mivel teszteltek.

    masik ok, amiert nem biztos h erdekes az AMD-re optimalizaltsag az az, hogy a PSF egy elegge alacsonyszintu hardveres megoldas ha jol ertem, nem biztos h egyaltalan meg lehet tamogatni forditassal.

    ha ugyis tudod mi ez, akkor bocs, ugord at legyszi ezt a bekezdest. nagyon konyhanyelven arrol van szo, hogy a pipeline-ban vannak load-ok es store-ok. a procik szoktak ezeknek a felcserelgetesevel is jatszani, de most arrol van szo, hogy ha a csoben van ket utasitas, az elso h tarolj le valamit egy cimre, a masodik meg az h olvass be valami egy cimrol, akkor nem az tortenik h letarolja a memoriaba es az olvasashoz pedig onnan olvassa ki (osszeadodva a ket kesleltetes), hanem rajon h a ket cim ugyanaz, nem kell beolvasni az adatot mert meg epp megvan, tehat odaadja a load-nak, renget idot nyerve. ez a store-to-load forwarding (STLF).
    a PSF annyival lenne okosabb, hogy meg sem varja meg a cimek feloldasat sem, hanem megsaccolja korabbi STLF parok alapjan h a store tartozhat-e valamelyik load-hoz.

    nem kizart, hogy hosszabb pipeline eseten nagyobb lehet a nyereseg (es a veszteseg is hibas elorejelzes miatt), szoval az is lehet h magat a ficsort tesztelik zen3-ban, de csak pl a zen4 v zen5 kesobbi modositaival lesz nagyobb haszna. csak spekulalok. :)

    koszi,
    &rew

  • ddekany

    veterán

    válasz DraXoN #54 üzenetére

    De nem az a baj (legalább is általában), hogy nem tudják milyen folyamat számára dolgoznak előre. Egyrészt előre dolgoznak olyan ágakon, amiket esetleg majd vissza kell görgetni, ami meglepő lehet, ha program logika valójában soha nem ment volna arra. Másrészt ha még ez a tippelgetés sincs, akkor is esetleg "kitapogatható" lehet időzítésekkel, hogy a másik kód melyik ágakon járt, amihez pedig a hívónak semmi köze. És ez utóbbival már nem könnyű általánosságban tenni valamit.

    Az, hogy az utolsó pár kis %-ért is rakás trükköt betesznek, meg alighanem a túlzottan kiélezett verseny következménye. Ezzel sem tudom mit lehet kezdeni, mert kell a verseny.

Új hozzászólás Aktív témák