Új hozzászólás Aktív témák
-
ricsi99
addikt
Mind1 minek hívod a gyereket... lassabb ,nem is kicsivel....
Ez a töbszálú kezelés persze lehetséges ,nem vagyok profi szoftweres így bármi szöveget kiadnak akkor bizti úgy van... én meg öreg csataló vagyok és old school programokat is futtatok ami eléggé csak egyszálas (le is korlátozom mert úgy a tuti) és ott is érezhető a különbség... ami szomorú hogy nagyon sok laptop amit kiadnak azért gyengébb mint az én ocskavasam és azokon még erősebben érezhetőbb ezek az optimizációk... aztán meg "lükének" néznek ,ha nem a friss wint ajánlom... de ez már más kérdésEgy Gyűrű mind fölött, Egy Gyűrű kegyetlen, Egy a sötétbe zár, bilincs az Egyetlen...
-
#25954560
törölt tag
"Ennek csak az lehet az oka, hogy kód nem lett teljesen AMDre optimalizálva korábban. "
nem csak az lehet az oka bar egyreszt egyetertek veled.a psf csak zen3-mal jott be, tehat ha vannak is trukkok, amiben tud segiteni a fordito, egyreszt lehet h csak a legmodernebb verziok tudjak, masreszt nem kizart h explicite engedelyezni is kene forditaskor ha a fordito nem teszi meg es a phoronix-os ~100 alkalmazas
--with-tune=generic
-kel forgott, sima gcc10.2. nem mondom h mas eredmeny lett volna mas forditoval vagy maskepp parameterezve, de nem kizart. a teszt igy is ervenyes, hiszen tudni lehet h mivel teszteltek.masik ok, amiert nem biztos h erdekes az AMD-re optimalizaltsag az az, hogy a PSF egy elegge alacsonyszintu hardveres megoldas ha jol ertem, nem biztos h egyaltalan meg lehet tamogatni forditassal.
ha ugyis tudod mi ez, akkor bocs, ugord at legyszi ezt a bekezdest. nagyon konyhanyelven arrol van szo, hogy a pipeline-ban vannak load-ok es store-ok. a procik szoktak ezeknek a felcserelgetesevel is jatszani, de most arrol van szo, hogy ha a csoben van ket utasitas, az elso h tarolj le valamit egy cimre, a masodik meg az h olvass be valami egy cimrol, akkor nem az tortenik h letarolja a memoriaba es az olvasashoz pedig onnan olvassa ki (osszeadodva a ket kesleltetes), hanem rajon h a ket cim ugyanaz, nem kell beolvasni az adatot mert meg epp megvan, tehat odaadja a load-nak, renget idot nyerve. ez a store-to-load forwarding (STLF).
a PSF annyival lenne okosabb, hogy meg sem varja meg a cimek feloldasat sem, hanem megsaccolja korabbi STLF parok alapjan h a store tartozhat-e valamelyik load-hoz.nem kizart, hogy hosszabb pipeline eseten nagyobb lehet a nyereseg (es a veszteseg is hibas elorejelzes miatt), szoval az is lehet h magat a ficsort tesztelik zen3-ban, de csak pl a zen4 v zen5 kesobbi modositaival lesz nagyobb haszna. csak spekulalok.
koszi,
&rew -
ddekany
veterán
De nem az a baj (legalább is általában), hogy nem tudják milyen folyamat számára dolgoznak előre. Egyrészt előre dolgoznak olyan ágakon, amiket esetleg majd vissza kell görgetni, ami meglepő lehet, ha program logika valójában soha nem ment volna arra. Másrészt ha még ez a tippelgetés sincs, akkor is esetleg "kitapogatható" lehet időzítésekkel, hogy a másik kód melyik ágakon járt, amihez pedig a hívónak semmi köze. És ez utóbbival már nem könnyű általánosságban tenni valamit.
Az, hogy az utolsó pár kis %-ért is rakás trükköt betesznek, meg alighanem a túlzottan kiélezett verseny következménye. Ezzel sem tudom mit lehet kezdeni, mert kell a verseny.
Új hozzászólás Aktív témák
- Beszámítás! Intel Core i7 7700K 4 mag 8 szál processzor garanciával hibátlan működéssel
- Intel I5 13600KF 14mag/20szál - Új, Tesztelt - Eladó! 88.000.-
- Intel I7 13700K 16mag/24szál - Új, Tesztelt - Eladó! 128.000.-
- Beszámítás! Intel Core i5 4690K 4 mag 4 szál processzor garanciával hibátlan működéssel
- Intel Core i7-11700K processzor (használt)