-
GAMEPOD.hu
AMD FX processzorok topikja
- AM3+ tokozás
- Nyolc, hat, vagy négy mag
- DDR3-1866 RAM támogatás
- Szorzózármentes modellek
Új hozzászólás Aktív témák
-
#95904256
törölt tag
Nem értem, mi a baj azzal, hogy clock-to-clock lassabb a Denebnél.
Ezt előre lehetett tudni, mivel a Bulldozert új koncepció alapján tervezték.Cserébe kapsz 8 magot, magasabb órajelet, flexFP-ét, AVX-et, XOP-ot, stb...
Összességében ugyanazért a pénzért nagyobb teljesítményt nyújt. -
#95904256
törölt tag
Miből következtetted ki, hogy a Deneb gyorsabb nála?
Másfelől tudod mi az a FlexFP? Az ami az Intel procikban nincs...
Ha ott megkínálod pl. a Sandy Bridge mind a 8 szálát egy SSE kóddal, akkor csak az FPU-k fele működik, míg a Bulldozernél az összes. Anélkül, hogy AVX-re lenne fordítva kód, ki lehet használni az egész FPU-t. -
#95904256
törölt tag
Teljesen egyetértek azzal az állítással, hogy "ipc cannot be scaled up without huge power drawbacks. Both ipc/frequency should have a good relation to have proper performance.".
De ha a Bulldozer a magasabb fogyasztásával (FX-8150 / 125W) csak az IGP-vel együtt is kevesebbet fogyasztó Sandy Bridge (Core i7-2600K / 95W) processzorral lesz versenyben, akkor bizony nagyon úgy tűnik, hogy túllőttek a "good relation"-ön.
-
#95904256
törölt tag
Kis kiegészítés, hogy mi is az a "Dark silicon" ugyanis ez nem közvetlen oka annak, hogy nincs 8 magos 32nm-es processzor.
"Dark silicon" az a terület a processzoron belül, ahol nincs működő tranzisztor. Erre azért van szükség, mert ha 100%-ban telitömnék tranzisztorral a lapkát és azokat mind magas órajelen működtetnék, akkor oly nagy lenne a hőtermelés amit a jelenlegi módszerekkel nem lehet elszállítani. A "dark silicon" jelenleg kb. 20%-a lapkának...
szerk.: Mire sikerült befejeznem a hozzászólást, márt Abu rég leírta a dolgot.
[ Szerkesztve ]
-
#95904256
törölt tag
Ha jól értem, akkor abból lehet előnyt kovácsolni, hogy az ütemező úgy csoportosítja a szálakat, hogy minél kevesebb modul működjön, mert így emelhető a működő modulok órajele. Mivel az Intel processzorokban is van Turbo Boost, így megfelelő ütemezés ott is előnyt jelenthet.
-
#95904256
törölt tag
(#446) dezz: "Mintha nem tudnád, hogy az AMD féle CMT teljesen más, mint az Intel féle SMT (HT)... Valamelyik tesztben van erről egy rész, hogy hány %-ot nyerhetne a BD a megfelelő ütemezéssel."
Ez azért nem olyan egyértelmű.
Ugyanis CMT esetén minden magnak dedikált erőforrásai vannak.
Ha egyszer minden magnak dedikált erőforrásai vannak, akkor miért számít, hogy melyikre ossza ki az ütemező a feladatot? -
#95904256
törölt tag
Ebben a hozzászólásban egy szó sem volt a Turbo-ról:
"Mintha nem tudnád, hogy az AMD féle CMT teljesen más, mint az Intel féle SMT (HT)... Valamelyik tesztben van erről egy rész, hogy hány %-ot nyerhetne a BD a megfelelő ütemezéssel."
Ezért írtam, hogy "Ez azért nem olyan egyértelmű."
Megjegyzem, a turbo miatti ütemezés előnyét én is leírtam, de az nem egyenlő a CMT miatti ütemezés előnyével. ( CMT <> Turbo )
-
#95904256
törölt tag
válasz Cybertrone #466 üzenetére
(#466) Cybertrone: "Addig míg nem jön el a jövőkép miért kelet a lebegő pontos számításokat visszafogni?"
Egyrészt nincs visszafogva, ugyanis nem lett csökkentve a lebegőpontos egységek száma. Csak az utasítások késleltetési idejei nőttek, ami programkódtól függően jelenthet lassulást. GFLOPS-okban mérve épp 33%-kal tud többet a 8 magos Zambezi a 6 magos Thubanhoz képest.
Azonban, az AMD a Bulldozerben vezette be az FMA ( fused multiply add ) elgondolást, aminek velejárója, hogy növekszik a késleltetés. A nagyobb késleltetés abból adódik, hogy több lépcsőben jut el a bemenettől a kimenetre az eredmény. A több lépcsőre bontásnak viszont van egy olyan előnye is, hogy egyszerűbb lépcsők esetén magasabb órajelre lehet tervezni az áramkört.
Szóval a nagyobb késleltetési időt kompenzálja ( valamennyire ) a magasabb órajel, így erről az oldalról nézve sem olyan vészes a helyzet...
-
#95904256
törölt tag
válasz FireKeeper #483 üzenetére
Az AMD FX procinál ne nézd a fogyasztást...
A magasabb órajel miatt magasabb feszültség is kell, amivel négyzetesen nő a fogyasztás. Gondolom az AMD-nél úgy gondolkodtak, mint ahogy az NVidiánál is szokás a presztizs termék esetén, hogy aki ilyet vesz annál
nemkevésbé számít a fogyasztás...[ Szerkesztve ]
-
#95904256
törölt tag
(#487) polonic: "Azért ne egy még béta állapotban nem lévő oprendszer alatt mért eredmény alapján mondjuk ki a végső szót. Ezt még nem tudhatjuk, hogy mennyi lesz a valós teljesítménynövekedés."
Azt azért kimondhatjuk, hogy ha a Turbo kihasználása a cél, akkor a max. ~15%-os Turbo esetén max. ~15%-os teljesítmény növekedés várható az új ütemezőtől.
[ Szerkesztve ]
-
#95904256
törölt tag
Jól tudom, hogy a Bulldozer hagyományos FMA felépítést alkalmaz?
Vagyis összeadásnál is működik a szorzóáramkör és fordítva is...Ez alatt azt értem, hogy "régebben" egy összeadás úgy nézett ki, hogy x=a+b, míg a szorzás x=a*b. Az új felépítés szerint pedig FMA szerint pedig x=a*1+b illetve x=a*b+0.
Mert az FMA-nak nem csak előnyei vannak...
"hagyományos" FMA kontra FADD/FMUL felépítés:
Előnyök:
- FMA végrehajtás gyorsabb, mint egy FMUL+FADD páros
- kisebb lapkaméret
- 0,0000000000000000002%-kal pontosabb eredményHátrányok:
- nagyobb fogyasztás
- sima összeadás / szorzás esetén nagyobb késleltetés
- nem futhat párhuzamosan egy független FADD és egy független FMUL -
-
#95904256
törölt tag
válasz FireKeeper #557 üzenetére
Előbb lesz AVX optimalizáció, mert azt a Sandy is tudja...
De az kb. olyan lesz a Sandy-knál, mintha a fékről a gázra taposnál.
-
#95904256
törölt tag
(#595) dezz: "Szerintem tök egyértelmű az ütemezés és a turbó kapcsolata. Ki tehet róla, hogy nem jutott az eszedbe?"
(#446) dezz: "Mintha nem tudnád, hogy az AMD féle CMT teljesen más, mint az Intel féle SMT (HT)... Valamelyik tesztben van erről egy rész, hogy hány %-ot nyerhetne a BD a megfelelő ütemezéssel."
Szóval továbbra sem a CMT miatt lesz nyereség, hanem a turbó miatt.
-
#95904256
törölt tag
Attól, hogy hülyének próbálsz beállítani, nem leszek az.
De ezt már többször megtárgyaltam veled, több témában.Légy szíves, olvasd már el és értelmezd, hogy mit írtál a #446-os hozzászólásodban.
(#446) dezz: "Mintha nem tudnád, hogy az AMD féle CMT teljesen más, mint az Intel féle SMT (HT)... Valamelyik tesztben van erről egy rész, hogy hány %-ot nyerhetne a BD a megfelelő ütemezéssel."
Teljesen egyértelműen azt állítod, hogy a BD a megfelelő ütemezéssel azért nyerhet %-ot, mert az AMD féle CMT teljesen más, mint az Intel féle SMT (HT). Nem a turbót okolod, hanem a CMT és SMT közti különbséget. Továbbra is kíváncsi vagyok, hogy miért.
-
#95904256
törölt tag
(#624) dezz: "A HT és az CMT közötti különbség leginkább a turbó miatt fontos, az ütemezés szempontjából. Eléggé nyilvánvaló, nem? (A megfelelő párosítás HT-nál sem mellékes.) "
Na, ez az amit eddig nem írtál le. Egyébként nem nyilvánvaló. Hogy miért?
Egyrészt CMT-vel nem jár együtt a turbó. Két külön dolog.
Másfelől, mint ahogy írtad a megfelelő párosítás még akár HT-nak is kedvezhet.
Épp ezért cseppet sem egyértelmű az alábbi kijelentésed:
(#446) dezz: "Mintha nem tudnád, hogy az AMD féle CMT teljesen más, mint az Intel féle SMT (HT)... Valamelyik tesztben van erről egy rész, hogy hány %-ot nyerhetne a BD a megfelelő ütemezéssel."
Ennyi erővel arról is lehetne teszt, hogy mennyit nyerhetne a HT a megfelelő ütemezéssel.
[ Szerkesztve ]
-
#95904256
törölt tag
(#791) Jack@l: "Akkor4 már csak egy kérdésem van, ki lehet kerülni szimpla összeadáskor az fma áramkört bullban?"
Nem. A Bulldozerben az összeadás úgy néz ki, hogy X = A * 1 + B.
szerk.: Megjegyzem, ezt nem lehet kimérni. Csak itt-ott fellelhető hírmorzsák és a FADD és FMUL esetén is 6 órajeles késleltetés árulkodik erről...
[ Szerkesztve ]
-
#95904256
törölt tag
Nem.
Az FMA-nak alapvetően kétféle megoldása létezik a "regular" és "bridged". A "regular" a helytakarékos megoldás, a "bridged" pedig az összedrótozott FADD - FMUL. Mindegyiknek vannak előnyei és hátrányai a másikkal szemben. A Bulldozer esetén minden jel arra mutat, hogy az AMD az előbbi megoldást alkalmazta.
-
#95904256
törölt tag
válasz Oliverda #842 üzenetére
Jack@l kérdése tesztre vonatkozott, nem valós alkalmazásra. A WinRar-nak és a 7-Zip-nek is van beépített tesztje. Én ezeket ajánlottam, mint teszteket. A valós adatok tömörítése sokmindentől függ, így ott lehetnek "anomáliák".
WinRar 4.01 -> Eszközök -> Hardware és sebesség teszt
7-Zip 9.20 -> Eszközök -> TeljesítménymérésNálad a beépített tesztek sem terhelik mindegyik szálat?
Egyébként az előbb kipróbáltam egy 2 magos, 4 szálas Core i5-ön egy 16GB-os fájl tömörítését. Nos valóban érdekesen terhelődtek a szálak, de a feladatkezelőben jól látszott, hogy mind a négy szálat terhelte mindkét program.
-
#95904256
törölt tag
Ha jól sejtem, akkor a BOINC ismerős a számodra.
A BOINC alkalmazások is megfelelnének neked?Ezek ugyan nem többszálú programok, de a BOINC több munkacsomaggal képes egyszerre az összes magon/szálon elindítani egy-egy feldolgozást.
Pl. az előbb néztem a forráskódját és hotspotjait az ABC@Home projekt ABC sieving finder 2.10 alkalmazásnak. Csak integer utasításokat találtam...
-
#95904256
törölt tag
ABC@Home egy tisztán számelméleti alkalmazás. Semmi köze a biológiához és a földönkívüliekhez.
Az overhead dolgot nem értem. Az ütemezés a BOINC dolga.
szerk.: A BOINC meg úgy ütemez, hogy ha lefutott egy munkacsomag, akkor indítja a másikat. Szóval nincs semmiféle ide-oda pakolom móka...
[ Szerkesztve ]
-
#95904256
törölt tag
válasz FireKeeper #1025 üzenetére
A típusnév ( FX ) biztosan marad.
Valószínűleg lesznek olyan változatok amelyekből csak C0 steppinges lesz ( pl. FX-8170 ), de a "kupakon-lévő-kód-elemezgetése módszer" a legbiztosabb.
[ Szerkesztve ]
-
#95904256
törölt tag
Ugye tudod, hogy lebegőpontos számításokra az x87, SSEx, AVX utasítások ugyanazt az FPU-t használják?
Ha x87-ben X % az eltérés AMD és Intel közt, akkor SSE és AVX kódban is annyi...
Másfelelől a "desktopon semmi sem használja az x87-et" is egy érdekes kijelentés. Ugyanis ez való igaz. Helyette egy csomó helyen skalár SSE kóddal találkozik az ember. Micsoda megváltás. ( Nem programozóknak: A skalár SSE gyakorlatilag kétszer akkora kódméret mellett ugyanazt a teljesítményt adja, mint az x87. )
-
#95904256
törölt tag
válasz Oliverda #1102 üzenetére
Épp azt fejtegettem, hogy attól, hogy valamit SSE-re / AVX-re fordítanak nem feltétlenül lesz gyorsabb.
szerk.: De az is lehet, hogy csak nem értettem, mire írtad azt, hogy kijönne.
(#1102) Oliverda: "Ez remek, csak éppen nem nagyon real life app aminél ez kijönne."
[ Szerkesztve ]
-
#95904256
törölt tag
válasz Oliverda #1109 üzenetére
Az előző hozzászólásodból számomra nem volt egyértelmű amit mondani akartál. Köszönöm, hogy leírtad számomra is érthető formában.
Szóval ha van egy "real life appom" amit lefordítok x87 illetve SSE kódra, akkor az előbbi kedvezőbb esetet jelent az Intel processzor számára. Ez érdekes felvetés, nem látom az okát. Ezt alá tudnád támasztani valamivel? Egy teszttel vagy az okok felsorolásával...
Megköszönném.
-
#95904256
törölt tag
válasz subaruwrc #1628 üzenetére
Elvileg ezért lehet hasznos:
(#1615) dezz: "Viszont, egy olyan előnye van a nagyobb FX-eknek a kisebbekhez képest, hogy a sok magból minden másodikat (modulonként egyet) letiltva +10% teljesítmény hozható ki a játékoknál."
Egyébként van olyan lap ami ezt tudja?
Másfelől tényleg ennyit számítana?
Elvileg a CMT miatt dedikáltak az erőforrások, csak a front-end közös modulon belül. A dedikált erőforrás letiltása biztosan nem segít. Ezek szerint a front-end lesz hatékonyabb? ( A 256-bites AVX / FMA meg egy jó darabig még biztosan ritka lesz. )Harmadszor, eddig épp azon ment a vita, hogy a milyen jó lesz ha a Win8 majd minél kevesebb modulra ütemezi az összetartozó szálakat, mert akkor akár +15%-os teljesítmény is kihozható...
Szóval, egyelőre kérdéses a dolog.
[ Szerkesztve ]
-
#95904256
törölt tag
válasz VaniliásRönk #1636 üzenetére
A FlexFP-én osztozkodás csak 256-bites AVX kód esetén lehetne jelentős probléma, de ott is csak elméleti, mert ebben az esetben már a dekóderek sem tudnának kellő mennyiségű utasítást behozni...
Megjegyzés: Szóval a "modul" remekül egyben van, de teljesítmény szempontjából valóban találóbb a Phenom-ok után másfél magnak tekinteni, mint kettőnek.
[ Szerkesztve ]
-
#95904256
törölt tag
-
#95904256
törölt tag
Sziasztok!
Szeretnék építeni még egy gépet 64GB RAM-mal, de most AMD FX processzorral.
Ez megoldható? Vagy épített már valaki ilyet?
Valami működő konfigot szeretnék lemásolni...
Új hozzászólás Aktív témák
A nem témába vágó beszélgetésekhez keressétek fel a (nemcsak) FX-tulajdonosok bazi nagy OFFolós topicját, vagy az AMD offtopikot!
- Counter-Strike: Global Offensive (CS:GO) / Counter-Strike 2 (CS2)
- Telekom mobilszolgáltatások
- Ukrajnai háború
- DIGI internet
- PlayStation 5
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- iPhone topik
- aquark: Milyen „light” RPG-t ajánlanátok kezdőnek?
- Politikai mémek
- Konzolokról KULTURÁLT módon
- További aktív témák...