-
GAMEPOD.hu
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
VaniliásRönk
nagyúr
Hohó, hogy a két video egészen más. Én a másodikkal kezdtem, és nem bírtam tovább 2 percnél, lehet itt csúszott porszem a gépezetbe, az elsőt akkor megnézem.
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
VaniliásRönk
nagyúr
Hát ha abból indulunk ki, hogy az AMD még nem reklámozott ''industry leading-nek'' olyan termékeket, mint a Katmai, Coppermine és Willamette, akkor elvileg ezen nem kellett volna izgulnia.
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
dezz
nagyúr
Illetve ez elsősorban nem is a Barcelonáról szól, hanem az AMD jövőbeli terveiről, részben a korábbi WRT-s cikkre alapozva, melynek - megkérdőjelezhető, lásd korábban - konklúziója az volt, hogy a Barcolona majd inkább csak a multithreaded szerver applikációkban előzheti meg az Inteles vetélytársait, nem pedig a desktopon (legalábbis a korábbi 2.5 GHz-es max. órajelből kiindulva, ami viszont ugyancsak változott állítólag, felfelé). Ebből, és az ATI-s akcióból (GPU alapú számítások) kiindulva tehát arra jutnak, hogy az AMD inkább a szerver vonalra koncentrál, az Intel pedig a desktopra és a mobil vonalra. Számomra nem túl meggyőző...
[Szerkesztve] -
P.H.
senior tag
Egy darabig az AMD tartotta magát az Intel-étől teljesen nomenklatúrához (például micro-op vs uop), teljesen jogosan, mert a funkcionális egységek azonos szinten is teljesen mást jelentenek (Intruction Control Unit vs Reorder Buffer), ez mára egy kissé összefolyt, nem kevés kavarodást okozva.
Kezdve ott, hogy az AMD-féle micro-op sokkal általánosabb, mint az Intel uop-ja, tekintve, hogy ez utóbbinak legfejlebb 2 bemeneti értéke lehet. Egyszerűbb esetben pl. az olyan utasítások, amik bemeneti értékként valamely flag-et is használják, mint az ADC reg,reg (eredmény=reg+reg+CarryFlag) két uop-ra fordulnak Intel esetében. Bonyolultabb ez eset címzéseknél: általános címzési forma a reg+reg*scale+offset (scale lehet 1,2,4,8), PPro-tól kezdve egészen Core2-ig lehet találni olyan információkat, hogy ezesetben nem egy uop-ra fordul a címgenerálás, hanem bizonyos ALU-műveletek sorozatára, ha nem csak reg, reg+reg vagy reg+offset formájú. Kardinális kérdés ez Netburst alatt lett amiatt, hogy a reg*scale kiszámítását egy külön shift uop végezte, aminek futása egyetlen portra korlátozódott (port1, complex ALU), 3 órajel latency mellett. Prescott-tól talán ezt kiküszöbölték, a latency 1 lett, kérdés, hogy mennyi maradt meg ebből a Core-családra.
uop-fúzió két esetben lehet Intel-nél, read-modify és store. Előbbinél a load+op egyesül (ez hasonló az AMD load+op macro-opjaihoz), utóbbi azt a kellemetlenséget szünteti meg, hogy egy store operation két uop-ból áll, store_address és store_data (maga a transfer), ezek két külön portra kerülnek még mindig, de decode után együtt haladnak. Ez AMD-nél egy uop, és ha hozzávesszük, hogy egy load+op+store (= op mem,reg) AMD-nél egy macro-op két micro-oppal, Intel esetében összesen 4 uop, amiból a load+op és a store_address+store_data két fuzionált párost alkot, akkor is lemaradásban van még AMD-vel szemben. Ráadásul ez a uop-fúzió a decode utáni lépés, tehát a 4-1-1-1 decoder-szélesség még mindig limitáló tényező.
Makro-opfúzió csak igen speciális esetekben lehet, csak bizonyos feltételes ugrások (amik nem kezelik az Overflow Flag-et, tehát csak előjeltelen esetben) és az azokat közvetlenül megelőző CMP vagy TST utasítások (amik céloperandusa nem memória) fuzionálhatnak. Ráadásul mindez 64 bites módban nem is működik Core2 esetén.
Ez előző, AMD pre-decode-dologhoz: zavart eléggé, hogy tényleg erőltetettnek tűnt az én mondatértelmezésem Raymond-ével szemben. Kérdezted, hogy ''lehetséges-e tetszőleges ponttól kezdve keresni a köv. utasítást'', erre én írtam, hogy ''gyakorlatilag tetszőleges belépési pontban értelmes utasítás találtható.''. A kettő nem zárja ki egymást, ha adott egy egység, ami párhuzamosan a beolvasott 16 (K10 esetén 32) byte-os ablak minden egyes byte-jától meghatározza az ott kezdődő utasítást. Kevesebből nem érdemes, az nem visz előre. Ha ez megvan, és adott az első utasítás belépési pontja, akkor akár egy órajel alatt ki lehet szűrni a 16/32 utasításból a valósakat. No de ki az az őrült, aki ilyen nem egyszerű felépítésű egységből - ismernie kell a teljes utasításkészletet - 16-ot (vagy 32-t) tesz egymás mellé egy CPU-ban.
Hát, az AMD az. Az adott szekcióból Raymonddal szinte az összes mondatot beidéztük, gyakorlatilag csak a lényeget nem (én teljesen átsiklottam felette akkor).
A second instruction can not be decoded until the length of the first instruction is known. The start position of the second instruction depends on the length of the first instruction. The massively parallel pre-decoder avoids this problem by first pre-decoding the 16 possible instructions in parallel. Each instruction starts at one of the 16 byte locations of the 16 byte line. It then filters out the real instructions with the help of the program-counter which points to the start byte of the next instruction, depending on where we jump into the 16 byte line.
[link]
K8 esetében egy-egy alapegység 1 órajel alatt meghatározza az adott byte-nál kezdődő utasítás hosszát és jellegét, 4-4 ilyen egység egy blokkba van rendezve, és 4 ilyen blokk van. Tehát 1 órajel alatt megjön az eredmény mind a 16 egységtől, amiből következő órajelben a Start/End Fixer/Sorter az ismert belépési pont segítségével kiszűri, melyek a valós utasítások. Intel esetében valószínűleg (legalábbis bizonyos esetekben) áll a step-by-step predecode, márcsak abból kiindulva, hogy az adatméret- vagy címméret-módosító prefix-szel ellátott utasításokat újra kell értelmeznie, információk szerint 6 órajel alatt (adatméret prefix pedig ismerős lehet SSE2-utasítások esetén).
Kicsit leült a hét elején, én az utóbbi 5 napban a Csabai Sör- és Csülökfesztiválra fordítottam az érdeklődésemet. Mondjuk inkább a sör-részére, mert csülköt én is tudok elkészíteni, sört viszont nem tudok főzni
[Szerkesztve]Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙
-
P.H.
senior tag
Általában a hivatalos gyártói dokumentációkra szeretek hagyatkozni, de én is ezt olvasgatom már majd' két hete. A szerző és foglalkozása, a last update dátuma és a bevezető általános leírások meggyőzőek.
Hivatalos Intel guide-okban én eddig csak a uop formát találtam.
A Prescott-os mondatom utólag olvasva eléggé félresikeredett, arra gondoltam, hogy abból, hogy a komplex címek ALU-uopok sorozatára fordulnak le, abból mennyi maradt meg (PPro-P2-P3 is 1 órajel alatt számolt shift-et, de már azok optimization guide-jában is szerepel, hogy it may change in the future implementations, Változott, nem előnyére). Végülis Core-vonalon nincs double-pumped ALU, és se a decode, se a uop-fusion nem hatékony, ha egy [esi+edi*8+record.offset] címszámítás 3 vagy 4 uop-ra fordul le.
És így végiggondolva, az Intel CPU-k hatalmas uop-gyárak, egy egyszerűnek látszó utasítás is elég sok uop-ra fordulhat le. Emellett a 4-1-1-1 decoder-felállás és a ROB mérete igen szűkös.
[Szerkesztve]Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙
-
#95904256
törölt tag
Dezz, néha becsinálok azon amit az AMD mond. Ez a majd ''45nm-en lesz gazdaságos'' dolog is egy kicsit fura. Meg az is hogy a Brisbane magos processzorok gyorsítótára azért lassabb mert így majd nagyobbat lehet gyártni. Na jó, de melyik Brisbane magos prociba tudom utólag belerakni a nagyobb gyorsítótárat? Gondolom a 65nm-es processzorhoz meg majd zsugorítót fognak árusítani...
Az hogy egy vezérlés egyszerűbb vagy bonyolultabb, nem lényeges a számunkra ha ugyanazt a teljesítményt nyújtja. Viszont ami egyszerűbb, azt könnyebb fejleszteni. -
7600GT
senior tag
Köszi
És még egy kérdés.
Mi fogja kihasználni a 4 magot?
Mert, láttam rengeteg összehasonlító tesztet a 2 magos és a 4 magos intel-ekről és csak nagyon kevés tetsztben volt észre vehető különbség.
Igaz ott volt vagy 50%.
Tehát ha mondjuk én játékra venném akkor nekem nem éri meg a 4 mag?
Illetve mikorra lesznek nagy mennyiségben olyan progik amik ki is használják?
[Szerkesztve]Ha az ember féreggé teszi saját magát, ne csodálkozzon, ha rátaposnak.
-
-
Raymond
félisten
Az Anandtech (Barcelona-hoz egyebkent nem kotodo) Athlon X2 BE-2350 cikk elso bekezdese sem biztato sajnos:
''Those hoping for nail biting, teeth clenching battles should apply elsewhere - the CPU wars these days is a one horse race. If reports out of Taiwan are to be believed, initial performance results from AMD's Barcelona fail to impress and we've got at least a quarter before the race can even potentially get competitive. But as we've seen lately, you don't need chart topping performance to bring excitement to the game.''
[link]Privat velemeny - keretik nem megkovezni...
-
Raymond
félisten
Nem a pov-ray eredmenyekrol van szo (lasd elozo hsz). Azokbol egyebkent az 1.6Ghz eredmeny lett visszafejtve a megadott szamok alapjan.
Nem tudom mi akar lenni az a ''9 instructions''.
Torrenza: A Cray volt az egyik elso ceg aki a tamogatasat megerositette. Mar a torrenza elott is foglalkoztak Opteronos gepekkel es gondolom tudtak a tervrol meg a bejelentes elott
Ja meg a Cray-hez kapcsolodik hogy elmeletileg a budapest van eltolva nem a Barcelona:
[link]
[Szerkesztve]Privat velemeny - keretik nem megkovezni...
-
Komplikato
veterán
Hajlanék erre az A64 X2 csere Phenom X2-X4-re, de elvileg a géphez max. VGA szinten akartam egy éven belül hozzányúlni, vagy se. C2D meg nem szempont gizdulásból, ellenben igen jól húznak játékok alatt, meg multimédiában. Meg jól húzhatóak. Bár mostanság vannak érdekes pletyik Brisbane ügyben ...
"Figyelj arra, aki keresi az igazságot és őrizkedj attól, aki hirdeti: megtalálta." - (André Gide)
-
aktív tag
Köszönöm az infókat, abban biztos voltam, hogy nem a jövő héten jön ki egy ilyen proci az AMD boszorkánykonyhájából, de így már sok kérdésemre megvan a válasz
azért arra továbbra is kiváncsi vagyok, hogy az intel hogyan kivánja realizálni a 8 magot és az FSB-vel milyen tervei vannak illetve olyan hirek szállíngóztak, hogy 4 magot még kibír az intel féle fsb-s rendszer, de 8 magnál olyan szinen kevés, hogy sem a memóriával nem tudja magát etetni, sem a magok közötti kommunikációra nem elég.
mod: Keldor papa neked is köszi az infót
[Szerkesztve] -
VaniliásRönk
nagyúr
Az AMD fejlesztette ki, szerintem nem lehet elmarasztalni őket a névválasztás miatt. Amit viszont nem értek, hogy miért adták el az Intelnek akkor, amikor ők voltak nyeregben, nagyon keményen oda lehetett volna vágni vele, ráértek volna a C2D után is eladni, akkor az Intel elmehetett volna a kóróval a *****
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
#95904256
törölt tag
Hali dezz!
Az eredményeket átlagolva a tesztelt Penryn (3,33GHz) 35%-kal gyorsabbnak mutatkozik mint a QX6800 (2,93GHz). Az órajelet ''közös nevezőre hozva'' ( 35 * 2,93 / 3,33 ) is 30%-os előny mutatkozik. Nem 6-11%.
Az ''SSE4a'' meg csak ámítás. Csak az EXTRQ , INSERTQ , MOVNTSD , MOVNTSS utasításokat takarja. Amiből valjuk be őszintén igazából csak utolsó kettő az amivel talán találkozni is fogunk ( cache-t nem szennyező tároló utasítások ) a gyakorlatban.
Az Intel féle SSE4 viszont rengeteg új utasítást tartalmaz. Köztük egy pár lebegőpontos számítást támogató utasítással. Mivel a lista hosszú, így csak egy linket adnék. [link]
A memóriahozzáférés valóban jobban van megoldva a K10-nél, de most már látni is szeretném hogy ez mit jelent a gyakorlatban.
[Szerkesztve] -
#95904256
törölt tag
Hali dezz!
Az ilyen egyszerű átlagolás értelmetlen.
Ott, azok az adatok szerepeltek. Az átlagolás egy köztes eredményt ad. Nem mindenki számára a megfelelőt, de egy demokratikus átlagot. Egyébként az ott szereplő adatokból jobb átlagot nem tudok számolni. Vagy ezek szerint értelmetlen volt maga a teszt is, ezzel együtt az a hozzászólásom is amiben linkeltem. Hm... néha előfordul.
Tessék súlyozni egy kicsit.
Na, ez a legyünk részrehajlóak kategória. Mi alapján súlyozzak? Nem láttam ehhez táblázatot. Vagy számoljak úgy hogy még kedvezőbb legyen az Intelnek?
A Penryn műveletvégzőit meg ne tessék lenézni, mert bizony tartalmaz pár erős meglepetést az AMD-nek. Mint pl. a ''Radix16'' osztómű ami állítólag kétszer gyorsabban oszt és nagy valószínűséggel pipe-olt vagy a 128 bites super shuffle engine ami 1 ( azaz egy ) órajel alatt képes az SSE shift műveletekre. Pl. A K10 és a Core 2 is csak 2 órajelenként tud indítani egy SHUFPx, UNPCKLxxx, utasítást, és ezek a műveletek bizony sok kódban hemzsegnek. Ezen kívűl az Intel-es weboldalon olyasmi is szerepel hogy az IPC értékre is rágyúrtak, meg sokminden másra... -
#95904256
törölt tag
Osztó utasítások latency/reciprocal throughput értékei (K10, Core2) :
single precision: 18(20)/15 , 6-18/5-17
double precision: 20(22)/17 , 6-32/5-31
integer 32 bit: 39 (K8) , 18-42/12-36
integer 64 bit: 71 (K8) , 29-61/18-37
Úgy tűnik egyedül a 64 bites lebegőpontos osztásban van csak lemaradása az Intelnek. Remélem nem csak erre vonatkozik a dupla sebesség.
Az AMD egyébként az osztás megfelelő szorzással helyettesítését ajánlja, mert az meg eleve jóval gyorsabb.
Ezt az Intel is ajánlja.
[Szerkesztve] -
Raymond
félisten
''Szal úgy érted, az AM2 lábkiosztásában már elkülönülnek ezen plane-ek, csak a mai alaplapokon még össze vannak kötve?''
Valahogy ugy. A chip tudja fuggetlenul attol hogy AM2 vagy AM2+ megy alatta de csak az utobbi lap tudja biztositani a kulonallo ellatast.
Az az utolso idezet nekem olyan ''cover all our bases'' tipusunak tunik. Hogy ne mondhassa senki ha veletlenul 2.3-on kijon hogy nem szoltak Vagy az is lehet hogy mert az utobbi par heten/honapban eleg sok pozitiv AMD-s cikk volt az Anandeknal probaljak kicsit higitani a rossz hireket.
Szvsz Agena FX ugyanugy a ketutas server/workstation chipekbol lesz mint eddig ugyhogy eloszor a Barcelona-bol. Aztan majd ahogy jon a tobbi.Privat velemeny - keretik nem megkovezni...
-
Komplikato
veterán
Valamelyik plyetkaoldalon láttam valami olyat, hogy egy új mag 2.8GHz-en ketyeget ...
Meg volt ugyanazon oldalom egy kivehetetlen screenshot ami egy 2x4 magos gép priterheltségét mutatta. Nem tudom mi futott rajta, de közel 100%-on volt mind a 8 mag."Figyelj arra, aki keresi az igazságot és őrizkedj attól, aki hirdeti: megtalálta." - (André Gide)
-
#95904256
törölt tag
Hali dezz!
Úgy tűnik hogy az hogy egyutas vagy többutas az attól függ hogy milyen socketbe kerül a processzor. Az socket AM2, AM2+, AM3 egyutasok míg a socket F háromutas.
Gondolom a HT meg fentről lefelé kompatibilis, így ha egy HT3-as vagy HT2-es magot tesznek egy régebbi tokozásba akkor csak az annak megfelelő sebességet és protokolt fogja lekezelni. -
#65675776
törölt tag
Már mi nem 100%? Kérdés, hogy spórolás-e két gyártósor fenntartása egy ilyen kis különbség miatt. Ahogy az S939-es SanDiego/Toledo-kban is ott van az összes link, csak nincsenek kivezetve. Egyébként minden K8-on a die szélén voltak a HT linkek, szóval akár le is hagyhatták volna őket. Csak így kevésbé lett volna rugalmas a gyártás.
-
VaniliásRönk
nagyúr
A PCI-E 16x sávszélessége ha jól tudom 4GB/s, a HT 1.01-é 2GB/s, vagyis előbbi feleslegesen nagy, úgysincs ami kiszolgálja. Nem lehetséges hogy ezért sincs jelenleg markáns különbség a PCI-E 8x és 16x között?
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
ftc
nagyúr
nekem a lenen a logikus,hogy magonként külön tpálálás. sok energia megsporolhato lenne ileltve az IMC azon rését lelőni ha csak az egyik magot használod ne fogyasszon feleslegessen...bár ez elég bonyolult lenne.
HT3
100% kompatibilitás visszafele azt irják,de ha teljes mértékben ki akarod használlni a HT3-at akkor uj alaplap kell stb..ugye előrre nem tudnak tervezni
Megoldhatták volna mint Intel,hogy 1 foglalt ,de kevesebb igy a riziko...Megy e chipsettel ez nem e megy stb.Foglalt váltással kiköszöbölik ezt..
ugye ha HT-t nézem
3.0 visszafele kompatibilis 2.0 ez 1.x-el...
Én nem tudom elképzelni mire kellhet nekik 20.8 GB/s (166.4 Gb/s) per Link
Egyetlen egyet ,hogy bevetik itt is az általános célu procikat...illetve a leglogikusabb,hogy mivel a szerver frontrol kapjuk az asztali CPU-t... -
#95904256
törölt tag
Ez korrekt mellébeszélés volt.
Mert ugye az lett felvetve hogy a Penrynben nincs ''semmi extra''.
Már pedig továbbra is állítom hogy van benne pár ''ütősebb újítás''.
( pl. a kétszer gyorsabb osztómű, 1 órajeles super shuffle engine )
Na már most arra voltam kíváncsi hogy ha szerinted a kétszer gyorsabban működő egységek nem számítanak ''ütősnek'', akkor nálad mekkora ez az érték...
Amúgy rendben, várjuk meg míg a valós tesztek mutatják ki hogy tényleg gyorsabban oszt meg kavar a Penryn. Nem tartom kizártnak hogy csak az intel marketing gépezete duplázott. -
VaniliásRönk
nagyúr
Kösz a tesztet. Az összes szerint egálban kéne lenniük, jópár be lett linkelve a PH-s teszt topikjába is.
Egyébként a K7-es időkben is előfordult 1-2 ilyen összehasonlítás."Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- Intel Core I7 13700K - //Új//6hó garancia//Beszámítás//
- intel LGA1200 Processzorok i3 / i5 / i7 / i9 - Új - Garanciás
- Beszámítás! Intel Core i7 4790 4mag 8szál processzor garanciával hibátlan működéssel
- Eladó AMD FX-6300 / AMD FX-9370 processzor garanciával hibátlan működéssel
- ÚJ, Bontatlan AMD Ryzen 7 7800X3D
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Ozeki Kft.
Város: Debrecen