Athlon 32 i pamiêæ - czyli mity i kity o wydajno¶ci

data: 04-06-2006 | autor: Marcin Kluczek | kategoria: Artyku³y

Ile razy zdarzy³o nam siê ulec obiegowym opiniom, uwierzyæ na s³owo grupce osób, które uznajemy za bardziej kompetentne od siebie? Czêsto boimy siê, nie chcemy lub z jakiego¶ innego powodu nie sprawdzamy tego, co inni uznali za najlepsze. Niezale¿nie od tego, czy s± to do¶wiadczeni u¿ytkowników forum, czy tez twórcy BIOS-u naszej p³yty g³ównej. A mo¿e czasem warto samemu przetestowaæ to i owo? Ostatnio zainteresowa³em siê pamiêci± operacyjn± i postanowi³em sprawdziæ kilka kwestii zwi±zanych z jej wydajno¶ci± i zweryfikowaæ obiegowe teorie. Jedne utrzyma³y swój niepodwa¿alny status, inne no có¿... zobaczycie sami, ale
najpierw sprawy techniczne:

Platforma testowa


  • Athlon 2200+ Thoroughbred B (1800MHz FSB133MHz)
  • Epox EP-8K9A(I) KT400
  • Twinmos DDR400 CL 2.5 256 MB
  • Sapphire R9550 128MB 250/391@351/459 [rdzeñ/pamiêæ]
  • Seagate Barracuda 80 GB ATA100 2MB Cache
  • Sound/LAN - On Board
  • Rozmiar Pagefile = 768 MB [ustawiony na sztywno]

Procedura g³ównego testu:


  1. System - Windows XP Home SP2 PL, wystarczaj±co ¶wie¿a kopia, testy wykonano 7-9 dni po instalacji. Co wa¿ne system nie by³ w ¿aden sposób optymalizowany.
  2. Po odpaleniu Windowsa wszystkie programy by³y ka¿dorazowo wy³±czane. Nastêpnie po kolei uruchamia³em benchmarki, w poni¿szej kolejno¶ci:

    • CCR 2002 RC1 (10x test RAMu)
    • Aida32 3.93 EE
    • Sandra 2005 10.37 Lite
    • 3d Mark 2001 SE (domy¶lne ustawienia)
    • Winrar 3.30 (test polega³ na spakowaniu w trybie "normal" 248 MB danych, 11 ró¿nych typów plików)

  3. Po wykonaniu serii testów nastêpowa³ restart systemu, odpowiednie zmiany w BIOS-ie i powtórzenie ca³ej procedury.
  4. Serie testów wykonywane w sposób ci±g³y, pomiêdzy pierwszym i ostatnim nie zosta³ zainstalowany, ani usuniêty ¿aden z programów. Miêdzy ca³ymi seriami testów mia³y miejsce odstêpy czasowe, ale za ka¿dym razem zachowa³em zasadê: gdy testuje seriê, zawsze robiê to w sposób ci±g³y. St±d mog± wyst±piæ niewielkie ró¿nice w wynikach osi±gniêtych przy tych samych ustawieniach, ale w ró¿nych seriach testów.

Na testy nadszed³ czas...

Zawsze s³yszê lub te¿ czytam odno¶nie optymalnej wspó³pracy CPU z RAM: "Athlon musi pracowaæ synchronicznie z pamiêci±, aby uzyskaæ maksymaln± wydajno¶æ". Tak przynajmniej wynika z testów Bartona, chocia¿ chêtnie sam bym to sprawdzi³. Athlon 3200+ (FSB 200MHz) po prostu d³awi siê, je¶li nie ma do pomocy kostek DDR400. Dobrze, a co z najpopularniejszymi wersjami Athlonów (czytaj - najwiêcej sprzedanych egzemplarzy) z szyna FSB133 MHz? Moja ko¶æ - Twinmos 256MB w standardzie pracuje jako DDR400, wiêc trochê odbiega to od teoretycznie optymalnego DDR266. Tryb DDR333 powinien byæ od niego szybszy, a DDR266 najszybszy.

Pora na pierwsze porównanie DDR 400 vs DDR333


FSB133
Timingi2.5-3-3-7
DDR400333

CCR - pamiêæ81338797
Aida32 odczyt18061877
Aida32 zapis581598
Sandra RAM INT ALU17501945
Sandra RAM Float FPU16491858
3D Mark 2001 SE87058970
WinRAR [s]378342

Wyniki mówi± same za siebie! Na razie wszystko idzie zgodnie z planem. Podsystem pamiêci dosta³ porz±dnego kopa, 4-10% w testach pamiêci, 5% w 3D Mark SE. Winrar dosta³ po prostu skrzyde³, by³ a¿ o 10% szybszy! Po takich wynikach nie mog³em siê ju¿ doczekaæ, co stanie siê przy trybie DDR266 i sta³o siê...


FSB133
Timingi2.5-3-3-7
DDR400333266

CCR- pamiêæ813387978352
Aida32 odczyt180618771780
Aida32 zapis581598527
Sandra RAM INT ALU175019451886
Sandra RAM Float FPU164918581777
3D Mark 2001 SE870589708766
WinRAR [s]378342379


Cos jest nie tak? Jest lepiej ni¿ przy DDR400 ale niewiele, a DDR266 nie dotrzymuje kroku DDR333. Chwila na zastanowienie siê. Co¶ musi byæ nie tak. Chyba ju¿ wiem - timingi. Teoria mówi "im mniejsze timingi tym lepiej". Wiêc zmieni³em z 2.5-3-3-7 na niemal kultowe 2-2-2-6. My¶la³em, ¿e przy tak wolnym zegarze pamiêci, poprzednie timingi po prostu hamuj± przyrost mocy, jaki daje tryb synchroniczny. I ju¿ siê cieszy³em, ¿e po problemie, w koñcu mia³em "najlepszy" synchroniczny tryb i sportowe timingi, a tu nagle... drugi zgrzyt.


FSB133
DDR333266266
Timingi2.5-3-3-72-2-2-6

CCR- pamiêæ879783529171
Aida32 odczyt187717801862
Aida32 zapis598527583
Sandra RAM INT ALU194518861926
Sandra RAM Float FPU185817771841
3D Mark 2001 SE897087668980
WinRAR [s]342379340


Ku mojemu zaskoczeniu wyniki s± niemal identyczne jak w przypadku DDR333 z wolniejszymi timingami. Jak widaæ tryb synchroniczny bardzo zawodzi. Tu chyba mogê sobie pozwoliæ na sformu³owanie pewnego wniosku:

AMD Athlon z FSB 133MHz (przynajmniej XP) najlepiej dzia³a w trybie asynchronicznym z pamiêciami DDR333, dlaczego? Mo¿e to kwestia wysokiego zegara CPU, który wiêcej czerpie korzy¶ci z wy¿szej przepustowo¶ci RAM, ni¿ traci przez dodatkowe opó¼nienia zwi±zane z asynchroniczn± prac± FSB i DDR? W koñcu, te zgodne fazy zegarów FSB i pamiêci to takie pobo¿ne ¿yczenia. Gdy wkraczaj± do akcji wszystkie opó¼nienia, ca³y model teoretyczny mocno siê komplikuje. W swoim BIOS-ie znalaz³em 9 ich rodzajów, a niektóre p³yty maja jeszcze wiêcej!

Niezra¿ony jednak, postanowi³em sprawdziæ najlepszy dotychczas tryb DDR333 z ni¿szymi timingami 2-2-2-6. Dosta³em sygna³, ¿e co¶ jest nie tak w postaci dwóch auto-restartów podczas uruchamiania siê systemu. Szybka wizyta w BIOS-ie, zmiana napiêcia z 2,5V na 2,7V i ju¿ by³o lepiej, pamiêci z "u¶miechem na z³otych stykach" przesz³y kolejn± seriê testów:


FSB133
DDR400333266266333
Timingi2.5-3-3-72-2-2-6

CCR - pamiêæ81338797835291719285
Aida32 odczyt18061877178018621959
Aida32 zapis581598527583618
Sandra RAM INT ALU17501945188619261992
Sandra RAM Float FPU16491858177718411910
3D Mark 2001 SE870589708766 89809172
Winrar [s]378342379340309


Chyba wyniki nie wymagaj± komentarza. Werdykt zapad³ - DDR333 2-2-2-6 wygrywa, teoria o wy¿szo¶ci ni¿szych timingów, sprawdza siê w ca³o¶ci. Krótsze czasy dostêpu mog± znacznie zwiêkszyæ wydajno¶æ, nawet o ponad 5%, a w aplikacjach intensywnie wykorzystuj±cych podsystem pamiêci jeszcze wiêcej. W tym miejscu mam jeszcze ma³± uwagê. Pisz±c "intensywnie wykorzystuj±cych podsystem pamiêci" nie mam na my¶li "zapychania" RAM-u. Winrar nawet na najwy¿szym poziomie kompresji potrzebuje tylko kilkudziesiêciu MB wolnej pamiêci operacyjnej.

Apetyt ro¶nie...

Tak jest, apetyt ro¶nie, bo to w koñcu serwis dla tych, którzy lubi± majsterkowaæ przy komputerze i wyciskaæ z niego siódme poty. Postanowi³em zatem, dla w³asnej satysfakcji, zrobiæ równie¿ test na jeszcze ni¿szych timingach, tym razem z ustawieniami ekstremalnymi 1.5-2-2-5 (na ni¿sze nie pozwala mi p³yta). Oto na co staæ DDR266 i DDR333 z tymi ustawieniami. Skoro posz³o wcze¶niej tak dobrze teraz powinno byæ jeszcze lepiej, ale niestety...


FSB133
DDR266333
Timingi2-2-2-61.5-2-2-52-2-2-61.5-2-2-5

CCR - pamiêæ9171917392859314
Aida32 odczyt186218691959 1962
Aida32 zapis583581618619
Sandra RAM INT ALU1926193219921994
Sandra RAM Float FPU1841184019101910
3D Mark 2001 SE8980900391729201
Winrar [s]340338309 309

Widaæ ró¿nicê, testy wskazuj± wy¿szo¶æ czasów 1.5-2-2-5 nad 2-2-2-6, jest to jednak ró¿nica bardzo symboliczna, poni¿ej 0,3%! Jaki z tego wniosek? Albo zmiana w ustawieniach timingów jest zbyt ma³a, aby zaistnia³a bardziej wyra¼na ró¿nica, albo co bardziej prawdopodobne, nie ma po prostu ju¿ z czego zej¶æ. Dlatego przy 2-2-2-6 szyna pamiêci i FSB osi±gaj± niemal optymalne warunki wspó³pracy, a pozosta³e opó¼nienia niweluj± efekty zastosowania CL1.5.

Potwierdzenie poprawno¶ci wyników

Aby udowodniæ prawdziwo¶æ mojej tezy, o niedoskona³o¶ci powszechnego stwierdzenia wy¿szo¶ci trybu synchronicznego nad asynchronicznym w przypadku Athlonów z szyna FSB=133MHZ (przynajmniej dla wersji XP i chipsetu KT400) zrobi³em jeszcze kilka testów:


  1. Najsilniejszym formatem kompresji Zip, silniejszym od Rar jest 7z. Mo¿e wiêc warto sprawdziæ jak poradzi sobie z tymi samymi plikami co Winrar - 7zip 4.12b, tylko ¿e tym razem tryb kompresji ustawi³em dodatkowo na "max"? Jest jeszcze "ultra", ale to ju¿ prawdziwy po¿eracz pamiêci i bez 512 MB RAM nie ma nawet co próbowaæ.
  2. Coraz popularniejszy staje siê format Rmvb, który jest powszechnie stosowany do przesy³ania plików video przez Internet. Charakteryzuje siê on znakomitym stopniem kompresji przy zachowaniu jako¶ci plików w formacie Avi. Do testu pos³u¿y³ mi plik zawieraj±cy niezapomniane sceny ze zwyciêstwa Urana w teleturnieju "Dajê s³owo" (raz jeszcze
    gratulujê Uran!). Ca³o¶æ "wa¿y³a" 66.5 MB.


FSB133
DDR400333266266333
Timingi2.5-3-3-72-2-2-6

Avi do Rmvb13:2713:0713:3913:1212:49
7z14:0212:5214:1312:4111:55

Jak widaæ testy, w których wiêksze jest zapotrzebowanie na moc i mocniej wykorzystuj±ce
podsystem pamiêci potwierdzaj± poprzednie spostrze¿enia:


  • Najlepszym ustawieniem (w wypadku tej konfiguracji) jest DDR333
  • Im krótsze timingi tym lepiej

Tylko niech nikogo nie zwiod± ma³e ró¿nice w kodowaniu Avi do Rmvb. Po prostu zawa¿y³a na tym ma³a ilo¶æ RAM-u i brak przygotowania systemu do tego typu zadañ (celowo nie grzeba³em "pod mask±").
Jest te¿ nowe spostrze¿enie, które mn± wstrz±snê³o. Spójrzcie na wyniki DDR400 i DDR266 z CL 2.5. "¶wietny tryb synchroniczny" poleg³ na ca³ej linii, jest wolniejszy od teoretycznie gorszego DDR400. I w sumie tym ma³o optymistycznym akcentem, po zmieszaniu trybu synchronicznego z b³otem móg³bym zakoñczyæ, ale pozosta³o jeszcze kilka rzeczy do sprawdzenia i wyja¶nienia. Skoro ró¿nica miedzy najgorszym, a najlepszym trybem by³a a¿ tak du¿a i to bez podkrêcania, a
dziêki samej wizycie w BIOS-ie, podj±³em decyzje, ¿e jeszcze tam nieco poszperam.


FSB 133 133lepiej o [%]
DDR 400 333
Timingi2.5-3-3-72-2-2-6

CCR - pamiêæ8133928511.4
Aida32 odczyt1806195910.8
Aida32 zapis5816186.3
Sandra RAM INT ALU1750199211.3
Sandra RAM Float FPU16491910 15.8
3D Mark 2001 SE870591725.3
Winrar [s]37830922.3
Avi do Rmvb13:2712:492.2
7z14:0211:5517.7

W BIOS-ie s± jeszcze trzy dosyæ ciekawe opcje:


  • Bank Interleave (przeplot banków pamiêci)
  • Burst Length (d³ugo¶æ ci±gu danych przesy³anych w trybie burst)
  • AGP Aperture Size (szczelina w pamiêci RAM, która mo¿e byæ oddawana do dyspozycji procesora grafiki)

Wszystkie testy do tej pory by³y wykonywane z nastêpuj±cymi ustawieniami:


  • Bank Interleave = disable (wylaczony)
  • Burst Length = 4
  • AGP Aperture Size = 128 MB

Ale po kolei... najpierw zaj±³em siê przeplotem, powszechnie uwa¿a siê, ¿e im wiêcej banków pamiêci siê przeplata tym lepiej, wiec ustawi³em przeplot na 4 (DDR ma 4 banki). Potem z
wy³±czonym przeplotem przetestowa³em ró¿nicê w wydajno¶ci po wyd³u¿eniu ci±gu bitów przesy³anych w trybie burst i otrzyma³em bardzo ciekawe rezultaty:


FSB133
DDR333
Timingi2-2-2-6
Bank Interleave040
Burst Length448
CCR - pamiêæ933595889321
Aida32 odczyt196519971962
Aida32 zapis618664603
Sandra RAM INT ALU199320211995
Sandra RAM Float FPU191119441909
3D Mark 2001 SE917293239189
Winrar [s]309295309

O ile zmiana warto¶ci Burst Length na 8 praktycznie nie wp³ywa na wydajno¶æ, o tyle poczwórny przeplot znakomicie spe³nia swoje zadanie i bije wszelkie rekordy w dotychczasowych testach. Wynik z Sandry w koñcu przekroczy³ magiczn± granicê 2000pkt, a kompresja w Winrar zajê³a mniej ni¿ 300 sekund. Bez w±tpienia przeplot znacznie poprawia wydajno¶æ pamiêci.

Pozosta³o jeszcze ustawienie warto¶ci AGP Aperture Size, z racji odrêbnej procedury testowej omawiam j± na koñcu. Poniewa¿ AAS ma z za³o¿enia poprawiaæ wydajno¶æ tylko w grach, jedynym benchmarkiem tu zastosowanym by³ 3D Mark 2001 SE. Teoria mówi, ¿e AAS winno równaæ siê po³owie wielko¶ci posiadanej w komputerze pamiêci RAM, co powinno spowodowaæ wzrost wydajno¶ci. Czy¿by kolejny mit do obalenia? Najwyra¼niej tak!


FSB133133133133
DDR333333333333
Timingi2-2-2-62-2-2-62-2-2-62-2-2-6
Przeplot banków4444
AAS [MB]1286412864

VGU/ram karty351/459351/459101/202101/202
3D Mark 2001 SE9319930235723573
3D Mark 2001 SE 4AA6380637822842278

Chyba parê osób siê zdziwi³o widz±c taktowania zegarów rdzenia i pamiêci karty graficznej. To nie pomy³ka tylko celowe dzia³anie. Po prostu chcia³em daæ szanse wykazania siê AAS w sytuacji zbli¿onej do wspó³pracy z kart± graficzn± starszej generacji. Obni¿y³em przepustowo¶æ pamiêci karty graficznej z ~7.3 GB/s do ~3.2 GB/s, aby mog³a siê do czegokolwiek przydaæ pamiêæ na p³ycie g³ównej (DDR333 ~2.7 GB/s).

Wyniki s± niemal identyczne i chyba warto siê teraz zastanowiæ dlaczego teoria po raz kolejny siê nie sprawdzi³a, a ustawienie AAS na 64 MB równie wydajne jak 128MB. Powodów jest kilka:


  1. AAS wskazuje, ile chipset mo¿e maksymalnie przeznaczyæ pamiêci RAM dla wsparcia karty graficznej, gdy tej zabraknie na tekstury. By³o to skuteczne, gdy karty mia³y 16/32 MB swojej pamiêci, a nie 128 i to szybkiego RAM-u (tu potrzeba naprawdê czego¶ ostrego, a nawet DOOM III, który strasznie obci±¿a VGU, nie potrzebuje a¿ 128 MB na tekstury).
  2. Po za tym, je¶li nawet chipset skorzysta z pamiêci dla GPU, to straci na tym g³ówny procesor, który nie bêdzie mi±³ przez pewien czas dostêpu do ca³ej objêto¶ci RAM (AAS ma charakter dynamiczny, czyli dzia³a czasowo, nie ci±gle).
  3. VGU dostaje woln± pamiêæ. Co z tego, ¿e dwa kana³y DDR 400 to 6.4 GB/s, skoro AGP 8x mo¿e wys³aæ max. 2 GB/s, a karty na PCI-Ex16 (~9.5 GB/s) maja takie pamiêci, ze od 6.4GB/s to im siê przepustowo¶æ zaczyna. A je¶li kto¶ ma tylko jeden kana³ to ma tylko 3.2 GB/s i to tylko teoretycznie...
  4. Z tych 128 MB VGU dostaje tylko 58MB. Dlaczego? Taka specyfikacja standardu, 12 MB na przestrzeñ adresowa, a reszta na pó³.

Wniosek jest oczywisty: AAS tak samo jak Fast Write to przestarza³y dopalacz, nowy sprzêt ju¿ go nie potrzebuje i ¶wietnie sobie radzi bez niego. Wychodzi tutaj przestarza³a konstrukcja BIOS-u... mo¿e te¿ ca³ej architektury?

Podsumowanie

Po po¶wieceniu kilkunastu godzin na wykonanie powy¿szych testów muszê stwierdziæ z zadowoleniem, ¿e uda³o mi siê wyja¶niæ kilka kwestii i przy okazji przyspieszyæ pracê swojego komputera. Ró¿nica miedzy domy¶lnymi ustawieniami, a tymi które teraz u¿ywam jest niemal przepa¶ci±: 7-28%!


FSB133lepiej o [%]
DDR400333
Timingi2.5-3-3-72-2-2-6
Bank Interleave04

CCR - pamiêæ8133958811.7
Aida32 odczyt1806199710.5
Aida32 zapis58166414.3
Sandra RAM INT ALU1750202115.5
Sandra RAM Float FPU1649194417.9
3D Mark 2001 SE870593237.1
Winrar [s]37829528.1

Tryb synchroniczny w przypadku Athlonów XP FSB133 okaza³ siê nieporozumieniem, podobnie jak AAS, który po prostu nic nie daje! Z kolei swoj± przydatno¶æ udowodni³y niskie timingi i przeplot banków pamiêci. Chyba ju¿ wystarczy wniosków i tabelek jak na jeden artyku³, teraz mo¿ecie komentowaæ, k³óciæ siê, ¿e wyniki nie s± niewiarygodne itp. ... Ale uprzedzam - ja ju¿ je dwa razy sprawdzi³em.

Was te¿ zachêcam do sprawdzania na w³asnej skórze (maszynie) ró¿nych obiegowych opinii, zawsze mo¿e siê okazaæ, ¿e która¶ jest ju¿ nieaktualna lub nigdy nie by³a prawdziwa!

mkk270

Zobacz te¿:

  1. Hyper Threading (HT)
  2. Procesory wielordzeniowe
  3. Budowa PC [podstawy]
  4. Poradnik kupuj±cego
  5. PCI Express

Oceñ ten tekst:   

Średnia ocena:

Autor: Slavo | Data: 09-08-2006, 23:23:48

Ca³kiem niez³y test - zas³u¿one 5 ;)

Autor (wymagane):
Treśæ (wymagane):
Przepisz kod z obrazka (wymagane):
   

Skarpety X-socks | Przyspieszanie komputera | Jak przyspieszyæ Internet | Przyspieszanie Wifi | aktywacja Windows 7 | nLite |
Nokia kalkulator | Jak zdj±æ Simlock za darmo