
Athlon 32 i pamiêæ - czyli mity i kity o wydajno¶ci
Ile razy zdarzy³o nam siê ulec obiegowym opiniom, uwierzyæ na s³owo grupce osób, które uznajemy za bardziej kompetentne od siebie? Czêsto boimy siê, nie chcemy lub z jakiego¶ innego powodu nie sprawdzamy tego, co inni uznali za najlepsze. Niezale¿nie od tego, czy s± to do¶wiadczeni u¿ytkowników forum, czy tez twórcy BIOS-u naszej p³yty g³ównej. A mo¿e czasem warto samemu przetestowaæ to i owo? Ostatnio zainteresowa³em siê pamiêci± operacyjn± i postanowi³em sprawdziæ kilka kwestii zwi±zanych z jej wydajno¶ci± i zweryfikowaæ obiegowe teorie. Jedne utrzyma³y swój niepodwa¿alny status, inne no có¿... zobaczycie sami, ale
najpierw sprawy techniczne:
Platforma testowa
- Athlon 2200+ Thoroughbred B (1800MHz FSB133MHz)
- Epox EP-8K9A(I) KT400
- Twinmos DDR400 CL 2.5 256 MB
- Sapphire R9550 128MB 250/391@351/459 [rdzeñ/pamiêæ]
- Seagate Barracuda 80 GB ATA100 2MB Cache
- Sound/LAN - On Board
- Rozmiar Pagefile = 768 MB [ustawiony na sztywno]
Procedura g³ównego testu:
- System - Windows XP Home SP2 PL, wystarczaj±co ¶wie¿a kopia, testy wykonano 7-9 dni po instalacji. Co wa¿ne system nie by³ w ¿aden sposób optymalizowany.
- Po odpaleniu Windowsa wszystkie programy by³y ka¿dorazowo wy³±czane. Nastêpnie po kolei uruchamia³em benchmarki, w poni¿szej kolejno¶ci:
- CCR 2002 RC1 (10x test RAMu)
- Aida32 3.93 EE
- Sandra 2005 10.37 Lite
- 3d Mark 2001 SE (domy¶lne ustawienia)
- Winrar 3.30 (test polega³ na spakowaniu w trybie "normal" 248 MB danych, 11 ró¿nych typów plików)
- CCR 2002 RC1 (10x test RAMu)
- Po wykonaniu serii testów nastêpowa³ restart systemu, odpowiednie zmiany w BIOS-ie i powtórzenie ca³ej procedury.
- Serie testów wykonywane w sposób ci±g³y, pomiêdzy pierwszym i ostatnim nie zosta³ zainstalowany, ani usuniêty ¿aden z programów. Miêdzy ca³ymi seriami testów mia³y miejsce odstêpy czasowe, ale za ka¿dym razem zachowa³em zasadê: gdy testuje seriê, zawsze robiê to w sposób ci±g³y. St±d mog± wyst±piæ niewielkie ró¿nice w wynikach osi±gniêtych przy tych samych ustawieniach, ale w ró¿nych seriach testów.
Na testy nadszed³ czas...
Zawsze s³yszê lub te¿ czytam odno¶nie optymalnej wspó³pracy CPU z RAM: "Athlon musi pracowaæ synchronicznie z pamiêci±, aby uzyskaæ maksymaln± wydajno¶æ". Tak przynajmniej wynika z testów Bartona, chocia¿ chêtnie sam bym to sprawdzi³. Athlon 3200+ (FSB 200MHz) po prostu d³awi siê, je¶li nie ma do pomocy kostek DDR400. Dobrze, a co z najpopularniejszymi wersjami Athlonów (czytaj - najwiêcej sprzedanych egzemplarzy) z szyna FSB133 MHz? Moja ko¶æ - Twinmos 256MB w standardzie pracuje jako DDR400, wiêc trochê odbiega to od teoretycznie optymalnego DDR266. Tryb DDR333 powinien byæ od niego szybszy, a DDR266 najszybszy.
Pora na pierwsze porównanie DDR 400 vs DDR333
| FSB | 133
| |||||||||||||||||||
| Timingi | 2.5-3-3-7
| |||||||||||||||||||
| DDR | 400 | 333
| ||||||||||||||||||
|
| ||||||||||||||||||||
| CCR - pamiêæ | 8133 | 8797
| Aida32 odczyt | 1806 | 1877
| Aida32 zapis | 581 | 598
| Sandra RAM INT ALU | 1750 | 1945
| Sandra RAM Float FPU | 1649 | 1858
| 3D Mark 2001 SE | 8705 | 8970
| WinRAR [s] | 378 | 342
| |
Wyniki mówi± same za siebie! Na razie wszystko idzie zgodnie z planem. Podsystem pamiêci dosta³ porz±dnego kopa, 4-10% w testach pamiêci, 5% w 3D Mark SE. Winrar dosta³ po prostu skrzyde³, by³ a¿ o 10% szybszy! Po takich wynikach nie mog³em siê ju¿ doczekaæ, co stanie siê przy trybie DDR266 i sta³o siê...
| FSB | 133
| ||
| Timingi | 2.5-3-3-7
| ||
| DDR | 400 | 333 | 266
|
|
| |||
| CCR- pamiêæ | 8133 | 8797 | 8352
|
| Aida32 odczyt | 1806 | 1877 | 1780
|
| Aida32 zapis | 581 | 598 | 527
|
| Sandra RAM INT ALU | 1750 | 1945 | 1886
|
| Sandra RAM Float FPU | 1649 | 1858 | 1777
|
| 3D Mark 2001 SE | 8705 | 8970 | 8766
|
| WinRAR [s] | 378 | 342 | 379
|
Cos jest nie tak? Jest lepiej ni¿ przy DDR400 ale niewiele, a DDR266 nie dotrzymuje kroku DDR333. Chwila na zastanowienie siê. Co¶ musi byæ nie tak. Chyba ju¿ wiem - timingi. Teoria mówi "im mniejsze timingi tym lepiej". Wiêc zmieni³em z 2.5-3-3-7 na niemal kultowe 2-2-2-6. My¶la³em, ¿e przy tak wolnym zegarze pamiêci, poprzednie timingi po prostu hamuj± przyrost mocy, jaki daje tryb synchroniczny. I ju¿ siê cieszy³em, ¿e po problemie, w koñcu mia³em "najlepszy" synchroniczny tryb i sportowe timingi, a tu nagle... drugi zgrzyt.
| FSB | 133
| ||||||||||||||||||||||||||
| DDR | 333 | 266 | 266
| ||||||||||||||||||||||||
| Timingi | 2.5-3-3-7 | 2-2-2-6
| |||||||||||||||||||||||||
|
| |||||||||||||||||||||||||||
| CCR- pamiêæ | 8797 | 8352 | 9171
| Aida32 odczyt | 1877 | 1780 | 1862
| Aida32 zapis | 598 | 527 | 583
| Sandra RAM INT ALU | 1945 | 1886 | 1926
| Sandra RAM Float FPU | 1858 | 1777 | 1841
| 3D Mark 2001 SE | 8970 | 8766 | 8980
| WinRAR [s] | 342 | 379 | 340
| |
Ku mojemu zaskoczeniu wyniki s± niemal identyczne jak w przypadku DDR333 z wolniejszymi timingami. Jak widaæ tryb synchroniczny bardzo zawodzi. Tu chyba mogê sobie pozwoliæ na sformu³owanie pewnego wniosku:
AMD Athlon z FSB 133MHz (przynajmniej XP) najlepiej dzia³a w trybie asynchronicznym z pamiêciami DDR333, dlaczego? Mo¿e to kwestia wysokiego zegara CPU, który wiêcej czerpie korzy¶ci z wy¿szej przepustowo¶ci RAM, ni¿ traci przez dodatkowe opó¼nienia zwi±zane z asynchroniczn± prac± FSB i DDR? W koñcu, te zgodne fazy zegarów FSB i pamiêci to takie pobo¿ne ¿yczenia. Gdy wkraczaj± do akcji wszystkie opó¼nienia, ca³y model teoretyczny mocno siê komplikuje. W swoim BIOS-ie znalaz³em 9 ich rodzajów, a niektóre p³yty maja jeszcze wiêcej!
Niezra¿ony jednak, postanowi³em sprawdziæ najlepszy dotychczas tryb DDR333 z ni¿szymi timingami 2-2-2-6. Dosta³em sygna³, ¿e co¶ jest nie tak w postaci dwóch auto-restartów podczas uruchamiania siê systemu. Szybka wizyta w BIOS-ie, zmiana napiêcia z 2,5V na 2,7V i ju¿ by³o lepiej, pamiêci z "u¶miechem na z³otych stykach" przesz³y kolejn± seriê testów:
| FSB | 133
| ||||||||||||||||||||||||||||||||||||||||
| DDR | 400 | 333 | 266 | 266 | 333
| ||||||||||||||||||||||||||||||||||||
| Timingi | 2.5-3-3-7 | 2-2-2-6
| |||||||||||||||||||||||||||||||||||||||
|
| |||||||||||||||||||||||||||||||||||||||||
| CCR - pamiêæ | 8133 | 8797 | 8352 | 9171 | 9285
| Aida32 odczyt | 1806 | 1877 | 1780 | 1862 | 1959
| Aida32 zapis | 581 | 598 | 527 | 583 | 618
| Sandra RAM INT ALU | 1750 | 1945 | 1886 | 1926 | 1992
| Sandra RAM Float FPU | 1649 | 1858 | 1777 | 1841 | 1910
| 3D Mark 2001 SE | 8705 | 8970 | 8766 | 8980 | 9172
| Winrar [s] | 378 | 342 | 379 | 340 | 309
| |
Chyba wyniki nie wymagaj± komentarza. Werdykt zapad³ - DDR333 2-2-2-6 wygrywa, teoria o wy¿szo¶ci ni¿szych timingów, sprawdza siê w ca³o¶ci. Krótsze czasy dostêpu mog± znacznie zwiêkszyæ wydajno¶æ, nawet o ponad 5%, a w aplikacjach intensywnie wykorzystuj±cych podsystem pamiêci jeszcze wiêcej. W tym miejscu mam jeszcze ma³± uwagê. Pisz±c "intensywnie wykorzystuj±cych podsystem pamiêci" nie mam na my¶li "zapychania" RAM-u. Winrar nawet na najwy¿szym poziomie kompresji potrzebuje tylko kilkudziesiêciu MB wolnej pamiêci operacyjnej.
Apetyt ro¶nie...
Tak jest, apetyt ro¶nie, bo to w koñcu serwis dla tych, którzy lubi± majsterkowaæ przy komputerze i wyciskaæ z niego siódme poty. Postanowi³em zatem, dla w³asnej satysfakcji, zrobiæ równie¿ test na jeszcze ni¿szych timingach, tym razem z ustawieniami ekstremalnymi 1.5-2-2-5 (na ni¿sze nie pozwala mi p³yta). Oto na co staæ DDR266 i DDR333 z tymi ustawieniami. Skoro posz³o wcze¶niej tak dobrze teraz powinno byæ jeszcze lepiej, ale niestety...
| FSB | 133
| |||||||||||||||||||||||||||||||||
| DDR | 266 | 333
| ||||||||||||||||||||||||||||||||
| Timingi | 2-2-2-6 | 1.5-2-2-5 | 2-2-2-6 | 1.5-2-2-5
| ||||||||||||||||||||||||||||||
|
| ||||||||||||||||||||||||||||||||||
| CCR - pamiêæ | 9171 | 9173 | 9285 | 9314
| Aida32 odczyt | 1862 | 1869 | 1959 | 1962
| Aida32 zapis | 583 | 581 | 618 | 619
| Sandra RAM INT ALU | 1926 | 1932 | 1992 | 1994
| Sandra RAM Float FPU | 1841 | 1840 | 1910 | 1910
| 3D Mark 2001 SE | 8980 | 9003 | 9172 | 9201
| Winrar [s] | 340 | 338 | 309 | 309
| |
Widaæ ró¿nicê, testy wskazuj± wy¿szo¶æ czasów 1.5-2-2-5 nad 2-2-2-6, jest to jednak ró¿nica bardzo symboliczna, poni¿ej 0,3%! Jaki z tego wniosek? Albo zmiana w ustawieniach timingów jest zbyt ma³a, aby zaistnia³a bardziej wyra¼na ró¿nica, albo co bardziej prawdopodobne, nie ma po prostu ju¿ z czego zej¶æ. Dlatego przy 2-2-2-6 szyna pamiêci i FSB osi±gaj± niemal optymalne warunki wspó³pracy, a pozosta³e opó¼nienia niweluj± efekty zastosowania CL1.5.
Potwierdzenie poprawno¶ci wyników
Aby udowodniæ prawdziwo¶æ mojej tezy, o niedoskona³o¶ci powszechnego stwierdzenia wy¿szo¶ci trybu synchronicznego nad asynchronicznym w przypadku Athlonów z szyna FSB=133MHZ (przynajmniej dla wersji XP i chipsetu KT400) zrobi³em jeszcze kilka testów:
- Najsilniejszym formatem kompresji Zip, silniejszym od Rar jest 7z. Mo¿e wiêc warto sprawdziæ jak poradzi sobie z tymi samymi plikami co Winrar - 7zip 4.12b, tylko ¿e tym razem tryb kompresji ustawi³em dodatkowo na "max"? Jest jeszcze "ultra", ale to ju¿ prawdziwy po¿eracz pamiêci i bez 512 MB RAM nie ma nawet co próbowaæ.
- Coraz popularniejszy staje siê format Rmvb, który jest powszechnie stosowany do przesy³ania plików video przez Internet. Charakteryzuje siê on znakomitym stopniem kompresji przy zachowaniu jako¶ci plików w formacie Avi. Do testu pos³u¿y³ mi plik zawieraj±cy niezapomniane sceny ze zwyciêstwa Urana w teleturnieju "Dajê s³owo" (raz jeszcze
gratulujê Uran!). Ca³o¶æ "wa¿y³a" 66.5 MB.
| FSB | 133
| ||||
| DDR | 400 | 333 | 266 | 266 | 333
|
| Timingi | 2.5-3-3-7 | 2-2-2-6
| |||
|
| |||||
| Avi do Rmvb | 13:27 | 13:07 | 13:39 | 13:12 | 12:49
|
| 7z | 14:02 | 12:52 | 14:13 | 12:41 | 11:55
|
Jak widaæ testy, w których wiêksze jest zapotrzebowanie na moc i mocniej wykorzystuj±ce
podsystem pamiêci potwierdzaj± poprzednie spostrze¿enia:
- Najlepszym ustawieniem (w wypadku tej konfiguracji) jest DDR333
- Im krótsze timingi tym lepiej
Tylko niech nikogo nie zwiod± ma³e ró¿nice w kodowaniu Avi do Rmvb. Po prostu zawa¿y³a na tym ma³a ilo¶æ RAM-u i brak przygotowania systemu do tego typu zadañ (celowo nie grzeba³em "pod mask±").
Jest te¿ nowe spostrze¿enie, które mn± wstrz±snê³o. Spójrzcie na wyniki DDR400 i DDR266 z CL 2.5. "¶wietny tryb synchroniczny" poleg³ na ca³ej linii, jest wolniejszy od teoretycznie gorszego DDR400. I w sumie tym ma³o optymistycznym akcentem, po zmieszaniu trybu synchronicznego z b³otem móg³bym zakoñczyæ, ale pozosta³o jeszcze kilka rzeczy do sprawdzenia i wyja¶nienia. Skoro ró¿nica miedzy najgorszym, a najlepszym trybem by³a a¿ tak du¿a i to bez podkrêcania, a
dziêki samej wizycie w BIOS-ie, podj±³em decyzje, ¿e jeszcze tam nieco poszperam.
| FSB | 133 | 133 | lepiej o [%]
|
| DDR | 400 | 333
| |
| Timingi | 2.5-3-3-7 | 2-2-2-6
| |
|
| |||
| CCR - pamiêæ | 8133 | 9285 | 11.4
|
| Aida32 odczyt | 1806 | 1959 | 10.8
|
| Aida32 zapis | 581 | 618 | 6.3
|
| Sandra RAM INT ALU | 1750 | 1992 | 11.3
|
| Sandra RAM Float FPU | 1649 | 1910 | 15.8
|
| 3D Mark 2001 SE | 8705 | 9172 | 5.3
|
| Winrar [s] | 378 | 309 | 22.3
|
| Avi do Rmvb | 13:27 | 12:49 | 2.2
|
| 7z | 14:02 | 11:55 | 17.7
|
W BIOS-ie s± jeszcze trzy dosyæ ciekawe opcje:
- Bank Interleave (przeplot banków pamiêci)
- Burst Length (d³ugo¶æ ci±gu danych przesy³anych w trybie burst)
- AGP Aperture Size (szczelina w pamiêci RAM, która mo¿e byæ oddawana do dyspozycji procesora grafiki)
Wszystkie testy do tej pory by³y wykonywane z nastêpuj±cymi ustawieniami:
- Bank Interleave = disable (wylaczony)
- Burst Length = 4
- AGP Aperture Size = 128 MB
Ale po kolei... najpierw zaj±³em siê przeplotem, powszechnie uwa¿a siê, ¿e im wiêcej banków pamiêci siê przeplata tym lepiej, wiec ustawi³em przeplot na 4 (DDR ma 4 banki). Potem z
wy³±czonym przeplotem przetestowa³em ró¿nicê w wydajno¶ci po wyd³u¿eniu ci±gu bitów przesy³anych w trybie burst i otrzyma³em bardzo ciekawe rezultaty:
| FSB | 133
| ||
| DDR | 333
| ||
| Timingi | 2-2-2-6
| ||
| Bank Interleave | 0 | 4 | 0
|
| Burst Length | 4 | 4 | 8
|
| CCR - pamiêæ | 9335 | 9588 | 9321
|
| Aida32 odczyt | 1965 | 1997 | 1962
|
| Aida32 zapis | 618 | 664 | 603
|
| Sandra RAM INT ALU | 1993 | 2021 | 1995
|
| Sandra RAM Float FPU | 1911 | 1944 | 1909
|
| 3D Mark 2001 SE | 9172 | 9323 | 9189
|
| Winrar [s] | 309 | 295 | 309
|
O ile zmiana warto¶ci Burst Length na 8 praktycznie nie wp³ywa na wydajno¶æ, o tyle poczwórny przeplot znakomicie spe³nia swoje zadanie i bije wszelkie rekordy w dotychczasowych testach. Wynik z Sandry w koñcu przekroczy³ magiczn± granicê 2000pkt, a kompresja w Winrar zajê³a mniej ni¿ 300 sekund. Bez w±tpienia przeplot znacznie poprawia wydajno¶æ pamiêci.
Pozosta³o jeszcze ustawienie warto¶ci AGP Aperture Size, z racji odrêbnej procedury testowej omawiam j± na koñcu. Poniewa¿ AAS ma z za³o¿enia poprawiaæ wydajno¶æ tylko w grach, jedynym benchmarkiem tu zastosowanym by³ 3D Mark 2001 SE. Teoria mówi, ¿e AAS winno równaæ siê po³owie wielko¶ci posiadanej w komputerze pamiêci RAM, co powinno spowodowaæ wzrost wydajno¶ci. Czy¿by kolejny mit do obalenia? Najwyra¼niej tak!
| FSB | 133 | 133 | 133 | 133
|
| DDR | 333 | 333 | 333 | 333
|
| Timingi | 2-2-2-6 | 2-2-2-6 | 2-2-2-6 | 2-2-2-6
|
| Przeplot banków | 4 | 4 | 4 | 4
|
| AAS [MB] | 128 | 64 | 128 | 64
|
|
| ||||
| VGU/ram karty | 351/459 | 351/459 | 101/202 | 101/202
|
| 3D Mark 2001 SE | 9319 | 9302 | 3572 | 3573
|
| 3D Mark 2001 SE 4AA | 6380 | 6378 | 2284 | 2278
|
Chyba parê osób siê zdziwi³o widz±c taktowania zegarów rdzenia i pamiêci karty graficznej. To nie pomy³ka tylko celowe dzia³anie. Po prostu chcia³em daæ szanse wykazania siê AAS w sytuacji zbli¿onej do wspó³pracy z kart± graficzn± starszej generacji. Obni¿y³em przepustowo¶æ pamiêci karty graficznej z ~7.3 GB/s do ~3.2 GB/s, aby mog³a siê do czegokolwiek przydaæ pamiêæ na p³ycie g³ównej (DDR333 ~2.7 GB/s).
Wyniki s± niemal identyczne i chyba warto siê teraz zastanowiæ dlaczego teoria po raz kolejny siê nie sprawdzi³a, a ustawienie AAS na 64 MB równie wydajne jak 128MB. Powodów jest kilka:
- AAS wskazuje, ile chipset mo¿e maksymalnie przeznaczyæ pamiêci RAM dla wsparcia karty graficznej, gdy tej zabraknie na tekstury. By³o to skuteczne, gdy karty mia³y 16/32 MB swojej pamiêci, a nie 128 i to szybkiego RAM-u (tu potrzeba naprawdê czego¶ ostrego, a nawet DOOM III, który strasznie obci±¿a VGU, nie potrzebuje a¿ 128 MB na tekstury).
- Po za tym, je¶li nawet chipset skorzysta z pamiêci dla GPU, to straci na tym g³ówny procesor, który nie bêdzie mi±³ przez pewien czas dostêpu do ca³ej objêto¶ci RAM (AAS ma charakter dynamiczny, czyli dzia³a czasowo, nie ci±gle).
- VGU dostaje woln± pamiêæ. Co z tego, ¿e dwa kana³y DDR 400 to 6.4 GB/s, skoro AGP 8x mo¿e wys³aæ max. 2 GB/s, a karty na PCI-Ex16 (~9.5 GB/s) maja takie pamiêci, ze od 6.4GB/s to im siê przepustowo¶æ zaczyna. A je¶li kto¶ ma tylko jeden kana³ to ma tylko 3.2 GB/s i to tylko teoretycznie...
- Z tych 128 MB VGU dostaje tylko 58MB. Dlaczego? Taka specyfikacja standardu, 12 MB na przestrzeñ adresowa, a reszta na pó³.
Wniosek jest oczywisty: AAS tak samo jak Fast Write to przestarza³y dopalacz, nowy sprzêt ju¿ go nie potrzebuje i ¶wietnie sobie radzi bez niego. Wychodzi tutaj przestarza³a konstrukcja BIOS-u... mo¿e te¿ ca³ej architektury?
Podsumowanie
Po po¶wieceniu kilkunastu godzin na wykonanie powy¿szych testów muszê stwierdziæ z zadowoleniem, ¿e uda³o mi siê wyja¶niæ kilka kwestii i przy okazji przyspieszyæ pracê swojego komputera. Ró¿nica miedzy domy¶lnymi ustawieniami, a tymi które teraz u¿ywam jest niemal przepa¶ci±: 7-28%!
| FSB | 133 | lepiej o [%]
| |||||||||||||||||||||||||
| DDR | 400 | 333
| |||||||||||||||||||||||||
| Timingi | 2.5-3-3-7 | 2-2-2-6
| |||||||||||||||||||||||||
| Bank Interleave | 0 | 4
| |||||||||||||||||||||||||
|
| |||||||||||||||||||||||||||
| CCR - pamiêæ | 8133 | 9588 | 11.7
| Aida32 odczyt | 1806 | 1997 | 10.5
| Aida32 zapis | 581 | 664 | 14.3
| Sandra RAM INT ALU | 1750 | 2021 | 15.5
| Sandra RAM Float FPU | 1649 | 1944 | 17.9
| 3D Mark 2001 SE | 8705 | 9323 | 7.1
| Winrar [s] | 378 | 295 | 28.1
| |
Tryb synchroniczny w przypadku Athlonów XP FSB133 okaza³ siê nieporozumieniem, podobnie jak AAS, który po prostu nic nie daje! Z kolei swoj± przydatno¶æ udowodni³y niskie timingi i przeplot banków pamiêci. Chyba ju¿ wystarczy wniosków i tabelek jak na jeden artyku³, teraz mo¿ecie komentowaæ, k³óciæ siê, ¿e wyniki nie s± niewiarygodne itp. ... Ale uprzedzam - ja ju¿ je dwa razy sprawdzi³em.
Was te¿ zachêcam do sprawdzania na w³asnej skórze (maszynie) ró¿nych obiegowych opinii, zawsze mo¿e siê okazaæ, ¿e która¶ jest ju¿ nieaktualna lub nigdy nie by³a prawdziwa!
Zobacz te¿:
Średnia ocena:

Autor: Slavo | Data: 09-08-2006, 23:23:48
Ca³kiem niez³y test - zas³u¿one 5 ;)


