leisungsanalyse von rechnersystemen · willersbau raum a104 tel. +49 351 - 463 - 42483 robert...
TRANSCRIPT
![Page 1: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/1.jpg)
Willersbau
Raum A104
Tel. +49 351 - 463 - 42483
Robert Schöne ([email protected])
Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)
Leisungsanalyse
von Rechnersystemen
Comparing system using sample data
- BenchIT -
![Page 2: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/2.jpg)
Robert Schöne
Contributions
Jupp Müller
Daniel Molka
Jens Domke
Dr. Stefan Pflüger
Daniel Reiche
BenchIT Team
![Page 3: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/3.jpg)
Robert Schöne
Agenda
Implementation Guidelines and Feature Overview
BenchIT GUI – Measuring and Plotting
BenchIT Website
Case Study – Optimizing STREAM for Intel Core 2
![Page 4: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/4.jpg)
Robert Schöne
Implementation Guidelines
Platform independent
– POSIX conformability
– ANSI-C conformability
Usage of sh and cc only
No make files
Minimized size of the sources
Plain text for
– Configuration data
– Results
GPL licence model
![Page 5: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/5.jpg)
Robert Schöne
The BenchIT Concept – From Measurement to Analysis
Measurement Analysis
user
user
group
Y-A
ch
se
X-Achse
Y-A
ch
se
X-Achse
Y-A
ch
se
X-Achse
Y-A
ch
se
X-Achse
Server
Database
WWW
1212121 122545
21212 1154532
21212154 4532132
5456465 452121
1212121 122545
21212 1154532
21212154 4532132
5456465 452121
1212121 122545
21212 1154532
21212154 4532132
5456465 452121
user
user
user
group
![Page 6: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/6.jpg)
Robert Schöne
BenchIT – Step by Step
ConsoleEditor
![Page 7: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/7.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
Console
LOCAL
DEFS
Editor use
edit edit
![Page 8: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/8.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
Execut-
able
compile
Console
LOCAL
DEFS
Editor use
edit edit start
![Page 9: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/9.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
Execut-
able
Result
File
compile run
Console
LOCAL
DEFS
Editor use
edit edit start start
![Page 10: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/10.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
Execut-
able
Result
File
eps
png
...
compile run create
Console
LOCAL
DEFS
Editor use
edit edit start start
![Page 11: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/11.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
BenchIT
Database
BenchIT-Website
Execut-
able
Result
File
eps
png
...
compile run create
compare resultsConsole
LOCAL
DEFS
Editor use
edit edit start start create
upload
![Page 12: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/12.jpg)
Robert Schöne
BenchIT – Step by Step
Kernel
Sources
BenchIT
Database
BenchIT-GUI
BenchIT-Website
Execut-
able
Result
File
eps
png
...
compile run create
compare resultsConsole
LOCAL
DEFS
Editor use
edit edit start start startview/
plotcreate compare results
edit edit start start create
upload
![Page 13: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/13.jpg)
Robert Schöne
BenchIT – Different Solutions for Specialized Purposes
BenchIT measurement
– Skripts (COMPILE.sh, RUN.sh, reference_run.sh)
– BenchIT-GUI for
• Local Measurement
• Remote Measurement
- Compile and run on the remote system
- Cross-compilation on the host system and run only on the remote
system
BenchIT visualization of results and comparison of different runs
– BenchIT-Website
– BenchIT-GUI
![Page 14: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/14.jpg)
Examples: Memory Latency
Measuring the latency to the different memory levels
Problemsize: size of used memory
Benchmark: pointer chasing
Robert Schöne
ptr=first;
do{
ptr=(void **) *ptr;
} while (ptr!=first);
![Page 15: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/15.jpg)
Examples: MPI Latency
Measuring the latency between different MPI nodes
Problemsize: ID of sender-receiver pair
Benchmark: ping pong
Robert Schöne
if (myRank==receiver(ID)){
MPI_Receive();
MPI_Send();
}
if (myRank==sender(ID)){
MPI_Send();
MPI_Receive();
}
![Page 16: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/16.jpg)
Examples: Floating Point Performance
Measuring the floating point performance for using data in different memory
levels
Problemsize: memory size
Benchmark: matrix multiplication
Robert Schöne
for (i=0;i<N;i++)
for (j=0;j<N;j++)
for (k=0;k<N;k++)
c[i][j]=c[i][j]+a[i][k]*b[k][j];
![Page 17: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/17.jpg)
Examples: Bandwidth
Measuring the bandwidth of different memory levels
Problemsize: memory size
Benchmark: STREAM like
Robert Schöne
for (i=0;i<N;i++)
c[i]=a[i]
…
![Page 18: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/18.jpg)
Writing a measurement kernel
Naming convention
category.name.language.parallelLibs.otherLibs.ID
– numerical.matmul.C.0.0.double
– memory.latency.C.0.0.pointerchasing
Clear Interface to program against:
– bi_getinfo
Used by benchit to get information about the measurement kernel
– bi_init
Called by benchit to initialize data for the measurement kernel
– bi_entry
Called n times by benchit to generate results
– bi_cleanup
Called by benchit to free allocated resources
Robert Schöne
![Page 19: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/19.jpg)
bi_getinfo
Passes info struct, defined in interface
Kernel should fill out the following informations:
– X/Y - axis settings
– Legend texts
– Outlier direction
– „maxproblemsize“ (Not the real problem size, but the number of
bi_entry calls)
– Usage of parallel libraries
– Number of functions
– Definition of „best“ result
Robert Schöne
![Page 20: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/20.jpg)
bi_init / bi_cleanup
bi_entry
Called once before measurements start
„maxproblemsize“ passed
Should allocatelarge data fields, only parts of them may be used in bi_entry
Should initialize used libraries, devices, …
May return ONE pointer to its data
bi_cleanup
Called once after the measurement
Pointer returned by bi_init passed
Should free resources
Robert Schöne
![Page 21: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/21.jpg)
bi_entry
Called several times
Pointer returned by bi_init and ID passed
ID is the number of the measurement – maybe its problemsize
Result value vector passed (double[number of functions +1] )
Should do measurement
Can use:
– bi_gettime() gets current time in seconds as double
– dTimerOverhead means overhead for bi_gettime()
– dTimerGranularity means granularity of bi_gettime()
Results should be stored in result vector
Robert Schöne
![Page 22: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/22.jpg)
If there‘s so much to write …
Why should I use BenchIT?
BenchIT stores informations about compile and run time environment
BenchIT makes batch systems transparent to use
BenchIT selects the „best“ result
BenchIT allows easy comparison
BenchIT provides tools for remote measurement
…
Robert Schöne
![Page 23: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/23.jpg)
Robert Schöne
Agenda
Implementation Guidelines and Feature Overview
BenchIT GUI – Measuring and Plotting
BenchIT Website
Case Study – Optimizing STREAM for Intel Core 2
![Page 24: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/24.jpg)
Robert Schöne
BenchIT GUI – Start
![Page 25: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/25.jpg)
Robert Schöne
BenchIT GUI – definition of local system
![Page 26: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/26.jpg)
Robert Schöne
BenchIT GUI – select a kernel
![Page 27: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/27.jpg)
Robert Schöne
BenchIT GUI – run kernel …
![Page 28: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/28.jpg)
Robert Schöne
BenchIT GUI – run kernel … finished
![Page 29: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/29.jpg)
Robert Schöne
BenchIT GUI – show result
![Page 30: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/30.jpg)
Robert Schöne
BenchIT GUI – result with default settings
![Page 31: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/31.jpg)
Robert Schöne
BenchIT GUI – changing settings (before)
![Page 32: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/32.jpg)
Robert Schöne
BenchIT GUI - changing settings (after)
![Page 33: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/33.jpg)
Robert Schöne
BenchIT GUI – result plot with new settings
![Page 34: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/34.jpg)
Robert Schöne
BenchIT GUI – running on a remote machine
![Page 35: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/35.jpg)
Robert Schöne
BenchIT GUI – define a remote machine
![Page 36: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/36.jpg)
Robert Schöne
BenchIT GUI
![Page 37: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/37.jpg)
Robert Schöne
BenchIT GUI – automatic generation of definitions
![Page 38: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/38.jpg)
Robert Schöne
BenchIT GUI – switching local definitions
![Page 39: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/39.jpg)
Robert Schöne
BenchIT GUI – loading definitions from remote machine
![Page 40: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/40.jpg)
Robert Schöne
BenchIT GUI – new definitions loaded
![Page 41: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/41.jpg)
Robert Schöne
BenchIT GUI
![Page 42: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/42.jpg)
Robert Schöne
BenchIT GUI – changing some settings
![Page 43: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/43.jpg)
Robert Schöne
BenchIT GUI – running pointerchasing on remote system
![Page 44: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/44.jpg)
Robert Schöne
BenchIT GUI – selecting the target system
![Page 45: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/45.jpg)
Robert Schöne
BenchIT GUI - pointerchasing running remote …
![Page 46: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/46.jpg)
Robert Schöne
BenchIT GUI - pointerchasing running remote … done
![Page 47: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/47.jpg)
Robert Schöne
BenchIT GUI – getting results from remote machine
![Page 48: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/48.jpg)
Robert Schöne
BenchIT GUI – result from remote machine
![Page 49: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/49.jpg)
Robert Schöne
BenchIT GUI – comparing both results
![Page 50: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/50.jpg)
Robert Schöne
BenchIT GUI – comparing both results, better layout
![Page 51: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/51.jpg)
Robert Schöne
BenchIT GUI - connecting to web server
![Page 52: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/52.jpg)
Robert Schöne
BenchIT GUI – selecting results from web server
![Page 53: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/53.jpg)
Robert Schöne
BenchIT GUI – getting results for Pentium M
![Page 54: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/54.jpg)
Robert Schöne
BenchIT GUI – results from web server
![Page 55: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/55.jpg)
Robert Schöne
BenchIT GUI - putting all together …
![Page 56: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/56.jpg)
Robert Schöne
BenchIT GUI - … and another one
![Page 57: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/57.jpg)
Robert Schöne
BenchIT GUI – exported to png
![Page 58: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/58.jpg)
Robert Schöne
Agenda
Implementation Guidelines and Feature Overview
BenchIT GUI – Measuring and Plotting
BenchIT Website
Case Study – Optimizing STREAM for Intel Core 2
![Page 59: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/59.jpg)
Analysis/Plot: 3 Different Analyse Paths, Stored Plots
![Page 60: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/60.jpg)
Compare Different Architectures
![Page 61: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/61.jpg)
Compare Different Processors
![Page 62: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/62.jpg)
Kernels which run on both Systems
![Page 63: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/63.jpg)
Compare their Memory Access Time
![Page 64: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/64.jpg)
Select Additional Information
![Page 65: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/65.jpg)
Compared Results
![Page 66: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/66.jpg)
Compare a specific Kernel
![Page 67: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/67.jpg)
Compare Memory Latencies (Pointerchasing)
![Page 68: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/68.jpg)
Compare a Larger Set of Systems
![Page 69: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/69.jpg)
Not Satisfying?
![Page 70: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/70.jpg)
Compare Different Implementations
![Page 71: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/71.jpg)
Compare Different Compilers
![Page 72: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/72.jpg)
Compare Different Compiler Flags
![Page 73: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/73.jpg)
Compare Different Processor Generations
![Page 74: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/74.jpg)
Compare Different Libraries
![Page 75: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/75.jpg)
Share ...
![Page 76: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/76.jpg)
Share with specific user groups
![Page 77: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/77.jpg)
Robert Schöne
Agenda
Feature Overview and Implementation Guidelines
BenchIT GUI – Measuring and Plotting
BenchIT Website
Case Study – Optimizing STREAM for Intel Core 2
![Page 78: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/78.jpg)
Intel Core 2 Duo Processor
Robert Schöne
Core 1
32 KiB L1 Instruction Cache
4 MiB
shared(dynamically
allocated)
L2 Cache
32 KiB L1 Data Cache
ITLB
DTLB
Fetch and Predecode
Reservation Station – 32 entries
FS
B
Reorder Buffer – 96 entries
Rename/Alloc
Instruction Queue – 18 x86 Inst
Store
addrLoad
Int ALU
Int SIMD
FP MUL
Int ALU
Int SIMD
Int ALU
Int SIMD
FP ADD
Decode – 4+1 x86 Inst
Branch Predict
Bus
Interface
Unit
Microcode
ROM
Store
data
port2 port0port4port3 port5port1
16 Byte
6 x86
4+1 x86
complex simple simplesimple4 µops 1 µop 1 µop1 µop
Memory Order Buffer
12
8 B
it
12
8 B
it
12
8 B
it
12
8 B
it
Core 0
256 Bit
physical
Registers
Load/Store
Buffers
alloc
free
![Page 79: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/79.jpg)
Robert Schöne
The STREAM Benchmark – Source Code Fracture
# define N 2000000
# define NTIMES 10
# define OFFSET 0
...
static double a[N+OFFSET],
b[N+OFFSET],
c[N+OFFSET];
...
for (k=0; k<NTIMES; k++)
{
times[0][k] = mysecond();
#pragma omp parallel for
for (j=0; j<N; j++)
c[j] = a[j];
times[0][k] = mysecond() - times[0][k];
...
}
![Page 80: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/80.jpg)
Robert Schöne
First Measurements
Dissatisfying results, imprecise for small problem sizes
– STREAM designed for large memory accesses
– STREAM very simplistic
Only a single problem size is measured per run
– Recompilation for every measurement
– For cache access: more time needed to compile then
to measure
Reimplementation in BenchIT
![Page 81: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/81.jpg)
Robert Schöne
First Measurements - Reimplementation
Design of the benchmark untouched, but
– Dynamic memory allocation
– Variable problem size
– Using RDTSC
No optimizations done
Offset still 0 (STREAM default)
![Page 82: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/82.jpg)
Robert Schöne
Derived STREAM Benchmark
L1 Cache L2 Cache
Bandwidth in L2 Cache
approx. 20 GB/s
![Page 83: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/83.jpg)
Robert Schöne
Derived STREAM Benchmark
![Page 84: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/84.jpg)
Robert Schöne
Derived STREAM Benchmark
![Page 85: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/85.jpg)
Robert Schöne
Derived STREAM Benchmark
![Page 86: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/86.jpg)
Robert Schöne
Optimizations – Reduce Overhead
Still unsatisfying results in the L1 cache
To much overhead due to OpenMP
Solution:
Move time measurement into parallel region
Repeat every operation
Only increased timer accuracy
BUT:
Loops are moved into parallel regions too!
![Page 87: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/87.jpg)
Robert Schöne
Optimizations – Reduce Overhead
Repititions for
every single
operation, not for
whole loop
![Page 88: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/88.jpg)
Robert Schöne
Optimizations – Align Memory for SSE Access
Still relatively low cache performance
Previous measurements have shown
– 16 byte alignment important for performance
– Compiler directive #pragma vector aligned helps compiler
using alignments
Solution:
– Vectors now 16 byte aligned
– Both parts of the vectors have a multiple of 2 as length
– Compiler directive was introduced
![Page 89: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/89.jpg)
Robert Schöne
Optimizations – Align Memory for SSE Access
![Page 90: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/90.jpg)
Robert Schöne
Optimizations – Align Memory for Better Cache Access
Still instable behavior for small problem sizes
Better performance for vector lengths, which are a
multiple of 16 (8 for single threaded)
8*8 (double precision floating point) Byte
= 64 Byte (cache line length)
Solution:
Aligning vectors at 128 Byte barrier for 2 threads
![Page 91: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/91.jpg)
Robert Schöne
Optimizations – Align Memory for Better Cache Access
![Page 92: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/92.jpg)
Robert Schöne
Examination of Other Multicore-CPUs
Intel
Xeon
5160
Intel
Core Duo
T2600
Intel
Xeon
5060
AMD
Opteron
285
Codename Woodcrest Yonah Dempsey Italy
Compiler icc 9.1-em64t icc 9.1 icc 9.1-em64t icc 9.1-em64t
Clock rate 3.0 GHz 2.167 GHz 3.2 GHz 2.6 GHz
L1 D-
Cache per
Core
32 KiByte 32 KiByte 16 KiByte 64 KiByte
L2 Cache 4 MiByte
shared
2 MiByte
shared
2*2 MiByte 2*512 kByte
![Page 93: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/93.jpg)
Robert Schöne
Examination of Other Multicore-CPUs
![Page 94: Leisungsanalyse von Rechnersystemen · Willersbau Raum A104 Tel. +49 351 - 463 - 42483 Robert Schöne (robert.schoene@tu-dresden.de) Zentrum für Informationsdienste und Hochleistungsrechnen](https://reader036.vdocuments.pub/reader036/viewer/2022071220/605ad7df3652a64f2f3a877b/html5/thumbnails/94.jpg)
Robert Schöne
Examination of Other Multicore-CPUs