“mengintip” ke dalam arsitektur mikro intel nehalem
TRANSCRIPT
Tugas Mandiri Matakuliah Arsitektur dan Organisasi Komputer
Dosen : Ir. Yan Everhard, MT
“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem
Disusun oleh :
NIM Nama
1211600612 : DONZILIO ANTONIO M.
1211600695 : YOHANES SETIAWAN
1211600703 : R BURHAM ISNANTO F
1211600802 : HALIM AGUNG
Kelompok XC
PROGRAM STUDI MAGISTER KOMPUTER
UNIVERSITAS BUDI LUHUR JAKARTA
GASAL 2012/2013
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
1
DAFTAR ISI
ALASAN PEMILIHAN JUDUL ....................................................................................... 2
LATAR BELAKANG ....................................................................................................... 3
PENGANTAR ................................................................................................................... 4
KONTROLER MEMORI TERINTEGRASI .................................................................... 10
CACHE MEMORI ............................................................................................................. 13
PENINGKATAN SALURAN CPU .................................................................................. 15
PENINGKATAN MANAJEMEN DAYA ........................................................................ 20
MODUS TURBO ............................................................................................................... 22
FITUR LAINNYA ............................................................................................................. 24
KESIMPULAN .................................................................................................................. 27
REFERENSI URL ............................................................................................................. 29
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
2
ALASAN PEMILIHAN JUDUL
Adapun alasan yang melatarbelakangi pilihan untuk membahas arsitektur Nehalem pada
tulisan ilmiah ini adalah sebagai berikut :
1. Nehalem merupakan penerus Intel untuk Core 2 yang memiliki pondasi kuat dalam
perkembangan Intel selanjutnya.
2. Dengan fitur Core-wise dan clock for clock, Nehalem mampu meningkatkan kinerja
hingga 15%-20% dibandingkan dengan Penryn yang sama-sama menggunakan metode
manufacturing 45-nm.
3. Secara filosofi teknologi, terobosan yang dilakukan oleh Intel pada arsitektur Nehalem
telah memungkinkan mereka (dan produsen microprocessor pada umumnya) untuk
memenuhi dan melanjutkan prinsip pengembangan teknologi microprocessor yang
diuraikan di dalam Hukum Moore, baik secara bisnis maupun secara teknologi.
4. Secara teknis, teknologi proses yang digunakan oleh Nehalem adalah terobosan besar
yang bukan saja terjadi pada internal Intel sebagai produsennya, melainkan juga
merupakan pencapaian baru dalam sejarah industri microprocessor pada umumnya.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
3
LATAR BELAKANG
Processor atau Central Processing Unit (CPU) merupakan bagian yang sangat penting
dari sebuah komputer mengingat fungsinya sebagai otak dari komputer. Tanpa CPU,
komputer hanyalah sebuah mesin yang tidak bisa apa-apa. Perkembangan CPU dari tahun ke
tahun selalu mengalami peningkatan yang sangat cepat, bahkan para pionir CPU seperti Intel
dan AMD selalu bersaing.
Core 2 Duo merupakan pemicu terjadinya revolusi Intel. Di akhir tahun 2008,
kebanyakan konsumen mungkin tidak mengingat hari-hari suram Netburst dan Pentium 4 saat
Arsitektur K8 AMD dan chip Athlon 64 menguasai pasar. Core 2 Duo dan Quad membawa
kinerja cemerlang dengan titik harga yang menarik, hal inilah yang mendukung Intel kembali
ke posisi yang lebih baik.
Jadi, harus diakui bahwa Nehalem merupakan penerus Intel untuk Core 2 yang memiliki
pondasi kuat dalam perkembangan Intel selanjutnya.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
4
PENGANTAR
Arsitektur mikro (microarchitecture, µarch, uarch) adalah sebuah konsep yang memiliki
beberapa alternatif penjelasan sebagai berikut :
Menurut Wikipedia :
“Microarchitecture consists of a set of microprocessor design techniques used to
implement the instruction set (including microcode, pipelining, cache systems, etc.). “
Menurut Bruce Shriver dan Bennet Smith :
“Microarchitecture is the term used to describe the resources and methods used to
achieve architecture specification. The term typically includes the way in which these
resources are organized as well as the design techniques used in the processor to
reach the target cost and performance goals. The microarchitecture essentially forms
a specification for the logical implementation.”
Dari kedua defenisi tersebut, dapat ditarik sebuah kesimpulan mengenai apa yang
dimaksud istilah atau konsep arsitektur mikro, yakni sebuah konsep yang terdiri dari
beberapa bagian spesifik yang berfungsi untuk melakukan fungsi-fungsi kelas obyek
(komponen) untuk mendukung fungsi arsitektur secara keseluruhan. Dengan bahasa yang
lebih sederhana, arsitektur mikro adalah sebuah sub sistem dari sebuah arsitektur secara
keseluruhan.
Dalam kaitannya dengan arsitektur komputer, arsitektur mikro adalah salah satu konsep
yang esensial. Jika arsitektur berbicara tentang interkoneksi perangkat keras komputer, maka
arsitektur mikro berbicara tentang bagaimana melakukan koneksi-koneksi tersebut, instruksi
apa yang harus dijalankan dan hal-hal khusus lainnya. Dengan demikian, pada level yang
lebih khusus, arsitektur mikro menentukan desain inti dan konsep-konsep teknis yang akan
dijalankan di dalam proses microprocessor.
Hal ini yang kemudian membedakan prinsip dan tujuan arsitektural dengan tujuan serta
prinsip arsitektural mikro. Jika peningkatan performa sistem adalah tujuan utama pada level
arsitektural, maka tujuan dari pengembangan pada level arsitektural mikro adalah :
Pengembangan chip dengan mempertimbangkan biaya produksi.
Penanganan penggunaan sumber daya.
Kompleksitas sistem.
Kemudahan interkoneksi.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
5
Fabrikasi.
Kemudahan debugging.
Ketersediaan test tools.
Tuntutan akan ketersediaan sistem komputer yang memiliki performa tinggi telah
menyebabkan perubahan-perubahan pendekatan dan teknik perancangan sistem pada level
arsitektural mikro. Pada era komputer modern, pendekatan-pendekatan tersebut adalah :
1. Pemilihan instruction set yang tepat
Pemilihan ISA (Instruction Set Architecture) adalah salah satu pendekatan paling
penting. Jenis ISA yang digunakan akan menentukan tingkat fleksibilitas dan
kompleksitas hubungan antara microprocessor dengan perangkat keras lainnya.
2. Penggunaan teknik instruction pipelining
Instruction pipelining adalah salah satu pendekatan tertua, terefisien dan paling
powerfull untuk meningkatkan performa microprocessor. Dengan menggunakan teknik
ini, pemrosesan instruksi pada microprocessor tidak mengalami idle yang terlalu lama.
3. Penggunaan cache
Penggunaan cache berangkat dari ketersediaan ruang di dalam chip, yang
dimungkinkan oleh semakin majunya proses fabrikasi. CPU modern dikembangkan
dengan konsep IC (integrated circuit), dengan memampatkan berjuta-juta transistor ke
dalam satu keping chip. Ini memungkinkan manufaktur untuk menempatkan cache
memory ke dalam chip yang sama. Dalam proses kerjanya, kombinasi antara cache dan
prinsip pipelining menghasilkan kinerja yang cukup memuaskan.
4. Teknik branch prediction dan speculative execution
Untuk memaksimalkan kinerja, desain microprocessor modern menggunakan dua
teknik dalam menjalankan instruksi, yakni branch prediction dan speculative execution.
Branch prediction adalah sebuah teknik untuk menentukan eksekusi pada sebuah
instruksi bercabang. Sedangkan speculative execution adalah teknik untuk mengeksekusi
sebuah kode secara spekulatif. Kedua teknik ini digunakan dalam microprocessor modern
yang telah mengadopsi konsep pipelining.
5. Out-of-order execution
Out-of-Order Execution (OoOE) adalah sebuah pendekatan untuk memangkas waktu
delay (stall) dengan menggunakan delay tersebut untuk melakukan proses pada instruksi
lainnya. Kebanyakan delay yang terjadi pada CPU disebabkan karena ketiadaan
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
6
(keterlambatan) data, dan konsep ini diciptakan untuk mengisi delay tersebut dengan
memproses instruksi yang lengkap sebelum kemudian melakukan rekonstruksi pada
program order dan data order untuk memberikan output yang teratur sesuai dengan urutan
instruksi yang diterima.
6. Superskalar
Pada awalnya, CPU melakukan eksekusi terhadap satu buah instruksi lengkap pada
satu kesempatan. Program komputer dapat dieksekusi lebih cepat jika beberapa instruksi
diproses secara bersamaan. CPU superskalar mengeksekusi lebih dari satu instruksi pada
satu clock cycle dengan melakukan dispatching beberapa instruksi secara bersamaan ke
dalam beberapa unit instruksi ke dalam CPU seperti ALU, FPU, dan bit shifter.
7. Register renaming
Register renaming adalah teknik yang digunakan untuk memperbolehkan banyak
instruksi untuk dijalankan tanpa harus menimbulkan konflik antara berbagai unit eksekusi
yang menggunakan satu register secara bersamaan. Teknik ini dilakukan dengan cara
meletakkan satu set (bukan satu buah) register ke dalam CPU dalam waktu yang
bersamaan.
8. Multiprocessing dan multithreading
Multiprocessing adalah kemampuan CPU untuk melakukan beberapa proses dalam
waktu yang bersamaan. Ada perbedaan dengan multithreading, dimana multithreading
adalah kemampuan CPU untuk memecahkan proses ke dalam beberapa thread yang
berbeda, dimana masing-masing thread tersebut dapat menggunakan sumber daya yang
berbeda-beda, namun dapat dijalankan secara independen.
9. Simultaneous multithreading
Simultaneous multithreading (SMT) adalah pengembangan dari konsep
multithreading, yang masih merupakan fitur yang berupa obyek penelitian dan
pengembangan. Pada CPU multithreading, eksekusi dijalankan secara linear, sedangkan
pada SMT, hal tersebut diubah dengan mengizinkan tiap thread untuk melakukan proses
secara paralel.
Nehalam merupakan nama sandi (code name) dari CPU Intel dengan kontroler memori
terintegrasi yang biasanya dikenal dengan sebutan Core i7. CPU berdasarkan arsitektur
Nehalam akan memiliki sebuah kontroler memori tertanam yang mendukung tiga kanal
DDR3, tiga tingkat cache, teknologi Hyper-Threading, bus eksternal yang disebut QuickPath,
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
7
dan sebagainya.
Di bawah ini merupakan kesimpulan fitur utama dari Nehalem dan kami akan
menjelaskan apa yang dimaksud kemudian :
Berdasarkan arsitektur mikro Intel Core.
Memiliki dua sampai delapan inti.
Kontroler memori tiga kanal DDR3 terintegrasi.
Cache memori L2 256 KB tersendiri untuk tiap inti.
Cache memori L3 8 MB.
Susunan intruksi SSE 4.2 baru (terdapat 7 buah instruksi baru).
Teknologi Hyper-Threading.
Modus Turbo (overclocking otomatis).
Peningkatan arsitektur mikro (mendukung perpaduan makro di bawah modus 64-bit,
meningkatkan pendeteksi urutan pengulangan atau Loop Stream Detector, 6 port
pengiriman, dsb).
Peningkatan unit prediksi, dengan penambahan Branch Target Buffer (BTB) kedua.
Sebuah entri 512 Translation Look-aside Buffer (TLB) kedua.
Dioptimalkan untuk instruksi SSE yang tidak selaras.
Meningkatkan kinerja virtualisasi (menurut Intel, pada virtualisasi arus bolak balik
latency meningkat 60% dibandingkan dengan CPU Core 2 65-nm dan meningkat 20%
jika dibandingkan dengan CPU Core 2 45-nm).
Bus eksternal QuickPath Interconnect.
Unit kontrol daya yang baru.
Pada saat diluncurkan menggunakan teknologi manufaktur 45-nm, dengan model masa
depan 32 nm (nama sandi CPU “Westmere”).
Socket dengan 1366 pin.
Nehalem masih menggunakan metode manufacturing 45-nm yang sama dengan Penryn.
Nama Nehalem sendiri diambil dari sungai Nehalem yang ada di daerah Oregan, Amerika
Serikat.
Berikut beberapa keunggulan yang dimiliki Nehalem dibandingkan dengan Penryn:
1.1x sampai 1.25x single threaded atau 1.2x sampai 2x untuk multithreaded pada keadaan
kondisi daya yang normal.
Penggunaan daya lebih hemat 30% untuk kinerja yang sama.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
8
Dengan fitur Core-wise dan clock for clock, Nehalem mampu meningkatkan kinerja
hingga 15%-20% dibandingkan dengan Penryn.
Penting diingat bahwa CPU Core 2 diproduksi di bawah teknologi 45-nm memiliki fitur
ekstra dibandingkan CPU Core 2 yang diproduksi di bawah teknologi 65-nm. Semua fitur
tersebut dihadirkan pada CPU berbasis Nehalem, fitur yang paling penting adalah :
Susunan instruksi SSE 4.1 (47 instruksi SSE baru).
Teknologi hemat konsumsi daya atau deep power down technology (hanya pada CPU
mobile, juga dikenal sebagai status C6).
Teknologi akselerasi dinamis Intel yang ditingkatkan (hanya pada CPU mobile).
Pembagi Radix-16 yang cepat (peningkatan FPU).
Mesin pengocok super (peningkatan FPU).
Teknologi virtualisasi yang ditingkatkan (peningkatan kinerja diantara 25% dan 75%
pada waktu transisi mesin virtual).
Generasi terakhir CPU Intel dibangun dengan arsitektur mikro inti atau core (dengan
nama sandi Conroe), kemudian ditingkatkan menggunakan proses 45-nm (dengan nama sandi
Penryn). Selain itu, kinerja CPU AMD Phenom tidak dapat bersaing dengan chip Penryn,
sehingga tidak dapat dikatakan bahwa Intel merebut kompetisi yang ada. Dengan demikian,
Intel membuktikan teori Gordon Moore (yang menyatakan bahwa jumlah transistor dalam
sirkuit terintegrasi akan berlipat ganda setiap dua tahun) adalah benar, dan memasukkan lebih
banyak transistor ke dalam CPU-nya.
Strategi perkembangan Intel dengan model perkembangan berputar (cycle) Tick/Tock
dilakukan untuk mengantisipasi kebutuhan konsumen akan perlunya generasi chip yang baru
dan perbaikan pada kecepatan CPU.
Setiap Tick menandai perbaikan pada proses kerja arsitektur mikronya, sedangkan setiap
Tock menandai munculnya arsitektur yang baru. Jeda antara Tick dan Tock adalah 2 tahun
waktu perputaran.
Nehalem merupakan periode Tock yang mengikuti teknologi Tick-nya yaitu Penryn dan
disini ada banyak sekali hal baru yang sangat menarik, bukan hanya karena Nehalem menjadi
arsitektur fundamental yang merupakan perbaikan dari teknologi Intel sebelumnya dalam
jangka waktu 13 tahun. Semua orang yang tertarik pada Nehalem pasti tahu bahwa Nehalem
adalah mainstream pertama dari Intel yang menggunakan Front-Side Bus dalam memperbaiki
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
9
Common System Interface, yaitu dengan adanya Intel QuickPath Interconnect (QPI).
Dari perkembangan ini sudah dibuktikan bahwa Core 2 Duo bekerja lebih cepat tanpa
perlu adanya integrasi dengan kontroler memori sekaligus menyembunyikan kekurangan
kinerjanya dengan cara seperti menambahkan massa ekstra on-die cache.
Proses pengintegrasian kontroler memori tidak dilakukan sepenuhnya dengan Nehalem,
meskipun ada sedikit perkembangannya dinilai kontroversial jika dibandingkan pada saat
Pentium 4 atau Netburst dengan multithreading simultan-nya. Dengan teknologi
HyperThreading yang kembali diterapkan memungkinkan masing-masing inti Nehalem
mampu menjalankan dua thread pada waktu yang bersamaan.
Pada akhirnya Intel juga memberikan Nehalem beberapa fitur manajemen daya cukup
memadai. Dengan berfokus tidak hanya pada penghematan daya, tetapi juga untuk membuat
penggunaan terbaik dari daya yang digunakan oleh CPU.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
10
KONTROLER MEMORI TERINTEGRASI
Sebelum ditemukannya Nehalem, Intel telah terjebak dengan sebuah metodologi CPU
yang meyakini bahwa CPU berkomunikasi dengan seluruh sistem melalui antarmuka Front-
Side Bus (FSB). Namun hal itu bisa dimaklumi karena FSB telah mencapai batasnya dan
diperlukan sebuah solusi untuk mendapatkan CPU yang bisa bekerja maksimal, bukan hanya
sekedar melakukan tweak pada CPU sebanyak banyaknya.
Sejak awal, CPU Intel menggunakan eksternal bus yang dinamakan Front Side Bus yang
dibagi pakai (shared) antara permintaan memori dan I/O. CPU berbasis Nehalem memiliki
sebuah kontroler memori tertanam dan menyediakan dua bus eksternal : satu bus memori
untuk menghubungkan CPU ke memori dan satu bus I/O untuk menghubungkan CPU ke
dunia luar. Perubahan ini jauh meningkatkan kinerja sistem untuk dua alasan utama. Pertama,
memiliki path data yang terpisah untuk akses I/O dan memori. Kedua, akses memori lebih
cepat sama seperti CPU karena tidak memerlukan komunikasi dengan kontroler eksternal
terlebih dahulu.
Pada Gambar 1 dan 2, kami membandingkan arsitektur tradisional yang digunakan CPU
Intel dan arsitektur baru yang digunakan CPU Intel dengan sebuah kontroler memori
terintegrasi.
Gambar 1 : Arsitektur yang digunakan CPU Intel sekarang.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
11
Gambar 2 : Arsitektur yang digunakan CPU Intel
dengan kontroler memori yang tertanam.
Bus eksternal baru ini disebut QuickPath Interconnect (QPI) dan bus ini menyediakan
dua path data yang terpisah (satu untuk mengirim data dan yang lainnya untuk menerima
data) agar CPU dapat berkomunikasi dengan chipset atau dengan CPU yang lain (dimana jika
di sebuah server terdapat lebih dari satu CPU). Seperti yang dapat dilihat, bus ini setara
dengan bus HyperTransport yang digunakan pada CPU AMD. Generasi pertama dari
QuickPath Interconnect berjalan pada 3.2 GHz yang mentransfer dua data 16-bit per clock
tick, yang sama dengan teori maksimum laju transfer 12.6 GB/s di tiap arah.
Pada dasarnya QPI berfungsi sama dengan FSB, tapi dengan pendekatan yang lebih
baik. Pada FSB, jalur yang dihubungkan adalah transfer data antara CPU dengan Memory
Controller Hub (MCH), sedangkan pada QPI yang dihubungkan adalah CPU dengan IOH
(Input/Output Hub). IOH sendiri difungsikan sebagai pengganti MCH pada sistem Core i7.
QPI meningkatkan kemampuan transfer sistem CPU, karena menggabungkan kontroler
memori langsung ke CPU. Pada dasarnya QPI bukanlah sebuah bus layaknya FSB, tetapi
merupakan sistem point-to-point yang menghubungkan transfer data antara CPU dengan
RAM, dan CPU ke sistem eksternal (chipset IOH di Motherboard).
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
12
CPU pada komputer desktop hanya akan memiliki satu QuickPath Interconnect (QPI),
sementara CPU server akan memiliki dua buah bus yang idependen untuk mengijinkan bus
tersebut dapat terkoneksi bersama pada lingkungan SMP (Symmetric Multiprocessing).
Kontroler memori terintegrasi ini merupakan pengendali memori utama yang menjadi
satu bagian dengan CPU, sehingga tidak lagi menyebabkan adanya latency melalui FSB yang
dapat membuat pemrosesan menjadi lambat.
Pada CPU berbasis Nehalem, kontroler memori yang terintegrasi menyediakan tiga buah
kanal memori, sebagai contoh kemampuan mengakses tiga modul memori pada waktu yang
sama secara paralel, dalam hal meningkatkan kinerja – dalam teori arsitektur tiga kanal
menyediakan 50% peningkatan dari ketersedian bandwidth dibandingkan dengan arsitektur
dua kanal yang berjalan pada laju clock yang sama. Sehingga untuk mencapai kinerja terbaik
dengan CPU berbasis Nehalem seperti Core i7, Anda perlu menginstall tiga atau enam modul
memori (tentunya jika motherboard Anda mendukung enam socket memori). Anda wajib
memperhatikan pengubahan ini, karena kebanyakan orang sekarang menggunakan PC dengan
2 GB atau 4 GB (dua atau empat modul memori dalam hal untuk mencocokkan sistem dua
kanal memori) sementara untuk Core i7 dan CPU berbasis Nehalem Anda mesti memiliki PC
dengan 1.5 GB, 3 GB atau 6 GB untuk kinerja terbaik (tiga atau enam modul memori dalam
hal untuk mencocokkan sistem tiga kanal memori).
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
13
CACHE MEMORI
Pada sisi cache memori, Intel menggunakan susunan cache yang sama dengan AMD,
yaitu menggunakan CPU Phenom, sebagai contoh cache L2 tersendiri untuk tiap inti dan
cache memori L3 yang terbagi. Setiap cache memori L2 akan menjadi 256 KB dan cache L3
akan menjadi 8 MB, pada akhirnya untuk model pertama yang diluncurkan Intel akan
meluncurkan CPU Xeon berbasis Nehalem dengan lebih banyak cache. Cache L1 berjumlah
sama dengan Core 2 Duo yaitu 64 KB (32 KB untuk instruksi dan 32 KB untuk data).
L3 cache ini dibagi pakai oleh keempat inti. Bila yang digunakan hanya 1 inti
(misalnya menjalankan aplikasi yang sifatnya single-threaded), inti tersebut bisa
mengakses sepenuhnya 8 MB cache tersebut.
CPU Core 2 Duo hanya memiliki satu cache memori L2 yang dibagi pakai ke seluruh inti
CPU, tapi untuk CPU quad-core dari Intel seperti Core 2 Quad dan Core 2 Extreme memiliki
dua cache L2, masing-masing dibagi pakai oleh tiap kelompok dari kedua inti. Agar mudah
dipahami, kami meringkas arsitektur cache yang tersedia pada Gambar 3 dan 4.
Gambar 3: Perbandingan antara arsitektur cache.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
14
Gambar 4: Perbandingan antara arsitektur cache.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
15
PENINGKATAN SALURAN CPU
Seperti yang dijelaskan, Nehalem (Core i7) berdasarkan arsitektur yang digunakan oleh
Core 2 Duo, membawa beberapa peningkatan pada jalan arus instruksi di dalam CPU.
Berikut akan dijelaskan peningkatan yang dimaksud.
Bagaimanapun, Core 2 Duo berbasis Pentium M, yang pada gilirannya berdasarkan
Pentium III. Semua CPU tersebut merupakan generasi CPU Intel ke-6 (jika Anda
menjalankan instruksi CPUID kesemuanya akan menghasilkan “6” pada field Family).
Pentium 4 merupakan generasi CPU Intel ke-7, menggunakan arsitektur mikro yang benar-
benar beda – CPU Core 2 dan Core i7 tidak memiliki hubungan apapun yang bisa dilakukan
dengan Pentium 4. Anda mungkin menemukan kejanggalan mengapa produsen kembali ke
arsitektur “jadul” tetapi itulah yang terjadi (arsitektur mikro “jadul” membuktikan lebih
efisien dibandingkan arsitektur yang “terbaru”).
Untuk mengerti silsilah dari arsitektur mikro Nehalem yang baru dapat mengacu pada
Gambar 5. Kami juga menambahkan peningkatan utama yang ada pada setiap CPU yang
baru; setiap CPU memiliki semua yang ada pada CPU sebelumnya ditambah peningkatan
yang disebutkan. Tentu saja tiap CPU memiliki peningkatan minor lainnya; disini kami hanya
menampilkan yang penting saja.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC 16
Gambar 5: Pohon silsilah arsitektur mikro Nehalem.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
17
Dalam rangka memahami peningkatan yang dibawa oleh arsitektur mikro baru ini, Anda
perlu mengingat bahwa program tersebut ditulis menggunakan instruksi x86 (juga disebut
“macro-op” atau “instruksi”), yang tidak dimengerti oleh unit eksekusi CPU. Mereka harus
terlebih dahulu diterjemahkan ke dalam instruksi mikro (juga disebut “micro-op” atau
“µop”). Arsitektur ini merupakan hybrid CISC/RISC dan telah diperkenalkan oleh Pentium
Pro : CPU menerima instruksi x86 (CISC), tetapi mengeksekusi hak milik instruksi mikro
(RISC).
Arsitektur mikro inti yang digunakan pada CPU Core 2, mengenalkan macro-fusion
dengan kemampuan menterjemahkan dua instruksi x86 hanya dalam satu instruksi mikro
(juga dikenal sebagai “micro-ops”) untuk dieksekusi di dalam CPU, meningkatkan kinerja
dan mengecilkan konsumsi daya CPU, setelah mengeksekusi hanya satu malahan dua
instruksi mikro. Bagaimanapun skema ini hanya bekerja untuk membandingkan dan kondisi
instruksi bercabang (contoh, CMP atau TEST ditambah instruksi Jcc).
Arsitektur mikro Nehalem meningkatkan macro-fusion dengan dua cara. Pertama
menambahkan dukungan untuk intruksi bercabang yang berlainan yang tidak dapat
digabungkan pada CPU Core 2. Dan kedua, pada CPU berbasis Nehalem macro-fusion
digunakan baik pada modus 32bit maupun 64bit, sementara pada CPU Core 2 macro-fusion
hanya bekerja saat CPU bekerja pada modus 32-bit.
Arsitektur mikro inti juga menambahkan pendeteksi aliran perulangan (loop stream
detector), biasanya berupa cache 18 instruksi kecil diantara unit pengambil dan penterjemah
dari CPU. Ketika CPU menjalankan perulangan (bagian dari program yang diulang pada saat
yang berlainan), CPU tidak memerlukan pengambilan intruksi yang dibutuhkan lagi dari
cache instruksi L1: dikarenakan telah mendekati unit penterjemah. Ditambahkan, CPU
sebenarnya mematikan unit prediksi pengambilan dan percabangan ketika menjalankan
perulangan yang terdeteksi, hal ini tentu menghemat beberapa daya.
Pada CPU berbasis Nehalem, cache kecil tersebut telah dipindahkan setelah unit
penterjemah. Jadi bukan memegang instruksi x86 seperti CPU Core 2, melainkan memegang
micro-ops (sampai 28). Peningkatan kinerja ini dikarenakan saat CPU menjalankan
perulangan, tidak dibutuhkan penterjemahan instruksi yang ada di perulangan: perulangan
tersebut akan diterjemahkan di dalam cache kecil ini. CPU juga dapat mematikan unit
penterjemah sebagai tambahan untuk unit prediksi pengambilan dan percabangan saat
menjalankan perulangan yang terdeteksi sehingga lebih menghemat daya.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
18
Gambar 6: Lokasi Pendeteksi Aliran perulangan pada CPU Core dan Nehalem
Arsitektur Nehalem menambahkan satu buah port pengiriman ekstra dan memiliki 12 unit
eksekusi yang bisa dilihat pada gambar di bawah. Dengan basis CPU tersebut, arsitektur ini
dapat memiliki lebih banyak instruksi mikro yang dieksekusi pada waktu yang sama
dibandingkan dengan CPU sebelumnya.
Gambar 7: Unit port pengiriman dan eksekusi
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
19
Arsitektur mikro Nehalem juga menambahkan dua buffer ekstra: entri 512 Translation
Look-aside Buffer (TLB) kedua dan Branch Target Buffer (BTB) kedua. Penambahan buffer
ini meningkatkan kinerja CPU.
TLB merupakan sebuah tabel yang digunakan untuk konversi alamat fisik ke alamat
virtual dengan sirkuit memori virtual. Memori virtual merupakan teknik dimana CPU
mensimulasikan lebih banyak memori RAM pada sebuah file yang ada di harddisk (disebut
file swap) untuk mengijinkan komputer melanjutkan operasi walaupun tidak terdapat cukup
RAM yang tersedia (CPU mendapatkan apa yang ada pada memori RAM, menyimpan ke
dalam file swap ini dan kemudian membersihkan memori agar bisa digunakan).
Transition Lookaside Buffer (TLB) memainkan peran vital dalam kinerja cache. Bila
halaman memori dipetakan dalam TLB, halaman memori tersebut dapat diakses dengan cepat
dalam cache. Ketika TLB terlalu kecil, kesalahan lebih sering terjadi. TLB dalam arsitektur
Nehalem jauh lebih besar daripada arsitektur sebelumnya yang memungkinkan lebih banyak
referensi halaman memori untuk tetap berada di TLB.
Prediksi percabangan merupakan sebuah sirkuit yang mencoba menebak langkah program
selanjutnya, memuat intruksi ke dalam CPU dengan memikirkan apa yang CPU coba untuk
muat selanjutnya. Jika tebakan tepat, CPU tidak akan menghabiskan waktu memuat instruksi
dari memori, karena instruksi tersebut sudah ada di dalam CPU. Peningkatan ukuran BTB
(atau menambahkan yang kedua dalam kasus CPU berbasis Nehalem) mengijinkan sirkuit ini
fmemuat lebih banyak instruksi secara lanjutan yang meningkatkan kinerja CPU.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
20
PENINGKATAN MANAJEMEN DAYA
Transistor di dalam CPU bekerja sebagai switch, dengan dua kemungkinan status:
konduktif (modus saturasi) bekerja sebagai switch penutup, dan non konduktif (modus pintas)
bekerja sebagai switch pembuka. Masalahnya ada pada status non-konduktif yang teorinya
menyatakan mereka tidak mengijinkan arus untuk mengalir, tetapi jumlah kecil arus masih
dapat mengalir. Jumlah kecil arus tersebut dikenal sebagai kebocoran arus dan jika Anda
menambah kebocoran arus yang ada, Anda akan mendapatkan arus dalam jumlah yang
banyak (termasuk daya) dihabiskan dan menghasilkan panas yang tidak diinginkan. Salah
satu tantangan dalam mendesain CPU adalah mengatasi kebocoran arus tersebut.
Nehalem menghadirkan unit kontrol daya di dalam CPU dengan tujuan manajemen daya
yang lebih baik (lihat Gambar 8). Unit ini mengurangi kebocoran arus dan juga mengjinkan
“Modus Turbo” baru. Pada dasarnya, CPU dapat memiliki voltase dan frekuensi yang
berbeda untuk tiap inti, untuk unit diluar inti, untuk kontroler memori, untuk cache, dan untuk
unit I/O. Pada CPU sebelumnya, semua inti berjalan pada laju clock yang sama, tetapi pada
CPU berbasis Nehalem tiap inti dapat diprogram untuk berjalan pada laju clock yang berbeda
dalam menghemat daya.
Gambar 8: Unit kontrol daya.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
21
Unit kontrol daya yang ditanam dapat mematikan tiap inti CPU, tetapi fitur ini tidak
tersedia pada CPU Core 2 mobile. Pada faktanya CPU dapat meletakkan tiap inti ke status
daya C6 (“menghemat daya secara mendalam”) secara independen dari status suatu inti yang
sedang berjalan. Hal ini mengijinkan penghematan energi ketika Anda menjalankan PC
secara normal, tetapi satu atau beberapa inti menjadi siaga atau idle dan dapat dimatikan.
Inti Nehalem dapat berada dalam salah satu dari empat status, yaitu C0, C1, C3, dan C6.
Status ini saling bergantian. Pergantian ini sendiri terjadi 56 persen lebih cepat dibandingkan
dengan arsitektur Penryn.
Pada status C0, CPU sepenuhnya aktif dan mengambil daya secara penuh, C1 akan terjadi
penambahan kecepatan clock CPU (dan tegangan) sehingga mengambil daya kira-kira
setengahnya, C3 mematikan PLLs dan flushes cache lokal inti untuk yang lain sehingga
mengakibatkan terjadinya 50 persen daya berkurang, dan pada status C6 akan mematikan
hampir semua daya. Sementara pada keadaan sleep, akan daya yang digunakan sangat kecil
sehingga membutuhkan waktu yang lebih lama untuk bangun dari keadaan sleep tadi.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
22
MODUS TURBO
Unit kontrol daya yang ditanam juga menambahkan sensor daya untuk tiap inti.
Tujuannya agar CPU mengetahui seberapa banyak daya yang dikonsumsi tiap inti dan berapa
banyak panas yang tidak teratur. Hal ini mengijinkan penambahan “Modus Turbo” pada
CPU. Modus Turbo ini selanjutnya lebih dikenal sebagai Intel Turbo Boost Technology.
Dengan fitur Intel Turbo Boost Technology, inti CPU secara otomatis meningkatkan
frekuensi clock-speed jika diperlukan, asal masih di bawah limit daya, arus dan suhu
temperatur yang diijinkan. Sebagai contoh : pada saat user menggunakan satu aplikasi kelas
berat yang membutuhkan kecepatan tinggi (seperti Game), maka Turbo Boost akan
mengaktifkan fiturnya agar mencapai kecepatan maksimal secara dinamis sehingga aplikasi
dapat dijalankan dengan nyaman.
Modus Turbo mengijinkan CPU meningkatkan laju clock dari inti yang aktif. Ide ini
termasuk tidak baru dan Core i7 bukan CPU pertama yang menggunakannya. Tetapi pada
inkarnasi teknologi sebelumnya hanya dapat digunakan saat inti proses yang lain sedang
siaga.
Modus baru ini merupakan sebuah sistem perulangan tertutup. CPU terus menerus
mengawasi temperatur dan konsumsi daya. CPU akan meng-overclock inti yang aktif sampai
CPU mencapai jumlah maksimum yang diijinkan TDP berdasarkan sistem pendinginan yang
Anda gunakan. Hal ini dapat dikonfigurasikan pada pengaturan motherboard. Sebagai contoh,
jika pendingin CPU Anda dapat memakai 130 W, CPU akan menambah (atau mengurangi)
clock yang ada sehingga daya yang dipakai CPU cocok dengan jumlah daya yang dipakai
pendingin CPU. Jadi jika Anda mengganti pendingin CPU Anda dengan pendingin yang
lebih baik, Anda perlu memasuki pengaturan motherboard untuk menkonfigurasikan TDP
pendingin yang baru (sebagai contoh batas maksimum daya panas yang dapat dipakai)
dengan tujuan membuat Modus Turbo untuk lebih sering meningkatkan clock CPU.
Perhatikan bahwa CPU tidak perlu mematikan inti yang tidak digunakan untuk
mengaktifkan Modus Turbo. Tetapi sejak teknik overclock dinamis ini berdasarkan seberapa
banyak daya yang masih dapat dipakai menggunakan pendingin CPU Anda, mematikan inti
yang tidak digunakan akan mengurangi konsumsi daya CPU dan hal ini dapat meningkatkan
overclock yang lebih tinggi.
Modus Turbo baru merupakan ekstensi teknologi SpeedStep yang dilihat oleh sistem
sebagai fitur SpeedStep. Teknologi ini hanya dapat digunakan untuk inti CPU, jadi kontroler
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
23
memori dan cache memori tidak akan terpengaruh oleh teknologi ini. Sayangnya, Modus
Turbo hanya akan tersedia pada model “Extreme Edition”.
Setiap inti Nehalem dalam operasi normal mendapat bagian yang sama dari beban kerja
yang ditugaskan ke CPU dan masing-masing akan meningkatkan atau menurunkan clock
tergantung pada beban kerja. Terkadang, dalam menjaga beban kerjanya agar dapat
terdistribusi secara merata pada semua intinya, Nehalem akan meningkatkan kecepatan clock
pada putaran yang tinggi sehingga mengakibatkan daya yang digunakan akan lebih tinggi dari
penggunaan listrik yang dibutuhkan. Dengan Modus Turbo, Nehalem dapat mengetahui
kapan waktunya untuk membagi beban ke semua inti sehingga dapat meminimalkan
penggunaan daya.
Gambar 9: Modus Turbo Nehalem.
Dalam situasi adanya beban yang tidak terlalu banyak, ketika salah satu inti mendapatkan
beban yang ringan sementara inti yang lain tidak digunakan sama sekali, CPU akan
mematikan inti yang sedang bekerja tadi dan mendistribusikan beban kerjanya ke seluruh inti
yang tersisa.
Gambar 10: Pengoptimalan Kinerja dan Efisiensi Energi pada Modus Turbo Nehalem.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
24
FITUR LAINNYA
Berikut ini penjelasan mengenai dua fitur penting lainnya dari Nehalem, yaitu Hyper-
Threading dan optimalisasi untuk instruksi SSE yang tidak selaras.
Teknologi Hyper-Threading mengijinkan tiap inti CPU dikenal sebagai dua CPU. Jadi
jika Anda memiliki Core i7 dengan empat inti, sistem operasi akan mengenalinya memiliki
delapan inti. Teknologi ini berdasarkan fakta yang menyatakan ketika inti CPU sedang
berjalan terdapat sirkuit tertentu di dalamnya yang siaga sehingga dapat digunakan. Semula
dirilis untuk CPU Pentium 4, teknologi ini pertama kalinya tersedia pada generasi ke-6 CPU
Intel. Teknologi ini biasanya juga disebut SMT atau Simultaneous Multi-Threading.
Teknologi SMT merupakan teknologi yang memungkinkan setiap inti pada CPU dapat
memproses 2 arus instruksi secara sekaligus. Hal ini tentu dapat meningkatkan kinerja
aplikasi yang sifatnya multi-thread dan multi-tasking. Tetapi, teknologi SMT tidak
menyediakan kinerja yang didapat sama seperti inti CPU “sesungguhnya” (contoh CPU
dengan 8 inti lebih cepat dibandingkan CPU dengan 4 inti dan teknologi HT, diasumsikan
bahwa CPU tersebut bekerja pada laju clock yang sama dan berdasarkan arsitekstur yang
sama), bagaimanapun Anda akan mendapatkan “inti CPU” ekstra ini secara cuma-cuma.
CPU berbasis Nehalem mendukung Intel Streaming SIMD Extension (SSE) 4.2 yang
merupakan penambahan 7 instruksi baru dari SSE sebelumnya. Kinerja CPU pada tatanan
multimedia menjadi lebih baik.
Ada dua jenis instruksi SSE yang mengakses memori, selaras dan tidak selaras. Instruksi
sederhana memerlukan data yang diminta di dalam format batas pengalamatan 16-byte (128-
bit), sementara instruksi tidak selaras tidak perlu. Sebagai ilustrasi silahkan lihat Gambar 11.
Aligned Request
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
25
Unaligned (misaligned) Request
Gambar 11: Instruksi Selaras dan Tidak Selaras
Gambar di atas dapat dijelaskan seperti berikut. Bayangkan sebuah sistem dengan memori
dua kanal. Kontroler memori akan mengakses memori sebanyak 128 bit setiap kalinya. Jadi
memori akan dibagi ke dalam 128 bit (16 byte) blok. Teorinya, alamat yang Anda minta
harus dimulai dari awal pada setiap blok sehingga 128 bit tadi dapat dibaca (atau ditulis) dan
mendapatkan apa yang Anda inginkan hanya dalam satu permintaan. Permintaan selaras ini
ditunjukkan pada bagian atas Gambar 11.
Tapi misalkan Anda memberikan perintah untuk membaca sebuah data dari memori tetapi
dengan menggunakan alamat pertama di dalam blok, yang Anda minta adalah alamat yang
ada di tengah blok. Sejak Anda meminta data 128 bit, yang akan terjadi adalah setengah data
akan berada pada blok pertama dan setengah lainnya berada pada blok berikutnya – hal ini
ditunjukkan pada Gambar 11 bagian bawah. Saat data yang Anda minta dibagi ke dalam dua
blok yang berbeda, kontroler memori akan membaca dua blok memori, tidak hanya satu
sebagaimana yang terjadi pada contoh sebelumnya. Pada pembacaan yang pertama Anda
akan mendapatkan setengah data yang Anda inginkan dan pada pembacaan yang kedua Anda
akan mendapatkan sisanya.
Walaupun permintaan selaras lebih efisien, permintaan ini lebih sulit bagi programmer
karena perlu diketahui organisasi memorinya terlebih dahulu. Karena itulah, kebanyakan
programmer hanya menggunakan instruksi tidak selaras.
CPU Intel sebelumnya dioptimalkan untuk instruksi selaras, instruksi tidak selaras lebih
lambat dan diterjemahkan ke dalam beberapa micro-ops – dengan kata lain, instruksi tidak
selaras lebih mudah bagi programmer tetapi berjalan lebih lambat. CPU berbasis Nehalem
dioptimalkan untuk instruksi tidak selaras, mencapai kecepatan yang sama seperti instruksi
selaras. Ringkasan penjelasan di atas dapat dilihat pada potongan slide pada Gambar 12.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
26
Gambar 12: Nehalem dioptimalkan untuk instruksi SSE tidak selaras.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
27
KESIMPULAN
Semua CPU Intel dengan nama Core i dibangun dengan dasar arsitektur yang diberi nama
Nehalem. Secara sederhana, arsitektur Nehalem menawarkan performa yang lebih tinggi
dengan pengaturan konsumsi daya yang jauh lebih baik. Ada beberapa hal yang merupakan
keunggulan dari arsitektur Nehalem secara umum jika dibandingkan dengan arsitektur Core
yang sudah ada sebelumnya.
1. Penggabungan komponen
Pada Nehalem, ada beberapa komponen yang digabungkan menjadi satu di dalam
CPU. Hal yang paling penting adalah penggabungan pengendali memori (RAM) ke dalam
CPU yang sebelumnya terletak di luar CPU. Dengan dimasukkannya pengendali memori
ke dalam CPU, kecepatan aliran data antara CPU dan memori menjadi lebih tinggi. Pada
CPU Core i3 M, Core i5 M, dan Core i7 M, Intel bahkan memasukkan VGA-nya ke
dalam CPU. Hal tersebut tentu membuat kemampuan VGA menjadi lebih baik
dibandingkan VGA onboard terdahulu.
2. Efisiensi daya, maksimalisasi kinerja
Pada Core 2 Duo (CPU dengan 2 inti), jika kecepatannya adalah 3 GHz, itu berarti
kedua inti bekerja dengan kecepatan 3 GHz. Saat CPU beristirahat, kecepatannya
keduanya akan turun secara bersamaan. Jadi, kalau ada software yang hanya bisa
menggunakan 1 inti, kedua inti akan bekerja pada kecepatan tertingginya (3 GHz). Satu
inti bekerja mengolah data, sementara inti lainnya hanya ikut-ikutan menaikkan
kecepatan tanpa mengolah data.
Pada Nehalem, kondisinya berbeda. Contohnya pada Core i3 (2 inti), kondisi di atas
hanya akan membuat 1 inti bekerja dengan menggunakan kecepatan maksimumnya.
Sementara inti yang tidak terpakai akan tetap beristirahat untuk menghemat energi.
3. Hyper-threading (HT)
Sebuah inti CPU yang memiliki teknologi HT akan dikenal oleh sistem operasi
sebagai CPU 2 inti. Jadi, sistem operasi dapat memberikan 2 pekerjaan pada sebuah inti.
Hal ini membuat CPU berbasis Nehalem mampu bekerja lebih maksimal dibandingkan
pendahulunya.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
28
4. Turbo boost
Kemampuan ini adalah fitur unggulan dari sebagian besar CPU berbasis Nehalem. Ide
dasarnya adalah HUGI (Hurry Up and Get Idle), dimana jika sebuah pekerjaan
diselesaikan lebih cepat, CPU akan bisa beristirahat lebih cepat dan menghemat lebih
banyak energi.
5. Kontroler Memori Terintegrasi
Dengan kontroler memori yang terintegrasi pada CPU, keterbatasan Front Side Bus
(FSB), yang selama ini merupakan jalur penghubung CPU dengan chipset, dapat
ditiadakan. Sebagai gantinya digunakan interkoneksi baru, yaitu Intel QuickPath
Interconnect (QPI). CPU dan memori utama berhubungan langsung. Karena chipset dan
CPU menangani tugasnya masing-masing, maka otomatis berimbas pada akses yang
lebih singkat dan cepat.
[“Mengintip” ke dalam Arsitektur Mikro Intel Nehalem] ArOrKom Gasal 2012/2013
Kelompok XC
29
REFERENSI URL
1. Gabriel Torres, Inside Intel Nehalem Microarchitecture,
http://www.hardwaresecrets.com/article/Inside-Intel-Nehalem-Microarchitecture/535/,
Update 26 Agustus 2008
2. Hugo Jobling, Intel Core i7 (Nehalem) Architecture Overview,
http://www.trustedreviews.com/opinions/intel-core-i7-nehalem-architecture-overview, 3
November 2008
3. Dr David Levinthal PhD., Performance Analysis Guide for Intel® Core™ i7 Processor
and Intel® Xeon™ 5500 Processors,
http://software.intel.com/sites/products/collateral/hpc/vtune/performance_analysis_guide.
pdf, 2008-2009
4. Hakiki 456, ARSITEKTUR PROCESSOR TERHADAP DOTHAN, NEHALEM, DAN
SANDY BRIGDE, http://hakiki456.wordpress.com/2012/09/23/arsitektur-procesoor-
terhadap-dothan-nehalem-dan-sandy-brigde/, 23 September 2012
5. Perkembangan Processor Intel, http://blog.ub.ac.id/rosikhan/perkembangan-processor-
intel/, 18 Oktober 2011
6. Ichakhy, Tentang INTEL NAHALEM,
http://ugottaknowit.wordpress.com/tag/perkembangan-intel-dari-masa-ke-masa/, 29
Oktober 2010
7. Arif Setiawan, FITUR BARU INTEL CORE i7,
http://paperittelkom.files.wordpress.com/2010/01/fitur_baru_intel_core_i7.pdf
8. Aulia Rakhmawati , INTEL COREi7,
http://paperittelkom.files.wordpress.com/2010/03/intel_core_i7.pdf
9. Trent Rolf, Cache Organization and Memory Management of the Intel Nehalem
Computer Architecture, http://rolfed.com/nehalem/nehalemPaper.pdf, Desember 2009
10. Microarchitecture, http://en.wikipedia.org/wiki/Microarchitecture, Januari 2010