aquitetura dos processadores multicore

81
ISRAEL JOSÉ DA CUNHA PROCESSADORES MULTI-CORE UNIVERSIDADE DO VALE DO SAPUCAÍ POUSO ALEGRE 2010

Upload: israelcunha

Post on 06-Jan-2017

81 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Aquitetura dos Processadores Multicore

ISRAEL JOSÉ DA CUNHA

PROCESSADORES MULTI-CORE

UNIVERSIDADE DO VALE DO SAPUCAÍ

POUSO ALEGRE

2010

Page 2: Aquitetura dos Processadores Multicore

ISRAEL JOSÉ DA CUNHA

PROCESSADORES MULTI-CORE

Projeto de Processadores multicores.

Arquitetura e Organização de Computadores,

apresentado ao curso de Sistema de

Informação da Universidade do Vale do

Sapucaí como requisito para obtenção de nota

parcial da disciplina Arquitetura e

Organização de Computadores.

UNIVERSIDADE DO4 VALE DO SAPUCAÍ

POUSO ALEGRE

2010

Page 3: Aquitetura dos Processadores Multicore

RESUMO

O processador multicores (que possui vários núcleos) tem como finalidade integrar a

teoria adquirida com a realidade de uma arquitetura.

Para tanto, foram pesquisadas todas as informações necessárias para o

desenvolvimento deste trabalho, com o objetivo de diagnosticar os aspectos com relevância

diante das disciplinas estudadas.

Page 4: Aquitetura dos Processadores Multicore

1 INTRODUÇÃO

Este tem como objetivo detalhar e identificar nos conhecimentos das

arquiteturas e organizações dos processadores novos e antigos.

As modificações nos decores dos anos e as novas tecnologias usadas para

melhoramento dos núcleos dos processadores.

A Intel e a AMD vêm aprimorando seus conhecimentos e inovando suas

tecnologias no mercado.

Page 5: Aquitetura dos Processadores Multicore

2 História do Core Duo

O processamento duplo é adotado há tempos. Essa ferramenta é mais perceptível nos

computadores de grande porte, servidores ou estações de trabalho mais conhecido como

Mainframes, em que se trabalha com dois ou mais processadores acoplados a uma placa mãe.

O interessante a ser frisado é que esses processadores são alocados em soquetes diferentes na

placa e não em uma mesma pastilha, como realizado nos modelos Core Duo atuais.

Antigamente uma das principais preocupações dos fabricantes desses produtos era com a

velocidade (frequência do clock) de processamento, mas os mesmos perceberam que essa

busca poderia sim ser alcançada, contudo o processo resultaria em um consumo de energia

muito alto e em consequência também uma dissipação alarmante de calor. Para um

consumidor utilitário de desktop seria inviável a refrigeração desse processador, além do

custo final ficar bastante elevado.

Deixando o raciocínio de elevar o clock, a lógica agora é duplo processamento e redução

de energia. Esta técnica consiste em acoplar dois processadores em uma mesma pastilha.

Estes trabalharam ao mesmo tempo para a realização da mesma tarefa, logo o trabalho será

concluído bem mais rápido que apenas.com um processador. Este ganho de performance é

melhor visualizado ao se trabalhar com várias tarefas.

Pensando desta forma os dois principais fabricantes desses componentes, Intel e AMD,

lançaram seus produtos com essa tecnologia. Os primeiros lançamentos da Intel baseados

nessa tecnologia foi o Pentium D e o Pentium Extreme Edition, ocorrido em 2005. Ambos são

baseados em uma tecnologia de núcleo denominada NetBurst, herdada do Pentium, tem o

objetivo de proporcionar maior frequência de clock. A principal diferença entre os dois é que

o segundo além de ter dois núcleos, possui também tecnologia Hyper Treading armazenada

nesses núcleos, se comporta como dois processadores reais, no entanto, são processadores

virtuais. Portanto o Sistema operacional irá reconhecê-lo como quatro processadores. Em

2006 a Intel lança novos processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme,

estes com sua nova versão baseados em uma nova tecnologia criada pela mesma e batizada de

Core. Esta visa redução do consumo de energia concomitante a um maior poder de

Page 6: Aquitetura dos Processadores Multicore

processamento. Esta tecnologia permite desativar parte do processador que não esta sendo

utilizado, desta forma usa somente o potencial necessário a realização da tarefa.

O período de lançamento dos processadores Duo da AMD foi também em 2005. Esses

modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o segundo para desktop.

A AMD também planeja projetar processadores com quatro núcleos. Nesta nova proposta

serão implantadas duas pastilhas em socketes diferentes, sendo que cada pastilha conterá dois

processadores, assim totalizando quatro processadores. Logo, seu desempenho será bem

acentuado.

De acordo com as informações colhidas, observa-se que esses processadores são tão

recentes que não há muito o que contar. O que se percebe, na verdade, é um constante

aparecimento de novos modelos de processadores, tanto Intel quanto AMD, com

características diferentes e mais poderosos que os anteriores, contribuindo assim para que

possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo é

atualmente, segundo avaliações feitas por instituições competentes, o mais poderoso,

entretanto os da AMD também são espetaculares a um custo mais baixo, portanto a segunda

opção pode ser mais indicada, visto que a relação custo benefício é ressaltada.

3 Processadores da Intel

3.1 Pentium 4

Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viu se em uma

determinada situação em que trabalhar com processadores de núcleo único já não era mais tão

eficaz quanto ela imaginava. Devido a isso, no final de 2003 (4° período em que a Intel divide

como sendo seu último trimestre), a Intel lançou o Pentium 4 usando a microarquitetura x86

de sétima geração, chamada Netburst. Os processadores Pentium 4 podem encontrados em

três versões de núcleos: Willamette, Northwood e Prescott.

Page 7: Aquitetura dos Processadores Multicore

Os primeiros modelos de Pentium 4 utilizavam soquete 423, que, como o próprio nome já

sugere, possuía 423 terminais. Depois foram lançados modelos de Pentium 4 com soquete

478, que, apesar de possuírem mais contatos do que os modelos anteriores (soquete 423),

eram fisicamente menores. Os modelos atuais utilizam um novo tipo de soquete, chamado

Soquete 775.

Os primeiros modelos de Pentium 4 foram baseados no núcleo Willamette, que possuia

256 KB de cache L2, trabalhava externamente a 400 MHz (100 MHz transferindo quatro

dados por pulso de clock), suporte a instruções SSE2, Tecnologia de construção de 0,18 µm e

42 milhões de transistores ocupando uma área de 217 mm2. O metal utilizado para fazer a

conexão dos transistores e de outros componentes dentro do núcleo é o alumínio.

Em seguida veio o modelo de Pentium 4 baseado no núcleo Northwood. Este núcleo é

cerca de 60% menor do que o núcleo Willamette devido ao seu processo de fabricação de 0,13

µm. O núcleo Northwood pode ser encontrado em versões de 512 KB, barramento externo

rodando a 400 MHz, 533 MHz ou 800 MHz (100 MHz, 133 MHz e 200 MHz transferindo

quatro dados por pulso de clock, respectivamente), suporte a instruções SSE2 e uso de 55

milhões de transistores, ocupando uma área de 131 mm2. O metal utilizado para fazer a

interconexão dos transistores e de outros componentes dentro do núcleo é o cobre.

O núcleo Prescott é construído com Tecnologia de 90 nanômetros (0,09 µm) e é utilizado

nos Processadores Pentium 4 modernos. Pode ser encontrado com 512 KB, 1 MB ou 2 MB de

cache L2, trabalha externamente a 533 MHz ou 800 MHz (133 MHz e 200 MHz transferindo

quatro dados por pulso de clock, respectivamente), suporte às novas instruções SSE3 e uso de

125 milhões de transistores, ocupando uma área de 112 mm2. O metal utilizado para fazer a

interconexão dos transistores e de outros componentes dentro do núcleo é o cobre.

O Pentium Extreme Edition foi lançado em novembro de 2003 e foi o primeiro

processador para Desktop a possuir o cache L3 Integrado, característica esta presente apenas

em processamento voltado ao mercado corporativo. Esse processador possui 2 MB de cache

L3 sendo acessado na mesma freqüência de operação interna do processador. Os primeiros

modelos de Pentium 4 Extreme Edition eram baseados no núcleo Gallatin, que tinha 512 KB

de cache L2 e 2 MB de cache L3, trabalhava externamente a 800 MHz ou 1066 MHz (200

MHz e 266 MHz transferindo quatro dados por pulso de clock, respectivamente), suporte às

instruções SS2, tecnologia Hyper-Threading, tecnologia de construção de 0,13 µm e 178

Page 8: Aquitetura dos Processadores Multicore

milhões de transistores. Os modelos de Pentium 4 Extreme Edition atuais são baseados no

núcleo Prescott 2M com tecnologia de 90 nanômetros.

Enquanto o núcleo Prescott possui 125 milhões de transistores, o núcleo Prescott 2M

possui 169 milhões. A diferença no número de transistores fica por conta do cache L2 de 2

MB presente no núcleo Prescott 2M.

Até o momento a Intel lançou apenas um modelo de Pentium 4 Extreme Edition baseado

no núcleo Prescott 2M. Esse processador possuía 2 MB de cache L2, suporte às instruções

SSE3, tecnologia Hyper-Threading e extensões de 64 bits. Voltado para aplicações de alto

nível e com um rendimento muito bom, trabalhava com instruções MMX, SSE, SSE2 e SSE3.

Nessa versa, Intel simulava um núcleo duplo a partir da tecnologia Hyper Treading, que

visava dividir o processador em dois processadores lógicos. Contudo a Intel, não estava mais

conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline de 31

estágio devido aos problemas, pois acima desse clock, a eletricidade perdida pelos transistores

era alta, tornando assim o Pentium 4, um processador com o consumo e dissipação térmica

altas demais.

3.2 Celeron

Desde o seu lançamento, em abril de 1998, até os dias atuais, o processado Celeron da

Intel vem sofrendo modificações. O nome Celeron é utilizado pela Intel para designar sua

linha de processadores de baixo custo. Na verdade, o Celeron é uma versão econômica dos

processadores top de linha da Intel. Ou seja, o Celeron é uma versão “encapada” do Pentium

II, Pentium III, Pentium 4 ou do Core 2 Duo, com algumas características reduzidas ou

removidas.

O Celeron diferencia-se do Pentium II, Pentium III, Pentium 4 ou do Core 2 Duo em

basicamente três aspectos:

Tamanho do cache L2;

Clock interno;

Page 9: Aquitetura dos Processadores Multicore

Clock do barramento externo.

Essas diferenças fazem com que o Celeron seja mais barato e tenha um desempenho

menor do que os processadores Pentium II, Pentium III, Pentium 4 ou Core 2 Duo, sendo,

portanto, destinado para o mercado de usuários domésticos ou para aqueles que não

necessitam de grande poder computacional.

3.2.1 Celeron D

O Celeron D é baseado no Pentium 4 com núcleo Prescott e é fabricado com tecnologia

de 90 nanômetros ou de 65 nanômetros.

O Celeron D possui 16 KB de cache L1 de dados (o dobro do tamanho encontrado nos

Celeron “Willamette” e “Northwood”), 256 KB ou 512 KB de cache L2, trabalha

externamente a 533 MHz (133 MHz transferindo quatro dados por pulso de clock), suporta as

instruções multimídia SSE3, possui encapsulamento FC-PGA2, utiliza o padrão de pinagem

soquete 478 ou 775 e pode ser encontrado com clocks de 2,13 GHz a 3,2 GHz. Por ser uma

versão “capada” do Pentium 4 Prescott, o Celeron D não suporta a Tecnologia Hyper-

Threading presente no Pentium 4, que permite simular em um único processador físico dois

processadores lógicos.

As principais características do Celeron D são:

Baseado no Pentium 4 com núcleo Prescott;

Tecnologia de Fabricação: 90 nm ou 65 nm;

Cache L1: 16 KB para dados e cache de execução de 150 KB;

Cache L2: 256 KB ou 512 KB;

Clock externo: 533 MHz (133 MHz transferindo quatro dados por pulso de clock);

Encapsulamento: FC-PGA2 (soquete 478) ou FC-LGA (soquete 775);

Soquete: 478 ou 775;

Page 10: Aquitetura dos Processadores Multicore

Passou a suportar as instruções SSE3, além das instruções SSE e SSE2;

Tecnologia Execute Disable em alguns modelos;

Tecnologia EM64T (tecnologia de 64 bits) em alguns modelos.

3.2.2 Celeron Série 400

Os processadores Celeron da série 400 são baseados na microarquitetura Core, a

mesma usada pelos processadores Core 2 Duo tendo, porém, apenas um núcleo

(processadores Core 2 Duo possuem dois núcleos). As principais características técnicas dos

processadores Celeron Série 400 são:

Baseado no núcleo Conroe-L, o mesmo do Core 2 Duo porém com apenas um único

núcleo de processamento.

Tecnologia de Fabricação: 65 nm.

Cache L1: 64 KB, 32 KB para instruções e 32 KB para dados.

Cache L2: 512 KB.

Clock externo: 800 MHz (200 MHz transferindo quatro dados por pulso de clock).

Encapsulamento: FC-LGA6.

Soquete: 775.

Instruções SSE, SSE2 e SSE3.

Tecnologia Execute Disable.

Tecnologia EM64T (tecnologia de 64 bits).

Na tabela abaixo listamos os modelos dos processadores Celeron Série 400 lançados até o

momento. TDP significa Thermal Design Power e indica a dissipação térmica do

Page 11: Aquitetura dos Processadores Multicore

processador, isto é, o cooler do processador deve ser capaz de dissipar pelo menos esta

quantidade de calor.

sSpec Modelo Clock interno Alimentação TDP

SLAFZ 450 2,2 GHz 1,0 V - 1,3375 V 35 W

SL9XL 440 2 GHz 1,050V - 1,300V 35 W

SL9XN 430 1,80 GHz 1,050V - 1,300V 35 W

SL9XP 420 1,60 GHz 1,050V - 1,300V 35 W

3.2.3 Celeron Série E1000

Finalmente a Intel traz para a família Celeron a tecnologia de dois núcleos. A princípio

isto poderia soar contraditório, já que a proposta do Celeron é de ser um processador de baixo

custo voltado para aqueles usuários que não querem ou não podem pagar por um processador

repleto de recursos tecnológicos. Entretanto, a tecnologia de dois núcleos já não pode mais ser

considerada a última inovação tecnológica disponível, historicamente o que a Intel faz é

colocar no mercado intermediário processadores com características que uma vez foram

consideradas top de linha e então, depois de um tempo, integrar essas características também

nos produtos mais baratos. Como os processadores top de linha hoje são de quatro núcleos e a

Intel só tem vendido processadores de dois núcleos para o mercado intermediário a um bom

tempo, nada mais natural do que começar a introduzir processadores de dois núcleos também

no mercado de entrada. Como podemos ver, em um futuro próximo só teremos processadores

com pelo menos dois núcleos de processamento disponíveis à comercialização.

Page 12: Aquitetura dos Processadores Multicore

Os processadores Celeron de dois núcleos são baseados na microarquitetura. Core, a

mesma usada pelos processadores Core 2 Duo. Esses modelos são também conhecidos pelo

seu codinome, Allendale.

Todos os processadores Celeron da série E1000 possuem as seguintes características:

Microarquitetura core;

Tecnologia de dois núcleos;

Tecnologia de fabricação de 65 nm;

Soquete 775;

Instruções SSE3;

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;

Cache L2 de 512 KB compartilhado;

Tecnologia EM64T;

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep.

Na tabela abaixo listamos os modelos de Celeron com dois núcleos já lançados. TDP

significa Thermal Design Power e indica a máxima dissipação térmica do processador, isto é,

o cooler do processador deverá ser capaz de dissipar pelo menos esta quantidade de calor.

sSpec Modelo Clock

interno

Clock

externo TDP

Temp. Máx

(ºC)

Alimentação

(V)

SLAQW E1200 1,6 GHz 800 MHz 65

W 73,3 0,85 - 1,5

SLAR2 E1400 2,0 GHz 800 MHz 65

73,3 0,85 - 1,5

Page 13: Aquitetura dos Processadores Multicore

W

SLAQZ E1500 2,2 GHz 800 MHz 65

W 73,3 0,85 - 1,5

SLAQY E1600 2,4 GHz 800 MHz 65

W 73,3 0,85 - 1,5

3.2.4 Celeron Série E3000

Os processadores Celeron da série E3000 têm dois núcleos de processamento e são

baseados na microarquitetura Core de 45 nm (núcleo Penryn).

Todos os processadores Celeron da série E3000 possuem as seguintes características:

Microarquitetura core;

Tecnologia de dois núcleos;

Tecnologia de fabricação de 45 nm;

Soquete 775;

Instruções SSE4.1;

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;

Cache L2 de 1 MB compartilhado;

Tecnologia EM64T;

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep;

Page 14: Aquitetura dos Processadores Multicore

Tecnologia de Virtualização;

Na tabela abaixo listamos os modelos de Celeron com dois núcleos já lançados. TDP

significa Thermal Design Power e indica a máxima dissipação térmica do processador, isto é,

o cooler do processador deverá ser capaz de dissipar pelo menos esta quantidade de calor.

sSpec Modelo Clock

interno

Clock

externo TDP

Temp.

Máx (ºC)

Alimentação

(V)

SLGTZ E3400 2,6 GHz 800 MHz 65

W 74,1 0,85 - 1,3625

SLGU4 E3300 2,5 GHz 800 MHz 65

W 74,1 0,85 - 1,3625

SLGU5 E3200 2,4 GHz 800 MHz 65

W 74,1 0,85 - 1,3625

3.3 Centrino

Centrino não é um processador para notebooks, mas sim uma plataforma composta por

um conjunto de componentes específicos ditados pela Intel: um determinado processador, um

determinado chipset e uma determinada rede sem fio. Um notebook só pode ser considerado

Centrino se ele possuir esses três componentes.

Até o momento, existem cinco gerações da plataforma Centrino:

A primeira geração da plataforma Centrino (codinome Carmel), lançada em março de 2003, é

formada pelo processador Pentium M (Núcleo Banias), chipset Intel 855 Express e rede sem

fio Intel PRO/Wireless 2100 (802.11b).

Page 15: Aquitetura dos Processadores Multicore

Em julho de 2004 a Intel lançou a 2ª geração da plataforma Centrino, conhecida também pelo

codinome Sonoma. Esta geração é formada pelo processador Pentium M (núcleo Dothan),

chipset Intel 915 Express e rede sem fio Intel PRO/Wireless 2200 ou 2915ABG

(802.11a/b/g).

A 3ª geração da plataforma Centrino trouxe para o notebook o poder computacional dos

processadores de dois núcleos. Esta geração, também conhecida pelo codinome Napa, é

formada pelo processador Core Duo (núcleo Yonah) ou Core 2 Duo (núcleo Merom), chipset

Intel 945 Express e rede sem fio Intel PRO/Wireless 3945ABG (802.11a/b/g). Existe ainda

uma versão da plataforma Centrino que usa o processador Core Solo, que tem apenas um

núcleo de processamento, tal como o Pentium M. Esta geração é chamada Centrino Duo para

indicar que o processador usados nesta plataforma é de dois núcleos.

A 4ª geração da plataforma Centrino, codinome Santa Rosa, é dividida em duas versões:

Centrino Duo e Centrino Pro. A diferença básica entre elas é que o Centrino Pro possui uma

tecnologia de gerenciamento remoto baseada em hardware chamada Intel Active Management

Technology (Intel AMT) que permite identificar e resolver problemas em computadores da

rede remotamente, mesmo que os computadores estejam desligados (mas é necessário que o

micro esteja ligado a uma fonte de energia e esteja com o cabo de rede conectado).

A 5a geração chama-se Centrino 2, codinome Montevina, e tem duas versões: Centrino 2 e

Centrino 2 com tecnologia vPro. Ela é baseada no processador Core 2 Duo ou Core 2 Quad de

45 nm (núcleo Penryn), chipset Intel série 4 para notebooks (GL40, GM45, PM45 e GS45), e

rede sem fio Intel Link série 5000, que aceita conexões 802.11n de até 450 Mbps. Esta

geração requer ainda a presença de rede com fio Gb Ethernet baseada no chip Intel 82567. A

outra versão simplesmente incorpora ainda a tecnologia de segurança e gerenciamento remoto

vPro (nova versão da tecnologia AMT).

Com o lançamento da plataforma Centrino “Santa Rosa”, um componente opcional foi

adicionado à plataforma Centrino: um cache de disco integrado usando memória flash com o

objetivo de aumentar o desempenho e economizar energia. Este componente é chamado Intel

Turbo Memory,conhecido como Tecnologia Robson.

Na tabela abaixo resumimos as especificações de cada geração da plataforma Centrino.

Page 16: Aquitetura dos Processadores Multicore

Plataforma Codinome Processador Chipset Rede Opcional

Centrino Carmel Pentium M

(Banias) Intel 855

Intel PRO / Wireless

2100

Centrino Sonoma Pentium M

(Dothan)

Intel 915

Express

Intel PRO / Wireless

2200BG ou Intel PRO

/ Wireless 2915ABG

Centrino Napa Core Solo Intel 945

Express

Intel PRO / Wireless

3945ABG

Centrino

Duo Napa

Core Duo (Yonah)

ou Core 2 Duo

(Meron)

Intel 945

Express

Intel PRO / Wireless

3945ABG

Centrino

Duo

Santa

Rosa Core 2 Duo

Intel 965

Express

Intel PRO / Wireless

4965AGN

Intel Turbo

Memory

Centrino

Pro

Santa

Rosa Core 2 Duo

Intel 965

Express

Intel PRO / Wireless

4965AGN

Intel Turbo

Memory

Centrino 2 Montevina

Core 2 Duo ou

Core 2 Quad

(Peryn)

Intel Série

4

Intel Gigabit 82567 /

Wireless Série 5000

Intel Turbo

Memory e

vPro.

Page 17: Aquitetura dos Processadores Multicore

3.4 Pentium D

No início de 2004 (Q1), surgiu o Pentium D, processador Dual Core para notebooks, que

começou a se utilizar de 90 nm. O Pentium D, trabalha com instruções MMX, SSE, SSE2,

SSE3 e EM64T, além de se utilizar de uma tecnologia similar à usada no Pentium III, onde

gerencia a energia de modo que o processador só a use quando necessário. E passou a se

destacar devido ao fato de trabalhar com 2 MB de cache L2, O Pentium D é baseado na

microarquitetura x86 de sétima geração da Intel, chamada Netburst, ou seja, tem o

processamento basicamente comparado a dois Pentium 4, trabalhando simultaneamente. Os

processadores Dual Core da Intel, melhoraram bastante ao executar várias tarefas

simultaneamente, já que os processos podem ser divididos entre os dois core, demonstrando

assim um desempenho superior ao do Pentium 4.

A diferença básica do Pentium D é a ausência da tecnologia Hyper-Threading. Nos

processadores Pentium D podem ser encontradas duas versões de núcleos: Smithfield e

Presler.

Todos usando o barramento externo de 800 MHz e as extenções de 64 da Intel (EM64T),

ou seja, o Pentium D é baseado no Pentium 4 séries 6xx.

Há processadores Pentium D que emulam a existência de um segundo processador,

aproveitando partes ociosas do processador para efetuar esta emulação.

Três modelos de Pentium D são anunciados:

Pentium D 820: 2,8 GHz, 1 MB de memória cache L2 para cada núcleo;

Pentium D 830: 3,0 GHz, 1 MB de memória cache L2 para cada núcleo;

Pentium D 840: 3,2 GHz, 1 MB de memória cache L2 para cada núcleo.

3.4.1 Smithfield

Page 18: Aquitetura dos Processadores Multicore

Os Processadores Pentium D da série 800 são baseados no núcleo Smithfield que consiste

em duas pastilhas de silício do núcleo Prescott montadas em um único processador. Ele

possui 230 milhões de transistores ocupando uma área de 206 mm2 e tecnologia de construção

de 90 nm.

As principais características dos processadores Pentium D da série 800 são as seguintes:

Tecnologia de núcleo duplo;

16 KB de cache L1 de dados;

2 MB de cache L2 (1 MB por núcleo);

Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),

533 MHz no caso do Pentium D 805 (133 MHz transferindo quatro dados por pulso de clock);

Suporte às instruções SSE3;

Soquete 775;

Processo de fabricação de 90 nm;

Tecnologia de Memória Estendida de 64 bits (EM64t);

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep (apenas nos modelos 840 e 830), que permite que o

processador reduza o seu clock interno em momentos de ociosidade de modo a economizar

bateria;

Tecnologia Hyper-Threading nos processadores Pentim Extreme Edition. Os processadores

Pentium D não têm esta tecnologia.

3.4.2 Presler

Page 19: Aquitetura dos Processadores Multicore

Os Processadores Pentium D da série 900 são baseados no núcleo Presler, que possui 376

milhões de transistores ocupando uma área de 162 mm2 e tecnologia de construção de 65 nm.

As principais características dos Processadores Pentium D e Pentium Extreme Edition da

série 900 são as seguintes:

Tecnologia de núcleo duplo;

16 KB de cache L1 de dados;

4 MB de cache L2 (2 MB por núcleo);

Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock) nos

Processadores Pentium D ou 1.066 MHz (266 tranferindo quatro dados por pulso de clock)

nos Processadores Pentium Extreme Edition;

Suporte às instruções SSE3;

Soquete 775;

Processo de fabricação de 65 nm;

Tecnologia de Virtualização;

Tecnologia de Memória Estendida de 64 bits (EM64t);

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep, que permite que o processador reduza o seu clock interno

em momentos de ociosidade de modo a economizar bateria;

Tecnologia Hyper-Threading no Processadores Pentium Extreme Edition. Os Processadores

Pentium D não têm esta tecnologia.

3.5 Core Duo

Page 20: Aquitetura dos Processadores Multicore

Este processador adota a arquitetura de construção da família core. Em outras palavras,

esta é uma versão com menor custo do Core 2 Duo que opera com frequência mais baixa e

possui uma quantidade menor de cache L2. As três primeiras versões lançadas deste

processador possuíam FSB de 800 MHz visando manter compatibilidade com placas mãe

mais antigas.

A ideia central deste produto foi muito semelhante àquela adotada pelo Celeron – diminuir

um pouco da “potência” do processador para se obter custos mais baixos. Abaixo você

confere todos os modelos desta linha da Intel com suas respectivas especificações. Esta

geração de processadores da Intel foi lançada para substituir completamente a Netburst, que

até então vinha sendo utilizada. As principais características dos processadores desta família

são: 64 KB de cache L1 (em dois blocos, 32 KB para dados + 32 KB para instruções) por

núcleo; socket 775 (exceção: Core 2 Extreme no modelo QX9775 que utiliza o 771); cache de

memória L2 a partir de 2MB compartilhado e tecnologia de virtualização.

Os computadores que adotam processadores com tecnologia core 2 são mais rápidos,

eficientes e consomem menor quantidade de energia do que seus antecessores. Além disso,

toda a parte de multitarefa e processamento foi aperfeiçoada para garantir maior satisfação

mesmo para os usuários mais exigentes (veja Figura 1).

Page 21: Aquitetura dos Processadores Multicore

Figura 1: Representação de comparação de núcleos.

3.5.1 Core 2 Duo

Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o Core 2 Duo e

o Core 2 Duo Extreme, a partir desse momento o Pentium 4 se torna parte do passado. Dando

lugar aos processadores com 2 ou 4 núcleos unificados trabalhando em apenas 10 ciclos

contra os 14 do Pentium D.

O Core 2 Duo passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3, SSE4 e

EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo passa a trabalhar com

65 nm. Além de possuir barramentos superiores a 800 Mhz, alguns chegam até 1066 MHz o

que possibilita até 4 transferências de 266 Mhz por ciclo). O cache L1 do Core 2 Duo ou

Conroe nome genérico usado pela Intel trabalha com 8 linhas de associação contra apenas 2

do seu concorrente direto.

Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação ser

encontrada. O cache L2, que pode chegar até 4 Mb, é acessado através de um barramento de

dados de 256 bits. E uma das novidades mais significativas do Core 2 Duo é o Macro-Fusion,

que permite diversos pares de instruções comuns combinados em uma única instrução, ao

invés de serem processados individualmente. Isso gera um efeito benéfico ao processador que

economiza espaço nos buffers de memória, economiza processamento no agendador de

instruções ou scheduler e assim por diante, causando até 11% de ganho bruto em nível de

desempenho se comparado a um de seus antecessores: o Pentium 4.

O grande forte do Core 2 Duo está na decodificação das instruções, pois processa as

instruções SSE de 128 bits em apenas um ciclo, o que causa grande agilidade.

As principais características técnicas dos processadores Core 2 Duo são as seguintes:

64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;

Tecnologia de um (Core 2 Solo), dois (Core 2 Duo, alguns modelos de Core 2 Extreme) ou

quatro núcleos (Core 2 Quad, alguns modelos de Core 2 Extreme);

Page 22: Aquitetura dos Processadores Multicore

Tecnologia de fabricação de 65 nm ou 45 nm;

Soquete 775 nos modelos para computadores de mesa (soquete 771 no Core 2 Extreme

QX9775);

Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),

1.066 MHz (266 MHz transferindo quatro dados por pulso de clock), 1.333 MHz (333 MHz

transferindo quatro dados por pulso de clock) ou 1.600 MHz (400 MHz transferindo quatro

dados por pulso de clock);

2 MB, 3 MB, 4 MB ou 6 MB de cache de memória L2 compartilhado. Nos processadores de

quatro núcleos, cada par de núcleos tem seu próprio cache, compartilhado entre os dois

núcleos mais independente dos outros dois;

Tecnologia de Virtualização (exceto no Core 2 Duo modelos E4x00, E7x00 e E81xx);

Tecnologia Intel EM64T;

Instruções SSE3;

Instruções SSE4.1 nos modelos de 45 nm;

Execute Disable;

Intelligent Power Capability;

Tecnologia Enhanced SpeedStep.

3.5.2 Quad Core

Com o lançamento da mais nova plataforma de sistema operacional da Microsoft, o

Windows Vista no final de 2006 (Q4 para a Intel), a Intel lançou um processador que seria o

melhor para tal sistema. Assim surge no mercado o Intel Quad Core, que possui as mesmas

características que o Core 2 Duo, porém, possui ao invés de 2 núcleos, 4 e somente em

Page 23: Aquitetura dos Processadores Multicore

versões com 4 Mb de cache L2, o que o torna o mais rápido do mercado ao lado do Core 2

Duo Extreme.

3.5.3 Quad 2 Duo e tendências futuras

Já em janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com cerca de 45

nm, a nova geração de processadores dessa linha, com consumo de energia ainda menor, onde

a Intel buscava viabilizar o lançamento de versões ainda mais velozes e com maior poder de

processamento.

As principais características técnicas dos processadores Quad Core são as seguintes:

64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;

Tecnologia de um (Core 2 Solo), dois (Core 2 Duo, alguns modelos de Core 2 Extreme) ou

quatro núcleos (Core 2 Quad, alguns modelos de Core 2 Extreme);

Tecnologia de fabricação de 65 nm ou 45 nm;

Soquete 775 nos modelos para computadores de mesa (soquete 771 no Core 2 Extreme

QX9775);

Barramento externo de 800 MHz (200 MHz transferindo quatro dados por pulso de clock),

1.066 MHz (266 MHz transferindo quatro dados por pulso de clock), 1.333 MHz (333 MHz

transferindo quatro dados por pulso de clock) ou 1.600 MHz (400 MHz transferindo quatro

dados por pulso de clock);

2 MB, 3 MB, 4 MB ou 6 MB de cache de memória L2 compartilhado. Nos processadores de

quatro núcleos, cada par de núcleos tem seu próprio cache, compartilhado entre os dois

núcleos mais independente dos outros dois;

Tecnologia de Virtualização (exceto no Core 2 Duo modelos E4x00, E7x00 e E81xx);

Tecnologia Intel EM64T;

Page 24: Aquitetura dos Processadores Multicore

Instruções SSE3;

Instruções SSE4.1 nos modelos de 45 nm;

Execute Disable;

Intelligent Power Capability;

Tecnologia Enhanced SpeedStep;

3.5.4 Core i7

O Core i7 é o primeiro processador da Intel com controlador de memória integrado,

recurso já disponível nos processadores da AMD desde o Athlon 64. É baseado na arquitetura

Core, assim como o Core 2 Duo e Core 2 Quad, porém com diversos aprimoramentos para o

aumento do desempenho (microarquitetura Nehalem). Esse processador está disponível em

três diferentes soquetes, LGA1366 (arquitetura de memória de três canais e barramento QPI),

LGA1156 (arquitetura de memória de dois canais, controlador PCI Express 2.0 e barramento

DMI) e PGA988 para notebooks (com as mesmas especificações do LGA1156).

Tradicionalmente os processadores da Intel utilizam um controlador de memória externo,

localizado no chip ponte norte (também conhecido como MCH ou Hub Controlador de

Memória) do chipset. Isto significa que com processadores usando esta arquitetura o chipset

(e conseqüentemente a placa-mãe) é o componente que determina qual a tecnologia e a

quantidade de memória que você pode instalar no micro. Como no Core i7 o controlador de

memória está embutido no processador, é este – e não mais o chipset – que define qual

tecnologia e a quantidade de memória você pode ter instalada no micro. A placa-mãe, no

entanto, pode ter uma limitação na quantidade de memória instalada. O controlador de

memória integrado no Core i7 aceita apenas memórias DDR3 (até 1,6 V; memórias que

requerem mais do que isto não funcionarão e podem inclusive danificar o processador). Os

modelos soquete 1366 suportam a nova arquitetura de três canais com memórias DDR3-800 e

DDR3-1066, enquanto os modelos para soquetes 1156 e 988 suportam a (já padrão)

arquitetura de dois canais e memórias DDR3-800, DDR3-1066 e DDR3-1333.

Page 25: Aquitetura dos Processadores Multicore

A arquitetura de três canais dos modelos soquete 1366 permite ao processador acessar

três módulos de memória ao mesmo tempo para gravar e ler dados, aumentando a quantidade

de bits que são transferidos por pulso de clock de 128 (na arquitetura de dois canais) para 192.

Em teoria a arquitetura de três canais oferece um aumento de 50% na largura de banda em

relação à arquitetura de dois canais rodando com o mesmo clock. Por exemplo, memórias

DDR3-1066 trabalhando no modo de dois canais têm uma taxa de transferência máxima

teórica de 17 GB, enquanto que na arquitetura de três canais elas têm uma taxa de

transferência máxima de 25,5 GB/s.

Os processadores soquete 1366 comunicam-se com o restante do sistema por meio de um

novo barramento chamado QPI (Quick Path Interconnect), que trabalha a 2,4 GHz (4,8 GB/s)

no Core i7 e a 3,2 GHz (6,4 GB/s) no Core i7 Extreme. Nos modelos soquete 1156 e 988 o

processador também tem um controlador PCI Express 2.0 integrado, então nesses

processadores a placa de vídeo está conectada diretamente ao processador, o que em teoria

pode aumentar a taxa de transferência da placa de vídeo obtida na prática. Esses

processadores podem comunicar-se com uma placa de vídeo na velocidade x16 ou com duas

placas de vídeo a x8 cada. Como nesses modelos o controlador PCI Express 2.0 fica dentro do

processador, a Intel decidiu usar um barramento de menor velocidade chamado DMI (Digital

Media Interface), que opera a 2 GB, para conectar o processador ao chipset. Esse barramento

é usado para a comunicação entre a ponte norte e a ponte sul nos chipsets anteriores da Intel.

Essa largura de banda baixa não é problema, já que a razão para a alta largura de banda do

QPI é que ele é usado para conectar o processador ao controlador PCI Express 2.0 presentes

na ponte norte e já que nos processadores soquete 1156 e 988 esse componente fica dentro do

processador, um barramento de alta velocidade não é mais necessário. Os processadores core

i7 possuem uma tecnologia chamada Turbo Boost, que é um recurso de overclock automático.

Quando o processador percebe que precisa de mais poder de processamento, ele aumenta o

clock interno acima do clock padrão, automaticamente.

Outra característica interessante é a tecnologia Hyper-Threading, que simula dois

processadores lógicos para cada núcleo de processamento. Assim, como o Core i7 tem quatro

núcleos "reais", o sistema operacional detecta oito núcleos "virtuais", ou seja, oito

processadores.

Page 26: Aquitetura dos Processadores Multicore

O Core i7 Extreme é a versão mais poderosa (e cara) do Core i7. Suas principais

diferenças são o multiplicador destravado, além de velocidades do clock do processador e do

barramento QPI (apenas nos modelos soquete 1366) mais altas.

As principais características técnicas dos processadores da família corem i7 são as

seguintes:

Microarquitetura Nehalem;

64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;

256 KB de cache L2 por núcleo;

4 MB, 6 MB ou 8 MB de cache de memória L3 compartilhado;

Tecnologia de dois ou quatro núcleos;

Soquete 1366 ou 1156 nos processadores para desktops, soquete 988 nos modelos para

notebooks;

Barramento QPI rodando a 2,4 GHz (4,8 GB/s) ou a 3,2 GHz (6,4 GB/s) nos modelos soquete

1366;

Barramento DMI (2 GB/s) nos modelos soquete 1156 e 988;

Controlador de memória integrado suportando arquitetura de dois canais (soquetes 1156 e

988) ou três canais (soquete 1366);

Suporte a memórias DDR3 até 1066 MHz (soquete 1366) ou até 1333 MHz (soquetes 1156 e

988);

Controlador PCI Express 2.0 embutido nos modelos soquete 1156 e 988 (uma pista x16

ou duas x8);

Controlador gráfico embutido em alguns modelos para notebooks;

Tecnologia Turbo Boost;

Tecnologia de Virtualização;

Page 27: Aquitetura dos Processadores Multicore

Tecnologia Intel EM64T;

Tecnologia Hyper-Threading; (HT)

Instruções SSE4.2;

Instruções AES-NIS (nos modelos de 32 nm comente);

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep;

Processo de fabricação de 32 nm ou 45 nm.

Como falamos anteriormente, modelos para soquete 1366 (modelos começando com

"9") têm um controlador de memória de três canais integrado suportando memórias DDR3

até 1066 MHz, enquanto nos modelos soquete 1156 (modelos começando com o número "8")

o controlador de memória embutido suporta arquitetura de dois canais e memórias DDR3 até

1333 MHz. Os modelos soquete 1156 têm um controlador PCI Express 2.0 integrado

suportando uma pista x16 ou duas x8. A comunicação dos modelos soquete 1366 com o

mundo externo é feita por meio de um barramento QPI rodando a 2,4 GHz (4,8 GB/s)

enquanto os modelos soquete 1156 usam um barramento DMI (2 GB). Turbo Boost é um

overclock automático efetuado pelo processador quando ele "sente" que é necessário mais

poder de processamento. Aqui listamos o clock máximo atingido pelo processador quando

esse modo está habilitado.

sSpec Modelo Clock

Interno

Turbo

Boost

TDP

(W)

Temp. Máxima

(oC)

Alimentação

(V) Soquete

SLBEU 960 3,2 GHz 3,46 GHz 130 67,9 0,8 - 1,375 1366

SLBEN 950 3,06 GHz 3,32 GHz 130 67,9 0,8 - 1,375 1366

SLBCK 940 2,93 GHz 3,2 GHz 130 67,9 0,8 - 1,375 1366

Page 28: Aquitetura dos Processadores Multicore

SLBEJ 920 2,66 GHz 2,93 GHz 130 67,9 0,8 - 1,375 1366

SLBCH 920 2,66 GHz 2,93 GHz 130 67,9 0,8 - 1,375 1366

SLBJG 870 2,93 GHz 3,6 GHz 95 72,7 0,64 - 1,4 1156

SLBLG 860s 2,53 GHz 3,46 GHz 82 76,7 0,65 - 1,4 1156

SLBJJ 860 2,8 GHz 3,46 GHz 95 72,7 0,65 - 1,4 1156

Na tabela abaixo listamos os modelos do processador Core i7 Extreme para desktops

lançados até o momento. Esses modelos têm um barramento QPI funcionando a uma

velocidade maior (3,2 GHz, 6,4 GB/s) e têm seu multiplicador de clock destravado, dando

mais essa possibilidade de overclock.

sSpec Modelo Clock

Interno

Turbo

Boost

TDP

(W)

Temp. Máxima

(oC)

Alimentação

(V) Soquete

SLBEQ 975 3,33 GHz 3,6 GHz 130 67,9 0,8 - 1,375 1366

SLBCJ 965 3,2 GHz 3,46 GHz 130 67,9 0,8 - 1,375 1366

Os modelos de Core i7 para notebooks usam um soquete chamado PGA988. Eles têm

as mesmas características dos modelos soquete 1156: controlador de memória DDR3 de dois

canais integrados (o clock de memória máximo suportado depende do processador, ver coluna

"Mem." na tabela abaixo; modelos que suportam memórias DDR3 até 1.333 MHz também

suportam memórias de 1.066 MHz mas não memórias de 800 MHz; modelos que suportam

memórias de 1.066 MHz também suportam memórias de 800 MHz), controlador PCI Express

2.0 integrado, suportando um dispositivo na velocidade x16 ou dois dispositivos x8 e

Page 29: Aquitetura dos Processadores Multicore

barramento DMI. A maior diferença entre os modelos para notebooks e os de computadores

de mesa são as frequências de clock para economizar bateria, os modelos para notebooks têm

um clock bem mais baixo. Porém, quando necessário, eles se "transformam" em

processadores de alto desempenho, como você pode ver nas tabelas abaixo. Os modelos

começados com o dígito "6" têm um controlador gráfico DirectX 10 integrado rodando a 733

MHz com 12 processadores gráficos ("unidades de sombreamento").

sSpec Modelo Clock

Interno

Turbo

Boost Tecn. Núcleos

Cache

L3 Mem.

TDP

(W)

Temp.

Máxima

(oC)

Alimentação (V)

SLBLX I7-

820QM

1,733

GHz

3,06

GHz

45

nm 4 8 MB

1333

MHz 45 100 0,65 - 1,4

SLBLY I7-

720QM 1,6 GHz

3,28

GHz

45

nm 4 6 MB

1333

MHz 45 100 0,65 - 1,4

SLBMM I7-

640UM 1,2 GHz

2,26

GHz

32

nm 2 4 MB

800

MHz 18 105 -

SLBMK I7-

640LM

2,13

GHz

2,93

GHz

32

nm 2 4 MB

1066

MHz 25 105 -

SLBMN I7-

620UM

1,06

GHz

2,13

GHz

32

nm 2 4 MB

800

MHz 18 105 -

Page 30: Aquitetura dos Processadores Multicore

SLBPE I7-

620M

2,66

GHz

3,33

GHz

32

nm 2 4 MB

1066

MHz 35 105 -

SLBPD I7-

620M

2,66

GHz

3,33

GHz

32

nm 2 4 MB

1066

MHz 35 105 -

SLBML I7-

620LM 2,0 GHz

2,8

GHz

32

nm 2 4 MB

1066

MHz 25 105 -

Na tabela abaixo listamos os modelos do processador Core i7 Extreme para notebooks

lançados até o momento. Eles têm o multiplicador de clock destravado, adicionando mais uma

opção de overclock.

sSpec Modelo Clock

Interno

Turbo

Boost

Cache

L3 Mem.

TDP

(W)

Temp.

Máxima (oC)

Alimentação

(V)

SLBLW 920XM 2,0 GHz 3,2 GHz 8 MB 1333

MHz 55 100 0,65 - 1,4

3.5.5 Core i5

O Core i5 é a segunda linha de processadores da Intel lançada com um controlador de

memória integrado, recurso já disponível nos processadores da AMD desde o Athlon 64. É

baseado na arquitetura Core, assim como o Core 2 Duo e Core 2 Quad, porém com diversos

aprimoramentos para o aumento do desempenho (microarquitetura Nehalem). Esse

processador está disponível em dois soquetes, LGA1156 (para computadores de mesa) e

PGA988 (para notebooks). Os processadores da Intel baseados nas arquiteturas anteriores (até

os modelos para soquete 775) utilizam um controlador de memória externo localizado no chip

ponte norte (também conhecido como MCH ou Hub Controlador de Memória) do chipset. Isto

Page 31: Aquitetura dos Processadores Multicore

significa que, com processadores usando esta arquitetura, o chipset (e conseqüentemente a

placa-mãe) é o componente que determina qual a tecnologia e a quantidade de memória que

você pode instalar no micro. No Core i5, assim como no Core i7, o controlador de memória

está embutido no processador, é este – e não mais o chipset – que define qual tecnologia e a

quantidade de memória que pode ser instalada no micro. A placa-mãe, no entanto, pode ter

limitação na quantidade de memória instalada. O controlador de memória integrado no Core

i5 aceita apenas memórias DDR3 (até 1,6 V; memórias que requerem mais do que isto não

funcionarão e podem inclusive danificar o processador). Os processadores core i5 suportam a

arquitetura de dois canais e memórias DDR3-1066 e DDR3-1333 nos modelos

para computadores de mesa e memórias DDR3-800 e DDR3-1066 nos modelos para

computadores portáteis.

Processador Core i5 tem também um controlador PCI Express 2.0 integrado, logo nesses

processadores a placa de vídeo externa está conectada diretamente ao processador, o que em

teoria pode aumentar a taxa de transferência que a placa de vídeo pode obter na prática. Esses

processadores podem comunicar-se com uma placa de vídeo na velocidade x16 ou com duas

placas de vídeo a x8 cada, nos modelos sem vídeo integrado (nos modelos com vídeo

integrado, esse barramento pode conectar apenas uma placa de vídeo a x16). Como nesses

modelos, o controlador PCI Express 2.0 fica dentro do processador, a Intel decidiu usar um

barramento de menor velocidade chamado DMI (Digital Media Interface), que opera a 2 Gb

para conectar o processador ao chipset. Esse barramento é usado na comunicação entre a

ponte norte e a ponte sul nos chipsets anteriores da Intel. Essa largura de banda aparentemente

baixa não é problema, já que um barramento externo de alta velocidade para a comunicação

com o chipset não é mais necessário visto que tanto a placa de vídeo quanto a memória estão

conectadas diretamente ao processador.

Os modelos fabricados com tecnologia de 32 nm (modelos 6xx para computadores de

mesa e em todos os modelos para notebooks) têm um controlador de vídeo integrado dentro

do processador, isto é, o vídeo "on-board" é controlado pelo processador e não pelo chipset da

placa-mãe.

Processadores Core i5 utilizam um clock base de 133 MHz a partir do qual seus outros

clocks são gerados, cada um de acordo com seu multiplicador específico, possuem

a tecnologia chamada Turbo Boost, que é um recurso de overclock automático. Quanto o

Page 32: Aquitetura dos Processadores Multicore

processador percebe que precisa de mais poder de processamento, ele aumenta o clock interno

acima do clock padrão, automaticamente.

As principais características técnicas dos processadores da família Core i5 são as

seguintes:

Microarquitetura Nehalem;

64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;

256 KB de cache L2 por núcleo;

3 MB, 4 MB ou 8 MB de cache de memória L3 compartilhado;

Tecnologia de dois ou quatro núcleos;

Soquete 1156 nos processadores para computadores de mesa, soquete 988 nos modelos para

notebooks;

Barramento DMI (2 GB/s);

Controlador de memória integrado suportando arquitetura de dois canais;

Suporte a memórias DDR3 até 1066 MHz (modelos para notebooks) ou até 1333 MHz

(modelos para computadores de mesa);

Controlador gráfico embutido em alguns modelos, rodando a 500 MHz, 733 MHz ou 900

MHz.

Tecnologia Turbo Boost;

Tecnologia de Virtualização;

Tecnologia Intel EM64T;

Tecnologia Hyper-Threading (HT) em alguns modelos;

Instruções SSE4.2;

Instruções AES-NIS (nos modelos de 32 nm somente);

Page 33: Aquitetura dos Processadores Multicore

Tecnologia Execute Disable;

Tecnologia Enhanced SpeedStep;

Processo de fabricação de 32 nm ou 45 nm;

O controlador de memória embutido suporta arquitetura de dois canais e memórias DDR3

até 1333 MHz, além de um controlador PCI Express 2.0 integrado, suportando uma pista x16

ou duas x8. A comunicação com o chipset da placa-mãe é feita por meio de um barramento

DMI (2 Gb). Os modelos começando com o número "6" têm ainda controlador de vídeo

integrado rodando a 900 MHz nos modelos terminados em "1" e a 733 MHz nos modelos

terminados em "0".

Turbo Boost é um overclock automático efetuado pelo processador quando ele "sente"

que é necessário mais poder de processamento. Aqui listamos o clock máximo atingido pelo

processador quando esse modo está habilitado. Alguns modelos posssuem a tecnologia

Hyper-Threading, que simula um núcleo de processamento extraem cada núcleo "real". Assim

o sistema operacional e programas reconhecem esses processadores como tendo quatro

núcleos, apesar de apenas dois estarem fisicamente presentes.

sSpec Modelo Clock

Interno

Turbo

Boost Núcleos HT Vídeo

Cache

L3 Tecn.

TDP

(W)

Temp.

Máxima

(oC)

Alimentação

(V)

SLBLH i5-750S 2,40

GHz

3,2

GHz 4 Não Não 8 MB

45

nm 82 76,7 0,65 - 1,4

SLBLC i5-750 2,66

GHz

3,2

GHz 4 Não Não 8 MB

45

nm 95 72,7 0,65 - 1,4

SLBTM i5-680 3,6

GHz

4,86

GHz 2 Sim Sim 4 MB

32

nm 73

0,65 - 1,4

Page 34: Aquitetura dos Processadores Multicore

SLBLT i5-670 3,56

GHz

3,73

GHz 2 Sim Sim 4 MB

32

nm 73 72,6 0,65 - 1,4

SLBNE i5-661 3,33

GHz

3,6

GHz 2 Sim Sim 4 MB

32

nm 87 69,8 0,65 - 1,4

SLBLV i5-660 3,33

GHz

3,6

GHz 2 Sim Sim 4 MB

32

nm 73 72,6 0,65 - 1,4

SLBLK i5-650 3,20

GHz

3,46

GHz 2 Sim Sim 4 MB

32

nm 73 72,6 0,65 - 1,4

Os modelos de Core i5 para notebooks usam um soquete chamado PGA988, possuindo

um controlador de memória DDR3 de dois canais integrado, sendo que até o momento os

modelos disponíveis suportam apenas memórias DDR3 de 800 MHz e de 1066 MHz. Eles

possuem ainda controlador PCI Express 2.0 integrado suportando um dispositivo na

velocidade x16 e um controlador de vídeo integrado rodando a 500 MHz.

A maior diferença entre os modelos para notebooks e os para computadores de mesa são

as frequências de clock: para economizar bateria, os modelos para notebooks têm um clock

bem mais baixo. Porém, quando necessário, eles se "transformam" em processadores de alto

desempenho através da tecnologia Turbo Boost, como você pode ver nas tabelas abaixo.

Todos os modelos para notebooks possuem dois núcleos de processamento com

tecnologia Hyper-Threading (que simula um núcleo de processamento em cada núcleo "real").

Assim o sistema operacional e programas reconhecem esses processadores como tendo quatro

núcleos, apesar de apenas dois estarem fisicamente presentes.

sSpec Modelo Clock

Interno

Turbo

Boost Núcleos HT Tecn.

Cache

L3

TDP

(W)

Temp.

Máxima (oC)

Page 35: Aquitetura dos Processadores Multicore

SLBPF i5-540M 2,53 GHz 3,06 GHz 2 Sim 32

nm 3 MB 35 105

SLBPG i5-540M 2,53 GHz 3,06 GHz 2 Sim 32

nm 3 MB 35 105

SLBQP i5-

520UM 1,066 GHz

1,866

GHz 2 Sim

32

nm 3 MB 18 105

SLBP6 i5-520E 2,4 GHz 2,93 GHz 2 Sim 32

nm 3 MB 35 105

SLBNA i5-520M 2,4 GHz 2,93 GHz 2 Sim 32

nm 3 MB 35 105

SLBNB i5-520M 2,4 GHz 2,93 GHz 2 Sim 32

nm 3 MB 35 105

SLBPM i5-430M 2,26 GHz 2,53 GHz 2 Sim 32

nm 3 MB 35 105

SLBPN i5-430M 2,26 GHz 2,53 GHz 2 Sim 32

nm 3 MB 35 105

3.5.6 Core i3

O Core i3 é o novo processador da Intel voltado para computadores de baixo custo. Ele é

a terceira linha de processadores da Intel lançada com um controlador de memória integrado

Page 36: Aquitetura dos Processadores Multicore

(o Core i7 e o Core i5 foram as primeiras), recurso já disponível nos processadores da AMD

desde o Athlon 64. Ele é baseado na arquitetura Core, assim como o Core 2 Duo e Core 2

Quad, porém com diversos aprimoramentos para o aumento do desempenho (microarquitetura

Nehalem). Esse processador está disponível em dois soquetes, LGA1156 (para computadores

de mesa) e PGA988 (para notebooks).

Os processadores da Intel baseados nas arquiteturas anteriores (até os modelos para

soquete 775) utilizam um controlador de memória externo localizado no chip ponte norte

(também conhecido como MCH ou Hub Controlador de Memória) do chipset. Com

processadores usando esta arquitetura o chipset (e conseqüentemente a placa-mãe) é o

componente que determina qual a tecnologia e a quantidade de memória que você pode

instalar no micro. Como no Core i3, assim como no Core i5 e no Core i7, o controlador de

memória está embutido no processador, é este – e não mais o chipset – que define qual

tecnologia e a quantidade de memória você pode ter instalada no micro. A placa-mãe, no

entanto, pode ter uma limitação na quantidade de memória instalada. O controlador de

memória integrado no Core i3 aceita apenas memórias DDR3 (até 1,6 V; memórias que

requerem mais do que isto não funcionarão e podem inclusive danificar o processador). Os

processadores Core i3 suportam a arquitetura de dois canais e memórias DDR3-1066 e

DDR3-1333 nos modelos para computadores de mesa e memórias DDR3-800 e DDR3-1066

nos modelos para computadores portáteis.

Processadores Core i3 têm também um controlador PCI Express 2.0 integrado, logo

nesses processadores a placa de vídeo externa está conectada diretamente ao processador, o

que em teoria pode aumentar a taxa de transferência que a placa de vídeo pode obter na

prática. Esses processadores podem comunicar-se com uma placa de vídeo na velocidade x16.

Como nesses modelos o controlador PCI Express 2.0 fica dentro do processador, a Intel

decidiu usar um barramento de menor velocidade chamado DMI (Digital Media Interface),

que opera a 2 GB/s, para conectar o processador ao chipset. Esse barramento é usado na

comunicação entre a ponte norte e a ponte sul nos chipsets anteriores da Intel. Essa largura de

banda aparentemente baixa não é problema, já que um barramento externo de alta velocidade

para a comunicação com o chipset não é mais necessário visto que tanto a placa de vídeo

quanto a memória estão conectadas diretamente ao processador.

Page 37: Aquitetura dos Processadores Multicore

Todos os modelos do Core i3 são fabricados com tecnologia de 32 nm e têm um

controlador de vídeo integrado dentro do processador, isto é, o vídeo "on-board" é controlado

pelo processador e não pelo chipset da placa-mãe.

Os processadores Core i3 utilizam um clock base de 133 MHz a partir do qual seus outros

clocks são gerados, cada um de acordo com seu multiplicador específico e não possuem a

tecnologia Turbo Boost, que é um recurso de overclock automático presente nos Core i5 e

Core i7.

As principais características técnicas dos processadores da família corem i3 são as

seguintes:

Microarquitetura Nehalem;

64 KB de cache L1 (32 KB de dados + 32 KB de instruções) por núcleo;

256 KB de cache L2 por núcleo;

4 MB de cache de memória L3 compartilhado nos modelos para computadores de mesa;

3 MB de cache de memória L3 compartilhado nos modelos para notebooks;

Tecnologia de dois núcleos;

Soquete 1156 nos processadores para computadores de mesa, soquete 988 nos modelos para

notebooks;

Barramento DMI (2 GB/s);

Controlador de memória integrado suportando arquitetura de dois canais;

Suporte a memórias DDR3 até 1066 MHz (modelos para notebooks) ou até 1333 MHz

(modelos para computadores de mesa);

Controlador PCI Express 2.0 embutido (uma pista x16);

Controlador gráfico embutido, rodando a 500 MHz nos modelos para notebooks e 733 MHz

nos modelos de mesa;

Tecnologia de Virtualização;

Page 38: Aquitetura dos Processadores Multicore

Tecnologia Intel EM64T;

Tecnologia Hyper-Threading (HT);

Instruções SSE4.2;

Instruções AES-NIS;

Tecnologia Execute Disable ;

Tecnologia Enhanced SpeedStep;

Processo de fabricação de 32 nm.

Na tabela abaixo listamos todos os modelos de processadores Core i3 para desktops

lançados até o momento. O controlador de memória embutido suporta arquitetura de dois

canais e memórias DDR3 até 1333 MHz, além de um controlador PCI Express 2.0 integrado

suportando uma pista x16. A comunicação com o chipset da placa-mãe é feita por meio de um

barramento DMI (2 GB/s). Todos os modelos de Core i3 possuem um controlador de vídeo

integrado rodando a 733 MHz.

Esses processadores possuem a tecnologia Hyper-Threading, que simula um núcleo de

processamento extraem cada núcleo "real". Assim o sistema operacional e programas

reconhecem esses processadores como tendo quatro núcleos, apesar de apenas dois estarem

fisicamente presentes.Alguns modelos na tabela abaixo.

sSpec Modelo Clock

Interno Núcleos HT Vídeo

Cache

L3 Tecn.

TDP

(W)

Temp.

Máxima

(oC)

Alimentação

(V)

SLBMQ i3-540 3,06 GHz 2 Sim Sim 4 MB 32

nm 73 72,6 0,64 - 1,4

SLBLR i3-530 2,93 GHz 2 Sim Sim 4 MB 32

73 72,6 0,65 - 1,4

Page 39: Aquitetura dos Processadores Multicore

nm

Os modelos de Core i3 para notebooks usam um soquete chamado PGA988, possuindo

um controlador de memória DDR3 de dois canais integrado, sendo que até o momento os

modelos disponíveis suportam apenas memórias DDR3 de 800 MHz e de 1066 MHz. Eles

possuem ainda controlador PCI Express 2.0 integrado suportando um dispositivo na

velocidade x16 e um controlador de vídeo integrado rodando a 500 MHz.

A maior diferença entre os modelos para notebooks e os para computadores de mesa são

as frequências de clock: para economizar bateria, os modelos para notebooks têm um clock

bem mais baixo.

Todos os modelos para notebooks possuem dois núcleos de processamento com

tecnologia Hyper-Threading (que simula um núcleo de processamento em cada núcleo "real").

Assim o sistema operacional e programas reconhecem esses processadores como tendo quatro

núcleos, apesar de apenas dois estarem fisicamente presentes. Alguns modelos na tabela

abaixo.

sSpec Modelo Clock

Interno Núcleos HT Tecn.

Cache

L3

TDP

(W)

Temp. Máxima

(oC)

SLBMD i3-

330M 2,26 GHz 2 Sim 32 nm 3 MB 35 90

SLBPK i3-

350M 2,13 GHz 2 Sim 32 nm 3 MB 35 90

3.6 Atom

Page 40: Aquitetura dos Processadores Multicore

O Atom é um processador de baixo consumo da Intel voltado para os mercados de

notebooks e de dispositivos móveis com acesso à internet.

Há duas versões do processador Atom. O Atom das séries 2xx, 3xx, Nxxx e Dxxx –

codinome “Diamondville” – é voltado para o mercado de notebooks e desktops compactos de

baixo consumo (já que eles usam chipsets Intel da série 945, que são maiores e usam dois

chips), enquanto que o Atom série Z5xx – codinome “Silverthorne” – é voltado para o

mercado de dispositivos móveis com acesso à internet, não apenas porque ele usa um novo

chipset chamado US15W, que é muito menor e usa apenas um chip, mas também porque os

processadores Atom Z5xx são fisicamente menores do que os processadores Atom anteriores

(14 x 13 mm contra 22 x 22 mm). As pinagens também são diferentes, sendo que a série Z5xx

usa um padrão de 441 pinos contra 437 pinos das outras séries.

O Atom é baseado em uma microarquitetura diferente das atualmente usadas nos demais

processadores Intel (arquitetura Core) mas contendo o mesmo conjunto de instruções x86

presentes nos processadores da arquitetura Core (Core 2 Duo, por exemplo). Uma das

principais diferenças entre a microarquitetura do Atom em relação aos processadores

atualmente usados em PCs é que ela executa microinstruções em ordem, tal como era até o

primeiro Pentium, e não fora de ordem, como ocorre do Pentium Pro, Pentium II e superiores.

Isto foi feito com o intuito de reduzir o consumo do processador, já que os

componentes necessários para enviar e controlar as microinstruções a serem executadas

puderam ser removidos. O Atom é capaz de decodificar duas instruções por pulso de clock.

Os processadores Atom têm 32 KB de cache L1 de instruções, 24 KB de cache L1 de

dados e um cache L2 de 512 KB (1 MB no modelo com dois núcleos). Eles não têm um

controlador de memória integrado, e por essa razão os tipos e capacidades de memória são

definidos pelo chipset e não pelo processador.

A maioria dos modelos do Atom suporta a tecnologia Hyper-Threading, que é a

capacidade de usar unidades ociosas do processador para formar um segundo processador

virtual, fazendo com que o sistema operacional veja cada núcleo do processador como sendo

dois processadores, apesar de apenas um núcleo estar fisicamente presente. Claro que esta

técnica é menos eficiente do que ter dois núcleos de processamento verdadeiros, mas este

“núcleo” extra – e conseqüentemente o desempenho extra – você ganha de graça.

Page 41: Aquitetura dos Processadores Multicore

Outro detalhe importante é o fato de que a maioria dos processadores Atom não possui a

tecnologia Enhanced Speedstep ou nenhuma outra que permita que seu clock baixe caso o

processador esteja ocioso. Assim, eles sempre funcionam com o mesmo clock fixo. Apenas os

modelos Nxxx possuem essa tecnologia.

As principais características do processador Atom são as seguintes:

Compatibilidade total com o conjunto de instruções x86, o que significa que ele pode rodar

diretamente programas e sistemas operacionais para PCs. Vários outros processadores

voltados para o mercado de dispositivos móveis têm conjunto de instruções proprietário.

Um ou dois núcleos de processamento;

Baixíssima dissipação térmica (TDP), entre 0,65 W e 5,5 W nos modelos de um núcleo;

Tecnologia Hyper-Threading (exceto modelo Z510);

Tecnologia de Virtualização nos modelos Z520, Z520PT, Z530, Z530P, Z540 e Z550;

Tecnologia Enhanced SpeedStep nos modelos Nxxx;

Tecnologia Intel EM64T nos modelos 230, 330, N450, D510, Z510P, Z510PT, Z520PT e

Z530P;

Execute Disable;

Conjunto de instruções SSE3;

Clock externo de 400 MHz, 533 MHz ou 667 MHz (100 MHz, 133 MHz ou 166 MHz

transferindo quatro dados por pulso de clock);

Caminho de dados interno de 128 bits (“Digital Media Boost”);

32 KB de cache L1 de instruções e 24 KB de cache L1 de dados por núcleo;

512 KB de cache L2 (1 MB nos modelos de dois núcleos);

Tamanho de cache dinâmico: capacidade de desligar porções do cache de memória quando o

processador entra nos modos de economia de energia C4 ou C4E (não disponível nos modelos

Atom 2xx e 3xx);

Page 42: Aquitetura dos Processadores Multicore

Fabricado com tecnologia de 45 nm;

Pode trabalhar em conjunto com um chipset móvel da classe Intel 945 (Atom modelos 2xx,

3xx e N2xx) ou com um chipset Intel US15W “Poulsbo” (Atom modelos Z5xx). Os modelos

2xx, 3xx e N2xx são voltados para o mercado de notebooks, enquanto que os modelos Z5xx

são voltados para o mercado de dispositivos móveis com acesso à Internet;

437 pinos (modelos “Diamondville”, ou seja, xxx e Nxxx) ou 441 pinos (modelos

“Silverthorne”, ou seja, Z5xx).

3.7 Xeon

3.7.1 Modelos 50xx, 70xx e 71xx (Dois Núcleos)

A tecnologia de dois núcleos traz dois processadores inteiros dentro de um mesmo

invólucro. Como os processadores Xeon de núcleo duplo modelos 50xx, 70xx e 71xx têm a

tecnologia Hyper-Threading – que simula a existência de dois processadores em cada núcleo

– o sistema operacional reconhece cada processador Xeon de núcleo duplo como sendo quatro

processadores. Assim, em um servidor com dois processadores Xeon de núcleo duplo, o

sistema operacional reconhecerá oito processadores (quatro núcleos, dois por pocessador, e

dois processadores lógicos por núcleo).

Os processadores Xeon das séries 30xx, 51xx e 72xx possuem as seguintes características:

Microarquitetura core;

Tecnologia de dois núcleos;

Tecnologia de fabricação de 65 nm;

Soquete 604 (modelos 72xx), 771 (modelos 51xx) ou 775 (modelos 30xx);

Instruções SSE3;

Page 43: Aquitetura dos Processadores Multicore

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo;

Cache L2 de 4 MB compartilhado entre os núcleos;

Tecnologia EM64T;

Tecnologia de Virtualização;

Tecnologia Execute Disable;

Tecnologia Demand-Based Switching (DBS), nos modelos 5140, 5148, 5150 e 5160;

Tecnologia Enhanced SpeedStep;

Tecnologia Dual Independent Bus (DIB), onde cada núcleo tem seu próprio barramento

externo em vez de ter apenas um barramento compartilhado entre os núcleos para a

comunicação com os outros dispositivos do micro.

3.7.2 Modelos 31xx e 52xx (Dois Núcleos)

Os processadores Xeon 31xx e 52xx, assim como os modelos 30xx, 51xx e 72xx, são

baseados na microarquitetura Core, a mesma usada pelos processadores Core 2 Duo (para

saber mais detalhes sobre a microarquitetura. A principal diferença entre esses modelos é a

tecnologia de fabricação. Enquanto os modelos 30xx, 51xx e 72xx usam o processo de

fabricação de 65 nm, as séries 31xx e 52xx usam o novo processo de 45 nm. Este processo de

fabricação é conhecido pelo nome-código Penryn.

Todos os processadores Xeon 31xx e 52xx possuem as seguintes características:

Microarquitetura core

Tecnologia de dois núcleos

Tecnologia de fabricação de 45 nm

Soquete 771

Page 44: Aquitetura dos Processadores Multicore

Instruções SSE4

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo

Cache L2 de 6 MB compartilhado

Tecnologia EM64T

Tecnologia de Virtualização

Tecnologia Execute Disable

Tecnologia Demand-Based Switching (DBS)

Tecnologia Enhanced SpeedStep

3.7.3 Modelos 32xx, 53xx e 73xx (Quatro Núcleos, 65 nm)

Os processadores Xeon 32xx, 53xx e 73xx são baseados na microarquitetura Core e

possuem quatro núcleos de processamento, sendo que estes quatro núcleos são obtidos a partir

de duas pastilhas de dois núcleos cada. Com isso, o cache L2 desses processadores não é

compartilhado entre todos os seus núcleos: os núcleos 1 e 2 compartilham um mesmo cache

L2, enquanto que os núcleos 3 e 4 compartilham um outro cache L2. O valor divulgado é o

valor total (soma dos dois caches).

Todos os processadores Xeon das séries 32xx, 53xx e 73xx possuem as seguintes

características:

Microarquitetura core

Tecnologia de quatro núcleos

Tecnologia de fabricação de 65 nm

Page 45: Aquitetura dos Processadores Multicore

Soquete 604 (modelos 53xx e 73xx) ou 775 (modelos 32xx)

Instruções SSE3

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo

Cache L2 de 4 MB, 6 MB ou 8 MB, dependendo do modelo, dividido em dois

Tecnologia EM64T

Tecnologia de Virtualização

Tecnologia Execute Disable

Tecnologia Demand-Based Switching (DBS)

Tecnologia Enhanced SpeedStep

3.7.4 Modelos 33xx e 54xx (Quatro Núcleos, 45 nm)

Os processadores Xeon 33xx e 54xx, assim como os modelos 32xx, 53xx e 73xx, são

baseados na microarquitetura Core, a mesma usada pelos processadores Core 2 Duo (para

saber mais detalhes sobre a microarquitetura. A principal diferença entre esses modelos é a

tecnologia de fabricação. Enquanto os modelos 32xx, 53xx e 73xx usam o processo de

fabricação de 65 nm, as séries 33xx e 54xx usam o novo processo de 45 nm. Este processo de

fabricação é conhecido pelo nome-código Penryn. Note que Penryn é o codinome da

tecnologia de fabricação e não do processador. O nome-código dos processadores Xeon 33xx

é Yorkfield e o dos processadores Xeon 54xx é Harpertown.

Há outras diferenças entre os processadores Xeon 33xx e 54xx e os demais modelos de

Xeon baseados na microarquitetura core descritos anteriormente, além do processo de

fabricação: o novo conjunto de instruções SSE4 e um cache de memória L2 maior.

Os quatro núcleos dos processadores Xeon 33xx e 54xx são obtidos a partir de duas

pastilhas de dois núcleos cada, assim como ocorre com os modelos descritos anteriormente.

Page 46: Aquitetura dos Processadores Multicore

Com isso, o cache L2 desses processadores não é compartilhado entre todos os seus núcleos:

os núcleos 1 e 2 compartilham um mesmo cache L2, enquanto que os núcleos 3 e 4

compartilham um outro cache L2. O valor divulgado é o valor total (soma dos dois caches).

Todos os processadores Xeon 33xx e 54xx possuem as seguintes características:

Microarquitetura core

Tecnologia de quatro núcleos

Tecnologia de fabricação de 45 nm

Soquete 771 (modelos 54xx) ou 775 (modelos 33xx)

Instruções SSE4

Cache L1 dividido, sendo 32 KB para dados e 32 KB para instruções por núcleo.

Cache L2 de 6 MB ou 12 MB dividido em dois

Tecnologia EM64T

Tecnologia de Virtualização

Tecnologia Execute Disable

Tecnologia Demand-Based Switching (DBS)

Tecnologia Enhanced SpeedStep

4 Processadores da AMD

4.1 Athlon

Page 47: Aquitetura dos Processadores Multicore

A AMD foi a primeira empresa a lançar processadores de núcleo duplo com

arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia própria para

a comunicação entre o processador e os outros dispositivos de entrada e saída de memória o

“Direct Connect Arquitecture” que permite conexão independente para cada núcleo.

Com dois núcleos o computador trabalha como se houvesse dois processadores

independentes. Apenas sistemas operacionais com suporte a SMP (Suporte ao

Multiprocessamento Simétrico) são capazes de utilizar e perceber o aumento do poder de

processamento proporcionado por esta arquitetura.

Uma das principais características dos processadores de núcleo duplo da AMD é a

comunicação entre os núcleos que se dá através de um barramento embutido no processador,

chamado de HyperTransport, permitindo-o atingir velocidades maiores nesta comunicação.

Outros fabricantes utilizam a ponte norte que está fora do processador para esta comunicação,

o que em teoria diminuiria a velocidade de comunicação entre os núcleos.

A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a utilização

de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64, ou seja, cada núcleo

tem sua arquitetura baseada em um Athlon 64.

Processadores da AMD baseados na arquitetura do Athlon 64 podem ser encontrados com os

seguintes padrões de pinagem:

Soquete 754: Usado pelas primeiras versões de Athlon 64 e alguns modelos de Sempron e

Turion 64. Seu controlador de memória usa somente um canal (single channel), o que

significa que o processador acessa a memória a 64 bits. Aceita somente memórias do tipo

DDR.

Soquete 939: Usado por alguns modelos de processadores Athlon 64, Athon 64 FX, Athlon 64

X2 e Opteron. Seu controlador de memória usa dois canais (dual channel), o que significa que

o processador acessa à memória a 128 bits, se um número par de módulos de memória for

usado. Aceita somente memórias do tipo DDR.

Soquete 940: Usado pelos primeiros processadores Athon 64 FX e alguns modelos

do Opteron. Seu controlador de memória usa dois canais (dual channel), o que significa que o

processador acessa a memória a 128 bits, se dois módulos forem usados (ou um número par

Page 48: Aquitetura dos Processadores Multicore

de módulos de memória forem usados). É necessária a utilização de memórias do tipo ECC e

aceita somente memórias do tipo DDR.

Soquete AM2: Usado por modelos de Athlon 64, Athlon 64 FX e Athlon 64 X2 suportando

memórias DDR2 até 800 MHz, suportando a configuração de dois canais (dual channel), o

que significa que o processador acessa a memória a 128 bits, se um número par de módulos

for usado. Lembre-se que o controlador de memória dos processadores soquete 754, 939 e

940 suporta apenas memórias DDR.

Soquete AM2+: Usado por alguns modelos do Athlon X2 baseados no processador

Phenom. O soquete AM2+ permite dois recursos, o uso do barramento HyperTransport 3.0

(maior taxa de transferência entre o processador e o chipset) e separação dos pinos de

alimentação dos núcleos de processamento e do controlador de memória, o que permite ao

controlador de memória a trabalhar a um clock mais elevado e também resolvendo o

problema do multiplicador de clock da memória que descrevemos mais abaixo. Processadores

soquete AM2+ podem ser instalados em placas-mãe soquete AM2, porém a taxa de

transferência do barramento HyperTransport será limitada a 4 GB/s, o controlador de

memória trabalhará a um clock inferior e o problema da memória ser acessada a um clock

inferior (ver abaixo) poderá existir. Placas-mãe soquete AM2+ aceitam processadores soquete

AM2 sem problemas. Processadores soquete AM2+ suportam memórias DDR2 até 1.066

MHz.

Soquete AM3: Usado pelo Athlon II X2, Athlon II X3 e Athlon II X4. Esse soquete também

usa o HyperTransport 3.0 e sua principal diferença em relação ao soquete AM2+ é o uso de

memórias DDR3. Um processador AM3 pode ser instalado em placas-mãe AM3 (onde vai

trabalhar apenas com memórias DDR3) ou em placas-mãe AM2+ (suportando, assim,

memórias DDR2). Placas-mãe AM3, no entanto, suportam apenas processadores AM3.

Soquete F: Este soquete de 1.207 pinos criado para modelos do processador Opteron é

também usado pelos processadores Athlon 64 FX utilizados na plataforma Quad FX da AMD

(Athlon 64 FX modelos 7x). Os processadores que utilizam este soquete trabalham no modo

SMP (multiprocessamento simétrico), podendo trabalhar com mais de um processador em

paralelo. Assim como os processadores soquete AM2 e AM2+, nesses processadores o

controlador de memória integrado suporta memórias DDR2-533, DDR2-667 e DDR2-800 na

Page 49: Aquitetura dos Processadores Multicore

configuração de dois canais, o que significa que o processador acessa a memória a 128 bits, se

um número par de módulos de memória for usado.

O controlador de memória integrado nos processadores Athlon 64 soquetes AM2 e Athlon 64

FX soquete F suporta memórias DDR2-533, DDR2-667 e DDR2-800. O problema, no

entanto, é como o clock do barramento da memória é obtido. Em vez de ser gerado através do

clock base do processador (clock HTT, que é de 200 MHz), é usada uma divisão do clock

interno do processador. O valor desta divisão é metade do valor do multiplicador do

processador.

Um processador AMD64 com um multiplicador de clock 12x terá um divisor do barramento

de memória de 6. Este processador trabalhará a 2,4 GHz (200 MHz x 12) e sua memória

funcionará a 400 MHz (DDR2-800, 2.400 MHz / 6). Tenha em mente que as memórias DDR

e DDR2 são rotuladas com o dobro dos seus clocks reais.

O problema é quando o multiplicador de clock do processador é um número ímpar. Para um

processador AM2 com um multiplicador de clock 13x teoricamente o divisor do seu

barramento de memória seria de 6,5. Como o barramento de memória do AMD64 não

trabalha com divisores “quebrados” este valor é arredondado para o próximo número inteiro...

Enquanto este processador funcionará a 2,6 GHz (200 MHz x 13) seu barramento de memória

funcionará a 371 MHz (742 MHz DDR) e não a 400 MHz (800 MHz DDR), fazendo com que

o processador não alcance a largura de banda máxima que as memórias DDR2 podem

fornecer.

Alguns exemplos:

Clock

Interno

Multiplicador do

Processador

Divisor da

Memória

Barramento da

Memória

2,8 GHz 14x 7 800 MHz

2,6 GHz 13x 7 742 MHz

Page 50: Aquitetura dos Processadores Multicore

2,4 GHz 12x 6 800 MHz

2,2 GHz 11x 6 733 MHz

2 GHz 10x 5 800 MHz

1,8 GHz 9x 5 720 MHz

1,6 GHz 8x 4 800 MHz

Este mesmo problema não ocorre com processadores soquetes AM2+ e AM3.

Outras características encontradas nos processadores baseados na arquitetura do Athlon 64

são as seguintes:

O processador não é vendido com base em seu clock de operação, mas sim através de um

indicativo de desempenho chamado “performance rating” ou PR;

Podem acessar até 1 TB (terabyte) de memória RAM (barramento de endereços de 40 bits,

2^40 = 1 TB);

Suporte às instruções MMX, 3Dnow!, SSE e SSE2 (SSE3 apenas nos modelos mais novos,

SSE4a nos modelos para soquete AM2+ e AM3);

Tencnologia EVP (Enhanced Vírus Protection), também conhecida como “NX Bit Disable”;

Tecnologia Cool’n’Quiet.

4.1.1Plataforma Quad FX

A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma placa mãe trazendo

para o pc o que já era comum nos servidores. Através da arquitetura de Conexão Direta de

Page 51: Aquitetura dos Processadores Multicore

Soquete Duplo (DSDC) que se dá a comunicação dos dois processadores de duplo núcleo,

facilitando o trabalho em paralelo. O barramento HyperTransport coerente conecta os dois

processadores desta plataforma. Esta plataforma exige que o processador possua dois

barramentos HyperTransport, um conecta os dois processadores enquanto o outro barramento

cuida da conexão com o chipset, vale ressaltar que há dois chips sets, um para cada soquete.

Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027pinos) este

suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se também que o controle

da memória é embutido no processador e a memória é acessada por um barramento exclusivo

facilitando a transferência de dados entre os dois

4.1.2 Modelos do Athlon 64

O Athlon 64 pode ser encontrado em versões para o soquete 754, soquete 939 e o soquete

AM2. As versões para soquete 939 e soquete AM2 podem utilizar a configuração de memória

em dois canais, dobrando a taxa de transferência no acesso à memória desde que você use

dois ou quatro módulos de memória em seu micro.Os processadores soquete 754 e 939

aceitam somente memórias DDR, enquanto que os processadores soquete AM2 aceitam

somente memórias DDR2.

O Athlon 64 pode se encontrado com diferentes versões de núcleo. As principais

características técnicas do Athlon 64 são as seguintes:

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados;

512 KB ou 1 MB de cache de memória L2;

Barramento HyperTransport (HT) trabalhando a 800 MHz (3,2 GB/s) ou a 1 GHz (4 GB/s);

esses clocks podem também ser referenciados como “1.600 MHz” ou “2.000 MHz”,

respectivamente;

Configuração de memória em dois canais nos modelos soquete 939 e AM2 (você precisa

instalar dois ou quatro módulos de módulos de memória para usar este recurso);

Conjunto de instruções SSE3 em alguns modelos;

Page 52: Aquitetura dos Processadores Multicore

4.1.3 Modelos do Athlon 64 FX

O Athlon 64 FX é um processador destinado para a galera que se amarra em jogos.

Originalmente a diferença entre o Athlon 64 e o Athlon 64 FX era a quantidade de memória

cache L2 (512 KB no Athlon 64 vs. 1 MB no Athlon 64 FX) e maior flexibilidade para

overclock, já que ele vinha com o multiplicador de clock destravado. Todos os processadores

tanto da Intel quando da AMD possuem o multiplicador de clock fixo, que não pode ter seu

valor aumentado – em todos os outros processadores a única maneira de fazer um overclock é

aumentando o clock externo do processador. Com o Athlon 64 FX, no entanto, você tem duas

opções para fazer o overclock do processador, aumentando o seu clock base (também

conhecido clock HTT), que é de 200 MHz, e/ou aumentando seu multiplicador de clock.

Quando o processador Athlon 64 começou a ser vendido também com 1 MB de cache

L2, a diferença entre eles passou a ser apenas o multiplicador de clock destravado. O Athlon

64 4000+ e Athlon 64 FX-53 são o mesmo processador. Tradicionalmente os processadores

Athlon 64 de maior clock são os encontrados na linha Athlon 64 FX.

As principais características técnicas do Athlon 64 FX são as seguintes:

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;

1 MB de cache de memória L2;

Barramento HyperTransport (HT) trabalhando a 800 MHz (3,2 GB/s) ou 1 GHz (4 GB/s).

Esses clocks podem também ser referenciados como “1.600 MHz” ou “2.000 MHz”,

respectivamente;

Configuração de memória em dois canais em todos os modelos (você precisa instalar um

número par de módulos de memória para usar este recurso);

Conjunto de instruções SSE3 em alguns modelos;

Page 53: Aquitetura dos Processadores Multicore

Núcleo duplo nos modelos terminados em um número par. Esta tecnologia faz com que o

processador possua dois processadores completos em seu interior. Leia nosso tutorial

Processadores de Núcleo Duplo da AMD para aprender mais sobre esta tecnologia;

Modelos soquete AM2 e soquete F trabalham com memórias DDR2, enquanto os modelos

soquete 939 e 940 trabalham com memórias DDR.

4.1.4 Athlon 64 X2

O Athlon 64 X2 é um Athlon 64 com tecnologia de núcleo duplo, ou seja, ele possui

dois processadores dentro de um só.. A AMD trocou o nome dos processadores desta linha

para Athlon X2 e, pouco tempo depois, para Athlon X2 Dual Core.

Há versões do Athlon 64 X2 para os soquetes 939, AM2 e AM2+, porém em placas-

mãe soquete 939 talvez você precise fazer um upgrade de BIOS caso a sua placa-mãe tenha

sido lançada antes da introdução deste processador no mercado para que ela possa suportá-lo.

Assim como os processadores Athlon 64, os processadores Athlon X2 são

identificados por um número de modelo com quatro dígitos (Athlon 64 4000+, Athlon X2

6000+, etc). Esse sistema de numeração serve para indicar o desempenho de um processador

dentro de uma mesma família. Quanto maior o número do modelo dentro de uma família,

mais rápido é o processador. O Athlon 64 4000+ é mais rápido do que o Athlon 64 3800+,

que por sua vez é mais rápido do que o Athlon 64 3400+.

Podemos usar esse sistema de numeração para comparar processadores dentro de uma

mesma família. Não podemos dizer que um Athlon 64 4000+ é mais rápido do que o Athlon

X2 3800+ só porque o seu número de modelo é maior. Esses processadores fazem parte de

famílias diferentes e, portanto, não podemos comparar.

Acontece que a AMD a partir de agora está usando um novo sistema de numeração

para seus processadores. Esse novo sistema é mais complicado do que o anterior e só será

adotado pelos os novos processadores, ou seja, os processadores já existentes continuarão a

usar o sistema de numeração antigo.

Page 54: Aquitetura dos Processadores Multicore

Esse novo sistema de numeração usa um formato alfanumérico de cinco caracteres:

XX-####, onde XX são letras e #### são números. As duas letras indicam a classe do

processador, sendo que o segundo caractere indica a dissipação térmica do processador. O

primeiro número após o traço indica a série do processador e informa quais recursos o

processador tem. Os três últimos números indicam a posição do processador dentro da sua

série/classe. Quanto maior este número mais recursos o processador tem – normalmente

indicando um maior desempenho dentro de sua classe/série.

Os novos processadores Athlon X2 Dual Core são os primeiros a adotar o novo

sistema de numeração. Dessa forma, só para exemplificar como funciona o novo sistema de

numeração, o processador Athlon X2 Dual-Core BE-2350 pertence à classe “BE” (a letra “E”

indica que o processador dissipa 45 W), da série “2xxx”, e o seu número dentro dessa

série/classe é “350”.

As principais características técnicas do Athlon 64 X2 são as seguintes:

Dois núcleos de processamento;

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;

512 KB ou 1 MB de cache de memória L2;

2 MB de cache L3 nos modelos AM2+;

Barramento HyperTransport (HT) trabalhando a 1 GHz (4 GB/s) nos modelos soquete 939 e

AM2. Esse clock pode também ser referenciado como “2.000 MHz”. Nos modelos soquete

AM2+ esse barramento é de 1,8 GHz (7,2 GB/s). Esse clock pode também ser referenciado

como "3,6 GHz";

Soquete 939, AM2 ou AM2+. Modelos soquete 939 aceitam somente memórias DDR

enquanto modelos soquete AM2 e AM2+ aceitam somente memórias DDR2;

Configuração de memória em dois canais em todos os modelos (você precisa instalar um

número par de módulos de memória para usar este recurso);

Conjunto de instruções SSE3 em todos os modelos, SSE4a nos modelos soquete AM2+.

Page 55: Aquitetura dos Processadores Multicore

4.1.5 Modelos do Athlon II X2

O Athlon II X2 é semelhante ao processador Phenom II, mas com apenas dois núcleos

de processamento e sem cache L3.

O Athlon II X2 usa o soquete AM3, sendo compatível também placas-mãe AM2+

certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3 mas se

instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.

As principais características técnicas do Athlon II X2 são as seguintes:

Dois núcleos de processamento;

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;

1 MB ou 512 KB de cache de memória L2 por núcleo;

Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser

referenciado como “4.000 MHz”;

Soquete AM3;

Configuração de memória em dois canais em todos os modelos (você precisa instalar um

número par de módulos de memória para usar este recurso);

Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);

Tecnologia de fabricação de 45 nm.

4.1.6 Modelos do Athlon II X3

O Athlon II X3 é similar ao Athlon II X2 e ao Athlon II X4, mas com três núcleos de

processamento em vez de dois ou quatro. Como os demais membros da família Athlon, ele

não tem cache de memória L3.

Page 56: Aquitetura dos Processadores Multicore

O Athlon II X3 usa o soquete AM3, sendo compatível também placas-mãe AM2+

certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3 mas se

instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.

As principais características técnicas do Athlon II X3 são as seguintes:

Três núcleos de processamento;

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo

512 KB de cache de memória L2 por núcleo;

Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser

referenciado como “4.000 MHz”;

Soquete AM3;

Configuração de memória em dois canais em todos os modelos (você precisa instalar um

número par de módulos de memória para usar este recurso);

Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);

Tecnologia de fabricação de 45 nm.

4.1.7 Modelos do Athlon II X4

Athlon II X4 é semelhante ao processador Phenom II X4, porém sem cache de

memória L3. O Athlon II X4 usa o soquete AM3, sendo compatível também placas-mãe

AM2+ certificadas. Quando instalado em uma placa-mãe AM3 ele suporta memórias DDR3

mas se instalado em uma placa-mãe AM2+ ele passa a trabalhar com memórias DDR2.

As principais características técnicas do Athlon II X4 são as seguintes:

Quatro núcleos de processamento;

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados por núcleo;

Page 57: Aquitetura dos Processadores Multicore

512 KB de cache de memória L2 por núcleo;

Barramento HyperTransport (HT) trabalhando a 2 GHz (8 GB/s). Esse clock pode também ser

referenciado como “4.000 MHz”;

Soquete AM3;

Configuração de memória em dois canais em todos os modelos (você precisa instalar um

número par de módulos de memória para usar este recurso);

Conjunto de instruções SSE4a (que é diferente das instruções SSE4 da Intel);

Tecnologia de fabricação de 45 nm.

4.2 Turion

Lançado para ser o principal concorrente do Pentium M da Intel, o Turion da AMD é

um processador de baixo consumo voltado para o mercado de notebooks e está disponível em

duas versões: núcleo único ("single core") e dois núcleos ("dual core") de processamento.

O Turion 64 é baseado na arquitetura do Athlon 64 e a principal diferença entre o

Turion 64 e o Athlon 64 é o consumo: o Athlon 64 dissipa 65 W enquanto que o Turion 64

dissipa apenas 35 W (modelos ML), 31 W (modelos MK) ou 25 W (modelos MT). Uma outra

diferença entre eles é a quantidade de memória cache L2, que é de 1 MB nos processadores

Athlon 64, enquanto que os processadores Turion 64 podem ter memória cache L2 de 512 KB

ou 1 MB, dependendo do modelo.

Tanto o Turion 64 quanto o Athlon 64 possuem a tecnologia PowerNow! da AMD,

que é similar a tecnologia Cool’n’Quiet usado pelos processadores desktop. Esta tecnologia

altera o clock e a tensão de alimentação do processador de acordo com a carga de trabalho que

esteja sendo realizada, de modo a economizar bateria. Como você pode ver, esta tecnologia

compete com a tecnologia Enhanced SpeedStep da Intel.

As principais características do Turion 64 são as seguintes:

Page 58: Aquitetura dos Processadores Multicore

O processador não é vendido com base em seu clock de operação, mas através de um

“número de modelo”;

Apenas um núcleo de processamento ("single core");

64 KB de cache de memória L1 de instruções e 64 KB de cache L1 de dados;

512 KB ou 1 MB de cache de memória L2, dependendo do modelo;

Barramento HyperTransport trabalhando a 800 MHz (3,2 GB/s). Este clock pode

também ser referenciado como “1.600 MHz”;

Suporte a memórias DDR em canal único (single channel) nos modelos soquete 754 e

suporte a memórias DDR2 em dois canais (dual-channel) nos modelos soquete S1;

Soquete 754 ou S1 (modelos MK-36 e MK-38);

Podem acessar até 1 TB (terabyte) de memória RAM (barramento de endereços de 40

bits, 2^40 = 1 TB);

Suporte às instruções MMX, 3Dnow!, SSE e SSE2 e SSE3;

Tecnologia PowerNow!;

Tencnologia EVP (Enhanced Vírus Protection), também conhecida como “NX Bit

Disable”, leia nosso tutorial sobre o assunto;

Tecnologia de 90 nanômetros;

Os processadores Turion 64 estão disponíveis em duas séries: ML, que tem dissipação

térmica máxima de 35 W, e MT, que tem dissipação máxima de 25 W. Quanto menor a

dissipação térmica, maior será a autonomia da bateria do seu notebook e menor será o calor

gerado.

4.2.1Modelos de Turion X2

Page 59: Aquitetura dos Processadores Multicore

A AMD usa quatro nomes diferentes para os modelos de Turion com tecnologia de

dois núcleos: Turion 64 X2 (modelos "TL"), Turion X2 (modelos "RM"), Turion X2 Ultra

(modelos "ZM") e Turion Neo X2 (modelo "L"). Apesar do nome diferentes, esses

processadores são idênticos. As principais diferenças entre esses modelos e o Turion original

é a presença de dois núcleos de processamento e o suporte a memórias DDR2 operando em

modo de dois canais, o que permite o acesso à memória a 128 bits por vez, dobrando a taxa de

transferência máxima teórica (os modelos soquete S1 do Turion de núcleo único também

aceita memórias DDR2 em dois canais).

Enquanto que o Turion 64 compete com o Pentium M e Core Solo, o Turion X2

compete com o Core Duo e Core 2 Duo.

O Turion 64 X2 possui as mesmas características básicas do Turion 64 com a adição

de:

Tecnologia de dois núcleos;

256KB, 512 KB ou 1 MB de cache de memória L2 por núcleo;

Barramento HyperTransport trabalhando a 800 MHz (3,2 GB/s), 1800 MHz (7,2 GB/s), 2000

MHz (8,0 GB/s) ou 2200 MHz (8,8 GB/s). Este clock pode também ser referenciado como

“1.600 MHz”, "3.600 MHz", "4.000 MHz" ou "4.400 MHz", respectivamente;

Suporte a memórias DDR2 em configuração de dois canais;

Soquete S1;

Tecnologia de fabricação de 65 nm ou 90 nm.

4.2.2 Modelos de Turion II

O Turion II é o Turion X2 fabricado com tecnologia de 45 nm. Existem duas linhas, o

Turion II (modelos M5xx) e Turion II Ultra (modelos M6xx).

Suas principais características são:

Page 60: Aquitetura dos Processadores Multicore

Tecnologia de dois núcleos;

256KB, 512 KB ou 1 MB de cache de memória L2 por núcleo;

Barramento HyperTransport trabalhando a 1800 MHz (7,2 GB/s). Este clock pode também ser

referenciado como "3.600 MHz";

Suporte a memórias DDR2 em configuração de dois canais;

Soquete S1;

Tecnologia de fabricação de 45 nm.

4.3 Phenom

Phenom é a série de processadores da AMD mais recente, baseada na nova

microarquitetura K10.

As principais diferenças entre o Phenom e o Athlon 64 são as seguintes:

Uso de um cache de memória L3;

Uso de um barramento HyperTransport 3.0 entre o processador e o chipset,

aumentando a largura de banda disponível entre o processador e o mundo externo;

É importante notar que até o momento os processadores Phenom não trabalham com o

desempenho máximo oferecido pelo barramento HyperTransport 3.0;

Uso de linhas separadas de alimentação para o processador e para o controlador de

memória, que está embutido dentro do próprio processador (esta tecnologia também é

conhecida como “split-plane” – “alimentação dividida” – ou DDPM, Dual Dynamic

Power Management, ou Gerenciamento Elétrico Dinâmico Duplo);

Uso de um gerador de clock para o controlador de memória com um valor fixo. Isto

resolve o problema que acontece com o Athlon 64 onde dependo do modelo do

processador as memórias não funcionam em seu desempenho máximo;

Suporte para memórias DDR2 até DDR2-1066/PC2-8500 (processadores Athlon 64

suportam até DDR2-800/PC2-6400) nos modelos para soquete AM2+; suporte para

Page 61: Aquitetura dos Processadores Multicore

memórias DDR3 nos modelos para soquete AM3, que também suportam memórias

DDR2 quando instalados em placas-mãe AM2+ certificadas.

Os processadores Phenom podem ser instalados em placas-mãe soquete AM2 antigas, mas

eles estarão limitados à taxa de transferência de 4.000 MB/s do HyperTransport 2.0, não

usufruirão da tecnologia DDPM e o controlador de memória trabalhará com a clock menor

(1,6 GHz).

Alguns modelos do Phenom II são projetados para uso em placas-mãe soquete AM3 e

funcionam com memórias DDR3 quando instalados nessas placas-mãe. Eles são, porém,

compatíveis com placas-mãe AM2+ certificadas, só que trabalham com memórias DDR2.

Até agora a AMD lançou modelos do Phenom de três e quatro núcleos e modelos de

Phenom II de dois, três, quatro e seis núcleos, com as seguintes especificações técnicas para

todos os modelos:

Cache de memória L1 de 128 KB por núcleo;

Cache de memória L2 de 512 KB por núcleo;

Cache de memória L3 de 2 MB compartilhado por todos os núcleos (4 MB ou 6 MB

nos modelos Phenom II);

Barramento HyperTransport 3.0 trabalhando a 1,6 GHz (6.400 mb/s), 1,8 GHz (7.200

MB/s), 2 GHz (8.000 MB/s), dependendo do modelo. Note que o HyperTransport 3.0

oferece taxas maiores (2,4 GHz/9.600 MB/s e 2,6 GHz/10.400 MB/s) que ainda não

estão sendo utilizadas;

Soquete AM2+ ou AM3 (alguns modelos do Phenom II);

Processo de fabricação de 65 nm (45 nm nos modelos Phenom II).

Conjunto de instruções "SSE4a", que é simplesmente a adição de duas novas instruções

SSE e não tem nada a ver com o SSE4.1 existente nos mais recentes processadores da Intel e

que traz 47 novas instruções.

Modelos "Black Edition" possuem o multiplicador de clock destravado, significando uma

maior capacidade para overclock, já que eles podem ser configurados como se fossem um

processador de clock mais elevado. Recurso de overclock automático nos modelos de Phenom

II X6

Page 62: Aquitetura dos Processadores Multicore

4.3.1 Modelos do Phenom X3

Os processadores Phenom com três núcleos de processamento são chamados "Phenom

X3". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo termina em

"00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados na revisão B3

(aqueles com número do modelo terminado em "50") não sofrem esse problema.

4.3.2 Modelos do Phenom X4

Os processadores Phenom com quatro núcleos de processamento são chamados

"Phenom X4". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo

termina em "00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados

na revisão B3 (aqueles com número do modelo terminado em "50") não sofrem esse

problema.

4.3.3 Modelos do Phenom II X2

Os processadores Phenom II X2 são os modelos do Phenom com dois núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR2

(placas-mãe soquete AM2+ certificadas) ou DDR3 (placas-mãe soquete AM3).

4.3.4 Modelos do Phenom II X3

Os processadores Phenom II X3 são os modelos do Phenom com três núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR3

Page 63: Aquitetura dos Processadores Multicore

(quando instalados em placas-mãe soquete AM3) e DDR2 (quando instalados em placas-

mãe soquete AM2+ certificadas).

4.3.5 Modelos do Phenom X4

Os processadores Phenom com quatro núcleos de processamento são chamados

"Phenom X4". Modelos baseados na revisão "B2" (ou seja, aqueles cujo número do modelo

termina em "00") têm um bug na tabela de tradução de endereços (TLB). Modelos baseados

na revisão B3 (aqueles com número do modelo terminado em "50") não sofrem esse

problema.

4.3.6 Modelos do Phenom II X2

Os processadores Phenom II X2 são os modelos do Phenom com dois núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR2

(placas-mãe soquete AM2+ certificadas) ou DDR3 (placas-mãe soquete AM3).

4.3.7 Modelos do Phenom II X3

Os processadores Phenom II X3 são os modelos do Phenom com três núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 é de 6 MB e eles aceitam memórias DDR3

(quando instalados em placas-mãe soquete AM3) e DDR2 (quando instalados em placas-

mãe soquete AM2+ certificadas).

4.3.8 Modelos do Phenom II X4

Page 64: Aquitetura dos Processadores Multicore

Os processadores Phenom II X4 são os modelos do Phenom com quatro núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 é maior (4 MB ou 6 MB, dependendo do

modelo). Os modelos para soquete AM3 suportam memórias DDR3, mas quando instalados

em placas-mãe soquete AM2+ certificadas podem funcionar usando memórias DDR2.

4.3.9 Modelos do Phenom II X6

Os processadores Phenom II X6 são os modelos do Phenom com seis núcleos

fabricados com tecnologia de 45 nm. Seu cache L3 tem 6 MB. Eles usam soquete AM3 e

suportam memórias DDR3, mas quando instalados em placas-mãe soquete AM2+ podem

funcionar usando memórias DDR2. Uma novidade desses novos processadores é a adoção de

uma tecnologia de overclock automático similar à tecnologia Turbo Boost da Intel. Quando o

processador “sente” que três ou mais núcleos estão ociosos, ele aumenta o clock dos núcleos

ativos.

5 Tecnologia

5.1 Penryn

Penryn é o codinome do núcleo que é usado pelos processadores Core 2 e Xeon

baseados na microarquitetura Core fabricada com processo de 45 nm. Além do novo processo

de fabricação, este núcleo trará novos recursos.

A microarquitetura da Intel é chamada Core e é usada pelos processadores Core 2 e

pelos processadores Xeon.. Atualmente os processadores que usam esta microarquitetura são

fabricados com processo de 65 nm.

Page 65: Aquitetura dos Processadores Multicore

O núcleo Penryn é um aprimoramento da microarquitetura core, trazendo algumas

novas características:

Cache de memória L2 maior (até 6 MB para os processadores de dois núcleos e até 12 MB

para os processadores de quatro núcleos);

Caches com divisão de carga;

Barramentos externos mais rápidos (até 1.600 MHz);

Novo conjunto de instruções SSE4 (que traz 47 novas instruções SSE para o processador);

Tecnologia de Desligamento Profundo (Deep Power Down, apenas nos processadores para

notebooks);

Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic Acceleration,

apenas nos processadores para notebooks);

Circuito divisor usando o algoritmo Raiz-16 (aprimoramento da unidade de ponto flutuante);

Unidade “Shuffle” aprimorada (aprimoramento da unidade de ponto flutuante);

Tecnologia de Virtualização Aprimorada (entre 25% e 75% de aumento de desempenho no

tempo de transição entre máquinas virtuais);

5.1.1Halt ,Deep Sleep ,Stop Clock, Deeper Sleep ,Enhanced Deeper Sleep e

Deep Power Down

Para economizar energia, os processadores para notebook da Intel podem reduzir suas

tensões de alimentação, desabilitar seus clock e até mesmo desabilitar seus caches de

memória quando estiverem ociosos. Isto é particularmente interessante para notebooks, onde

qualquer economia de energia reflete diretamente em maior autonomia da bateria.

Existem três modos básicos de economia de energia, chamados Parar (Halt ou C1),

Parar Clock (Stop Clock ou C2) e Sono Profundo (Deep Sleep ou C3). Quando nenhum modo

Page 66: Aquitetura dos Processadores Multicore

de economia de energia estiver sendo usado o processador estará trabalhando em sua carga

máxima e dizemos que ele está no modo C0. Esses modos de economia de energia são

genericamente chamados Estados C.

Com o primeiro processador de dois núcleos baseado no núcleo do Pentium M,

chamado Core Duo, a Intel permitiu que esses modos fossem configurados por núcleo, o que

significa que se um dos núcleos do processador estiver ocioso, o processador pode reduzir a

tensão de alimentação e desligar o clock para este núcleo, mantendo o outro núcleo

funcionando normalmente. Portanto os dois núcleos podem estar em diferentes Estados C.

Além disso, com este processador a Intel introduziu dois novos Estados C, Sono Mais

Profundo (Deeper Sleep ou C4) e Sono Mais Profundo Aprimorado (Enhanced Deeper Sleep

ou DC4), que podem apenas ser ativados para os dois núcleos ao mesmo tempo.

O núcleo Penryn traz um novo Estado C, chamado Desligamento Profundo (Deep

Power Down ou C6). Quando o processador entra neste modo, sua tensão de alimentação é

reduzida bastante, os sinais de clocks são desabilitados e ambos os caches de memória são

desligados. Este modo economiza mais energia do que todos os outros modos C disponíveis

até hoje, mas o processador demora mais tempo para voltar para o seu estado ativado.

5.1.2 Tecnologia de Aceleração Dinâmica Avançada

‘Quando um dos núcleos entra em um dos estados “Profundos” de economia de

energia (ou seja, do estado C3 em diante) o novo núcleo Penryn permite que outro núcleo

aumente seu clock (ou seja, ele faz um overclock nele mesmo) mantendo o consumo interno

do processador no mesmo nível. Como o núcleo inativo estará consumindo menos energia, o

núcleo ativo pode dissipar mais calor e consumir mais energia e ainda assim manter o

consumo e os requisitos de potência do processador dentro do valor padrão: o processador

estará consumindo a mesma quantidade de energia e estará dissipando a mesma quantidade de

calor (ou menos).

5.1.3 Aprimoramentos da Unidade de Ponto Flutuante

Page 67: Aquitetura dos Processadores Multicore

O núcleo Penryn traz dois aprimoramentos para a unidade de ponto flutuante do

processador, uma para sua unidade de divisão e outro para a sua unidade “shuffle”, que é

usada por instruções SSE.

5.1.4 Divisor Usando Algoritmo Raiz-16

Este é um aprimoramento no modo como a unidade de ponto flutuante do processador

manipula operações de divisão. Nos processadores Core 2, as operações de divisão

processam dois bits por pulso de clock. O novo circuito divisor implementado no Penryn é

capaz de processar quatro bits por pulso de clock, É duas vezes mais rápido em operações de

divisão do que os processadores Core 2.

5.1.5 Aprimoramento da Unidade “Shuffle”

Este é um aprimoramento no modo como a unidade de ponto flutuante do processador

manipula operações usadas pelas instruções SSE de formatação de dados, permitindo aos

processadores com núcleo Penryn executar algumas instruções em menos pulsos de clock se

comparado com o núcleo usado atualmente pelos processadores Core 2 Duo.

Várias instruções SSE de 128 bits que levam mais do que um pulso de clock para

serem processadas são agora processadas em apenas um pulso de clock, aumentando o

desempenho SSE. As extensões SSE (Streaming SIMD Extensions) são usadas em aplicativo

multimídia que implementam este tipo de instrução.

5.2 Nehalem

Page 68: Aquitetura dos Processadores Multicore

Esta arquitetura também será usada nos processadores para servidores (Xeon). Os

processadores baseados nesta arquitetura tem um controlador de memória DDR3 integrado de

três canais, três níveis de cache, a volta da tecnologia Hyper-Threading, um novo barramento

externo chamado QuickPath

Abaixo os principais recursos da arquitetura Nehalem:

Baseado na microarquitetura Intel Core;

De dois a oito núcleos;

Controlador de memória DDR3 integrado com três canais de memória;

Caches de memória L2 individuais de 256 KB para cada núcleo;

Cache de memória L3 de 8 MB;

Novo conjunto de instruções SSE 4.2 (sete novas intruções);

Tecnologia Hyper-Threading;

Modo Turbo (overclock automático);

Aprimoramentos na microarquitetura (suporte a fusão de instruções no modo de 64 bits,

detector de laços aprimorado, seis portas de despacho, etc);

Aprimoramentos na unidade de previsão de desvios, com a adição de um segundo Buffer de

Desvios (BTB, Branch Target Buffer);

Um segundo Buffer de Tradução de Endereços (TLB, Translation Look-aside Buffer) com

512 entradas;

Otimizado para as instruções SSE desalinhadas;

Aumento do desempenho da tecnologia de virtualização (melhora de 60% na latência de

virtualização em relação aos processadores Core 2 de 65 nm e melhora de 20% em relação

aos processadores Core 2 de 45 nm, segundo a Intel);

Page 69: Aquitetura dos Processadores Multicore

Novo barramento externo QuickPath;

Nova unidade de controle de energia;

Tecnologia de fabricação de 45 nm no lançamento, com futuros modelos de 32 nm

(processadores com codinome “Westmere”).

Novo soquete com 1.366 pinos.

É importante lembrar que os processadores Core 2 fabricados com tecnologia de 45 nm

têm recursos extras em relação aos processadores Core 2 com tecnologia de 65 nm. Todos

esses recursos estão presentes nos processadores baseados na arquitetura Nehalem e os mais

significativos deles são:

Novo conjunto de instruções SSE4 (que traz 47 novas instruções SSE para o

processador);

Tecnologia de Desligamento Profundo (Deep Power Down, apenas nos processadores

para notebooks, também conhecido como estado C6);

Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic

Acceleration, apenas nos processadores para notebooks);

Circuito divisor usando o algoritmo Raiz-16 (aprimoramento da unidade de ponto

flutuante);

Unidade “Shuffle” aprimorada (aprimoramento da unidade de ponto flutuante);

Tecnologia de Virtualização Aprimorada (entre 25% e 75% de aumento de

desempenho no tempo de transição entre máquinas virtuais).

5.2.1 Controlador de Memória Integrado

Desde os primeiros processadores da Intel usa um barramento externo chamado

barramento frontal (Front Side Bus, FSB) que é compartilhado entre a memória e os demais

componentes do micro. Os processadores baseados na arquitetura Nehalem têm um

controlador de memória integrado e, portanto, têm dois barramentos: um barramento de

memória para conectar o processador à memória e um barramento de entrada/saída para

conectar o processador ao mundo externo.

Page 70: Aquitetura dos Processadores Multicore

Esta mudança proporciona um aumento de desempenho no micro por dois motivos:

primeiro porque agora nós temos dois caminhos de dados separados para o acesso à memória

e aos dispositivos de entrada/saída. Segundo porque o acesso à memória é mais rápido já que

o processador não precisa mais se comunicar primeiro com um controlador externo.

Nas Figuras 2 e 3 nós comparamos a arquitetura tradicional usada pelos processadores

da Intel e a nova arquitetura que será usada pelos novos processadores da Intel com

controlador de memória integrado

Figura 2: Arquitetura usada pelos atuais processadores da Intel.

Page 71: Aquitetura dos Processadores Multicore

Figura 3: Arquitetura usada pelos futuros processadores da Intel com controlador de memória

integrado.

Este novo barramento externo é chamado QuickPath Interconnect (QPI) e oferece dois

caminhos de dados separados (uma para transmissão e outro para recepção dos dados) para o

processador se comunicar com o chipset ou com outros processadores, no caso de servidores

com mais de um processador instalado. Como você pode ver, este barramento é o equivalente

ao HyperTransport usado nos processadores da AMD. A primeira versão do barramento

QuickPath trabalha com um clock de 3,2 GHz transferindo dois dados de 16 bits por pulso de

clock, resultando em uma taxa de transferência máxima teórica de 12,8 GB/s em cada direção.

Os processadores para desktop têm apenas um barramento QuickPath, enquanto que os

processadores para servidores têm dois barramentos independentes para permitir a

comunicação entre eles em ambientes de multiprocessamento simétrico (SMP).

O controlador de memória integrado nos processadores baseados na arquitetura

Nehalem oferece três canais de memória, o que significa que ele é capaz de acessar três

módulos de memória ao mesmo tempo, em paralelo, aumentando assim o desempenho – em

Page 72: Aquitetura dos Processadores Multicore

teoria a arquitetura de três canais oferece um aumento de 50% na largura de banda em relação

a arquitetura de dois canais rodando com o mesmo clock.

Portanto para obter o maior desempenho possível com os processadores baseados na

arquitetura Nehalem, como é o caso do Core i7, você precisará instalar três ou seis (caso sua

placa-mãe tenha seis soquetes de memória) módulos de memória. A maioria dos

Computadores tem 2 GB ou 4 GB (dois ou quatro módulos de memória instalados na

configuração de dois canais) enquanto que com o processador Core i7 você precisa ter um

microcomputador com 1,5 GB, 3 GB ou 6 GB para atingir o maior desempenho possível (três

ou seis módulos de memória instalados na configuração de três canais).

Algumas placas-mãe voltadas para os processadores Core i7 tem quatro soquetes de

memória, como é o caso da placa-mãe "Smackover" da Intel, baseada no chipset Intel X58. Se

instalar quatro módulos de memória, terá mais memória disponível, mas diminuirá o

desempenho do micro. Se instalar 4 GB (quatro módulos de 1 GB), o micro acessará os

primeiros 3 GB no modo de três canais, mas a área de memória entre 3 GB e 4 GB será

acessada com o desempenho de um único canal. Portanto, a menos que você realmente

precise de mais memória RAM, equipe o seu micro com 1,5 GB, 3 GB ou 6 GB de memória.

Outros fabricantes já anunciaram que fabricarão placas-mãe com seis soquetes, portanto

nestas placas você terá de instalar memórias de três em três para atingir o

máximo desempenho possível.

Com o modo de três canais o processador acessará a memória a 192 bits por vez (3 x

64 bits), se você tiver três ou seis módulos de memória instalados. Isto resulta em uma taxa de

transferência máxima teórica de 25,58 GB/s, caso memórias DDR3-1066 sejam usadas.

O controlador de memória integrado nos processadores Nehalem aceita apenas

memórias DDR3 – sem suporte para memórias DDR2.

Por causa do controlador de memória integrado a Intel mudou o padrão de pinagem do

processador para um novo soquete de 1.366 pinos. Portanto não poderá fazer um upgrade do

atual processador Intel para um processador Core i7 trocando apenas o processador; terá que

trocar também a placa-mãe e provavelmente as memórias, caso você não tenha memórias

DDR3.

5.2.2 Cache de Memória

Page 73: Aquitetura dos Processadores Multicore

O cache de memória, a Intel usará a mesma abordagem de cache que a AMD está usando em

seus processadores Phenom, caches L2 individuais para cada núcleo e um cache de memória

L3 compartilhado. Cada cache de memória L2 será de 256 KB e o cache L3 será de 8 MB. O

cache L1 permanece igual ao Core 2 Duo (64 KB, 32 KB para instruções e 32 KB para

dados).

Os processadores Core 2 Duo têm apenas um cache de memória L2, que é

compartilhado entre os dois núcleos do processador, mas os processadores de quatro núcleos

da Intel, como o Core 2 Quad e o Core 2 Extreme têm dois caches L2, cada um compartilhado

por cada grupo de dois núcleos.As arquiteturas de cache disponíveis nas Figuras 4 e 5.

Figura 4: Uma comparação entre as arquiteturas de cache.

Page 74: Aquitetura dos Processadores Multicore

Figura 5: Uma comparação entre as arquiteturas de cache.

5.2.3 Aprimoramentos no Pipeline do Processador

Como mencionado, a arquitetura Nehalem (Core i7) é baseada na arquitetura usada pelo

processador Core 2 Duo, adicionando alguns aprimoramentos na maneira como as instruções

fluem dentro do processador. Nesta página descreveremos esses aprimoramentos.

O processador Core 2 Duo, a propósito, é baseado na arquitetura do Pentium M, que por

sua vez é baseada na arquitetura usada pelos processadores Pentium III. Todos esses

processadores são de 6ª geração (se você rodar a instrução CPUID todos eles retornarão “6”

no campo “Família”). O Pentium 4 era um processador Intel de 7ª geração usando uma

microarquitetura completamente diferente – os processadores Core 2 e Core i7 é diferente do

Pentium 4. Na Figura 6 é a genealogia da microarquitetura Nehalem. Também os principais

aprimoramentos trazidos por cada novo processador;

Page 75: Aquitetura dos Processadores Multicore

Figura 6: Árvore genealógica da microarquitetura Nehalem.

Os programas são escritos usando instruções x86 (também chamadas “macro-ops” ou

simplesmente “instruções”), que não são entendidas pelas unidades de execução do

processador. Elas precisam primeiro ser decodificadas em microinstruções (também

chamadas “micro-op” ou “µop”). Esta arquitetura híbrida CISC/RISC foi introduzida pelo

Pentium: o processador recebe instruções x86 (CISC), mas executa microinstruções

proprietárias (RISC).

A microarquitetura Core, usada nos processadores Core 2, introduziu o conceito de

fusão de instruções (“macro-fusion”), que é a capacidade de combinar duas instruções x86

dentro de apenas uma microinstrução. Isto aumenta o desempenho e diminui o consumo do

processador, já que ele executará apenas uma microinstrução em vez de duas, é limitado a

instruções de desvio condicional e de comparação (Instruções CMP, TEST e Jcc).

A microarquitetura Nehalem aumenta a capacidade da fusão de instruções de duas

formas. Primeiro adicionando suporte a várias instruções condicionais que não poderiam ser

fundidas nos processadores Core 2. Segundo, nos processadores baseados na microarquitetura

Nehalem a fusão de instruções é usada nos modos de 32 bits e de 64 bits, enquanto que nos

Page 76: Aquitetura dos Processadores Multicore

processadores Core 2 a fusão de instruções funciona apenas quando o processador está

trabalhando no modo de 32 bits.

A microarquitetura Core adicionou um detector de laços (“Loop Stream Detector”),

basicamente um pequeno cache de 18 instruções entre as unidades de busca e de

decodificação do processador. Quando o processador está executando um laço de repetição

(mais conhecido como “loop”, parte de um programa que se repete várias vezes) o

processador não precisa buscar as instruções requeridas novamente do cache L1 de instruções:

elas já estão próximas da unidade de decodificação. O processador desliga as unidades de

busca e de previsão de desvio quando detecta a execução de um laço, fazendo com que o

processador consuma menos energia.

Nos processadores baseados na microarquitetura Nehalem este pequeno cache foi

movido para após da unidade de decodificação de instruções. Portanto, em vez de armazenar

instruções x86 como nos processadores Core 2, este cache guarda até 28 microinstruções

(micro-ops). Isto faz com que exista um aumento de desempenho quando o processador está

executando um laço de repetição, já que ele não precisa decodificar as instruções presentes no

laço: elas já estarão decodificadas dentro deste pequeno cachê(figura 7). O processador pode

desligar a unidade de decodificação de instruções além das unidades de busca e previsão de

desvio quando detecta a execução de um laço, fazendo com que o processador economize

ainda mais energia.

Figura 7: Localização do detector de laços nos processadores Core e Nehalem.

Page 77: Aquitetura dos Processadores Multicore

Figura 8: Portas de despacho e unidades de execução.

A arquitetura Nehalem adicionou uma porta de despacho extra e agora tem 12

unidades de execução, como você pode ver acima. Com isso os processadores baseados nesta

arquitetura podem ter mais microinstruções sendo executadas ao mesmo tempo do que os

processadores anteriores (Figura 8).

A microarquitetura Nehalem adicionou também dois buffers extras: um segundo

Buffer de Tradução de Endereços (TLB, Translation Look-aside Buffer) com 512 entradas e

um segundo Buffer de Desvios (BTB, Branch Target Buffer). A adição desses dois buffers

aumenta o desempenho do processador.

O TLB é uma tabela usada pelo circuito de memória virtual para conversões entre

endereços físicos e endereços virtuais. A memória virtual é uma técnica onde o processador

simula mais memória RAM em um arquivo no disco rígido (arquivo de troca) para permitir

que o microcomputador continue operando mesmo quando não há memória RAM suficiente

disponível (o processador pega o que está na memória RAM, armazena neste arquivo de troca

e então libera espaço na memória para uso).

Page 78: Aquitetura dos Processadores Multicore

A previsão de desvios é um circuito que tenta “adivinhar” os próximos passos de um

programa, carregando para dentro do processador as instruções que ele acha que o

processador tentará carregar. Se ele estiver certo, o processador não perderá tempo carregando

essas instruções da memória, já que elas já estarão dentro do processador. Aumentando o

tamanho desse buffer (ou adicionando um segundo buffer, no caso dos processadores

baseados na microarquitetura Nehalem) permite que este circuito carregue antecipadamente

ainda mais instruções, aumentando o desempenho do processador.

5.2.4 Aprimoramentos no Gerenciamento de Energia

Os transistores dentro do processador funcionam como chaves, com dois estados

possíveis: condutivo (também chamado “modo de saturação”), funcionando como uma chave

fechada, e não-condutivo (também chamado “modo de corte”), funcionando como uma chave

aberta. O problema é que quando os transistores estão no estado não-condutivo eles

teoricamente não deveriam permitir nenhum tipo de passagem de corrente, porém uma

pequena quantidade acaba passando. Esta corrente é chamada corrente de fuga e se você

somar todas as correntes de fuga você terá uma quantidade significativa de corrente (e

consequentemente potência) sendo desperdiçada, gerando calor desnecessariamente.

Atualmente um dos desafios nos projetos de processadores tem sido a tentativa de eliminar a

corrente de fuga.A arquitetura Nehalem traz uma unidade de controle de energia dentro do

processador que é responsável por melhorar o gerenciamento de energia (veja na Figura 9).

Esta unidade reduz a corrente de fuga além de permitir o novo “Modo Turbo”, que falaremos

na próxima página. Basicamente, o processador pode agora alimentar com diferentes tensões

e clocks cada núcleo, as unidades fora dos núcleos, o controlador de memória, o cache e as

unidades de entrada/saída. Nos processadores anteriores todos os núcleos tinham de trabalhar

com o mesmo clock, mas nos processadores Nehalem cada núcleo pode ser programado para

rodar com um clock diferente com o objetivo de economizar energia.

Page 79: Aquitetura dos Processadores Multicore

Figura 9: Unidade de controle de energia.

A unidade de controle de energia embutida pode agora desligar qualquer um dos

núcleos do processador, recurso este não disponível em processadores Core 2 para notebooks.

O processador pode colocar qualquer núcleo no modo C6 (“desligamento profundo”)

independente do estado de funcionamento dos outros núcleos. Isto permite economizar

energia quando o micro está rodando normalmente, porém com um ou mais núcleos ociosos e

que podem ser desligados.

5.2.5 Modo Turbo

A unidade de controle de energia embutida também incluiu sensores da potência

dissipada por cada núcleo. Dessa forma o processador sabe a potência que cada núcleo está

consumindo e a quantidade de calor que está sendo dissipada. Isto permitiu a adição de um

“Modo Turbo” no processador.

Page 80: Aquitetura dos Processadores Multicore

O Modo Turbo permite ao processador aumentar o clock do(s) núcleo(s) ativo(s). Esta

não é nova e o Core i7 não é o primeiro processador a usá-la (alguns processadores Xeon

baseados na arquitetura Netburst –a arquitetura do Pentium 4 – têm este recurso, conhecido

como tecnologia “Foxton”). Mas nas encarnações antigas desta tecnologia este recurso só

podia ser usado quando os outros núcleos de processamento estavam ociosos.

Este novo modo é um sistema de laço fechado. O processador está constantemente

monitorando sua temperatura e consumo. O processador fará um overclock dos núcleos ativos

até que o processador atinja seu TDP máximo permitido, baseado no cooler que você estiver

usando. Isto é configurado no setup da placa-mãe. Por exemplo, se você disser que o cooler do

processador é capaz de dissipar 130 W, o processador aumentará (ou reduzirá) o seu clock de

modo que a sua potência seja compatível com a quantidade de potência que o cooler do

processador consegue dissipar. Se substituir o cooler do processador por um melhor, terá que

configurar no setup da sua placa-mãe o TDP do novo cooler (a quantidade máxima de potência

térmica que ele pode dissipar) para que o Modo Turbo aumente o clock do processador.

O processador não tem que necessariamente desligar os núcleos que não estejam sendo

usados para habilitar o Modo Turbo. Mas como esta técnica de overclock dinâmica é baseada

na quantidade de potência que você pode dissipar usando o cooler do seu processador,

desligar os núcleos que não estejam sendo usados reduzirá o consumo do processador e a

dissipação de potência e conseqüentemente permitirá um overclock maior. O novo Modo

Turbo é uma extensão da tecnologia SpeedStep e é por isso que ele é visto pelo micro como

um recurso SpeedStep. Ele funcionará apenas para os núcleos do processador, e por isso o

controlador de memória e o cache de memória não serão afetados por esta tecnologia.

6 Outros Recursos

A tecnologia Hyper-Threading permite que cada núcleo do processador seja reconhecido

como dois processadores. Dessa forma, se você tem um processador Core i7 com quatro

núcleos o sistema operacional o reconhecerá como sendo um processador de oito núcleos.

Esta tecnologia é baseada no fato de que quando o processador está trabalhando existem

certos circuitos internos que ficam ociosos e que poderiam ser usados. Originalmente lançada

para os processadores Pentium 4 esta é a primeira vez que a tecnologia Hyper-Threading está

disponível nos processadores Intel de 6ª geração. Esta tecnologia também é chamada SMT ou

Simultaneous Multi-Threading (SMT). Esta tecnologia não oferece o mesmo ganho de

desempenho de como se núcleos “de verdade” fossem usados (um processador com 8 núcleos

Page 81: Aquitetura dos Processadores Multicore

é mais rápido do que um processador com 4 núcleos com tecnologia HT, desde que ambos

estejam trabalhando com o mesmo clock e sejam baseados na mesma arquitetura); porém

você está ganhando esses “núcleos extras”. Existem dois tipos de instruções SSE que acessam

a memória: alinhadas e desalinhadas. As instruções alinhadas precisam que os dados

requisitados estejam dentro do limite de endereçamento de 16 bytes (128 bits), enquanto que

as instruções desalinhadas não. (Figura 10)

Figura 10: Instruções alinhadas vs. Desalinhadas