ar quite tura paralel a

6
Arquiteturas paralelas (incluindo multicore, clusters e GPU OpenMP, OpenCL, OpenGL e CUDA http://www-usr.inf.ufsm.br/~sandro/elc139/tarefa1.php Taxonomia arquitetura Flynn. SISD - Single Instruction Single Data - É o caso das máquinas clássicas não paralelas da arquitetura de von Neuman e colaboradores. Com um único fluxo de instrução e um único fluxo de dados. C - Unidade de Controle P - Unidade de Processamento M - Memória *Arquitetura de Von Neumann - Programa - sequência de instruções na memória; - Registrador - PC - program counter - indica a palavra de memória que contêm a próxima instrução; - Registrador - IR - instruction register - decodificação e execução das instruções. loop{ IR = mem[PC]; PC = PC +1; executa IR; testa e trata INT; }

Upload: simon-saraiva

Post on 18-Aug-2015

217 views

Category:

Documents


2 download

DESCRIPTION

conhecendo arquiteturas paralelas de computadores.

TRANSCRIPT

Arquiteturas paralelas (incluindo multicore, clusters e GPUOpenMP, OpenCL, OpenGL e CUDAhttp://www-usr.inf.ufsm.br/~sandro/elc139/tarefa1.phpTaxonomia arquitetura Flnn.!"!# - !in$le "nstruction !in$le #ata - % o caso das m&quinas cl&ssicas n'o paralelas da arquitetura de (on)euman e colaboradores. *om um +nico fluxo de instru,'o e um +nico fluxo de dados. * - -nidade de *ontrole . - -nidade de .rocessamento / - /em0ria12rquitetura de 3on )eumann- .ro$rama - sequ4ncia de instru,5es na mem0ria6- 7e$istrador - .* - pro$ram counter - indica a pala(ra de mem0ria que cont4m a pr0xima instru,'o6- 7e$istrador - "7 - instruction re$ister - decodifica,'o e execu,'o das instru,5es.loop8"7 9 mem:.*;6.* 9 .* onde (&rias instru,5es podemser executadasaomesmo tempo em unidadesde processamento diferentescontroladas por unidadesdecontrole independentes @uma para cada unidade de processamentoA. .ermite execu,'o de instru,5esdiferentes para cada dado. 2rquitetura utiliDada emser(idores comm+ltiplos processadores> sistemasmulticomputadores @clustersA.* - -nidade de *ontrole . - -nidade de .rocessamento / - /em0ria*lassificam-se as diferentes formas que cada processador acessa a mem0ria-/2 - -niforme /emor 2ccess)-/2 - )on--niforme /emor 2ccess*E/2 - *ache Enl /emor 2ccess7efer4nciashttp://www.inf.pucrs.br/~noc/wiFi3/lib/exe/fetch.phpGmedia9docs:qualificacaoHDeferino.pdfhttp://www.slideshare.net/mobileIraDil/an/minicurso-arquiteturas-paralelashttp://www.hardware.com.br/$uias/processadores-JKbits/quadfx-sFulltrail.htmlhttp://www.hardware.com.br/arti$os/intel-nehalem/http://www.inf.ufsc.br/~mario/e$c.pdf http://www.slidefinder.net/p/paralelismoHLMemHLMmaquinasHLMmultiprocessadas/3MJKM1JN(?deos sobre a conex'o memoria-processador arquitetura intel e 2/#.http://outu.be/O.IO3clHclPhttp://outu.be/dJ#uOawQJRNhttp://outu.be/ehRS7C2K7ro*R-!TP7Psta,5es de trabalho e .*s de alto desempenho e redes de comunica,'o r&pidas.!tallin$ 2rquitetura de *omputadores p&$ JTT.*onstitui uma alternati(a para os multiprocessadores simBtricos !/.. -m *luster pode ser definido como um$rupo de computadores completos interconectados. *ompletos por que s'o sistemas que podem operar porsi pr0prio> independente do *luster> B usualmente denominado n0.Ienef?cios:- Pscalabilidade 2bsoluta U B poss?(el criar clusters muito $randes> com deDenas de m&quinas.- Pscalabilidade "ncremental U sua confi$ura,'o possibilita adicionar no(os sistemas> expandindo de formaincremental.- 2ltadisponibilidadeUcomocadan0Bindependente> umafalhaemumn0n'osi$nificaperdatotal deser(i,o.- /elhor rela,'o custo/desempenho U B poss?(el equipara o processamento de um cluster a partir pequenoscomputadores> comparado a uma m&quina de $rande porte.C.-"nicialmente proVetadas para processamento $r&fico> as C.-s @Craphics .rocessin$ -nitA continham apenasfun,5es de renderiDa,'o fixa. 2 tend4ncia B de que se tornem processadores $enBricos @C.C.-A.*.- B uma unidade de processamento central do computador e a maioria das *.-s multicore atuais utiliDammem0ria compartilhada atra(Bs de cach4 compartilhado.Tem uma thread de processo por (eD.Tem um conVunto de re$istradores contendo o estado da thread atual.-ma-R2 @-nidadeR0$ica 2ritmBticaAdedicadaparaathreadatual. Pumaunidade$randededicadaaoescalonamento de tarefas.2 C.- B uma unidade de processamento especialiDado em $r&ficos 3#.% f&cilperceber que asC.-ss'oproVetadasparaaexecu,'odecomputa,'onumBricaequeas *.-spodem ter um desempenho melhor em al$umas tarefas para as quais as C.-s n'o foram proVetadas. Ro$o> amaioriadasaplica,5esir'ousar *.-> paraas partessequenciaiseC.-para as partesde computa,'onumBricaintensa. Pntretanto> al$unsmodelosdepro$rama,'ocomoo*-#2@*ompute-nified#e(ice2rchitectureA> s'o proVetados para suportar a execu,'o de uma aplica,'o de forma conVunta na *.- e naC.-.2rquitetura C.-- !'o or$aniDadas em (etor de !/s @!treamin$ /ultiprocessorsA com m+ltiplas threads.- 2 C.- CNM B massi(amente paralela62rquitetura C.- Fermi- "nstru,5es para pro$ramas em * tanto o paralelismo de tarefas> como de dados.Pla foi adotada para controladores de placas $r&ficas pela 2/#/2T"> que a tornou na sua +nica oferta de C.-como !tream !#Y> e pela )(idia> que oferece tambBm Epen*R como a escolha para o seu *ompute -nified#e(ice 2rchitecture @*-#2A nos seus controladores. 2 arquitetura Epen*R partilha uma sBrie de interfacescomputacionais> tanto com *-#2> como com /icrosoftZs competin$ #irect*ompute.EpenCR @Epen Craphics RibrarAhttp://al$ol.dcc.ufla.br/~bruno/aulas/c$/monte-mor/11.htm% uma 2." @Aplication Programming InterfaceA padr'o destinado a constru,'o de uma biblioteca paraacria,'o de ima$ens> adotado por di(ersas plataformas de hardware.EpenCR pode ser implementado em hardware ou software6*-#2http://www.n(idia.com.br/obVect/cudaHhomeHnewHbr.html*-#2[ B uma plataforma de computa,'o paralela e um modelo de pro$rama,'o in(entados pela )3"#"2.Pla permite aumentos si$nificati(os de performance computacionalao apro(eitar a pot4ncia da unidade deprocessamento $r&fico @C.-A.*-#2> (oc4 pode en(iar c0di$o em *> * sem precisar usar uma lin$ua$emde compila,'o.