sexta-feira, 29 de outubro de 2010
Memória Cache
Cache é um dispositivo de acesso rápido, interno a um sistema, que serve de intermediário entre um operador de um processo e o dispositivo de armazenamento ao qual esse operador acede. A vantagem principal na utilização de uma cache consiste em evitar o acesso ao dispositivo de armazenamento - que pode ser demorado -, armazenando os dados em meios de acesso mais rápidos.
Clock
Clock é um sinal ultilizado para sincronizar as atividades realizadas pelo computador. O sinal de clock é medida através de uma unidade denominada Hertz (Hz), que indica a quantidade de ciclos de clock por segundo. Para melhor entendimento, veja o exemplo: um clock de 200 MHz quer dizer que 1 segundo possui 200 milhões de ciclo de clock. O clock tem influência no desempenho, mas não é somente isso que determina o desempenho do micro.
Microarquitetura AMD
Microarquitetura AMD:
Microarquitetura | K5 | K6 | K7 | K8 | K10 |
Processadores | AMD K5 | AMD K6 K6-2 K6-III | Athlon Athlon XP Duron | Athlon 64 Athlon FX Athlon X2 Semprom | Phenom |
Microarquitetura AMD:
K5
A primeira tecnologia desenvolvida pela AMD foi o processador K5 (com K de Kryptonite) que foi lançado em 1995, concorrente direto do Pentium (Pentium 1 ou 586), lançado em 1993. A arquitetura do K5 era muito semelhante a do Cyrix 6x86 e Pentium Pro xx.
K6
Em 1996 a AMD comprou a NexGen, empresa fundada por ex-engenheiros da Intel e que tinha direito de uso da tecnologia Nx da série x86 da Intel. A tecnologia adquirida por meio da NexGen possibilitou o desenvolvimento dos processadores K6, agora com unidade de ponto flutuante integrada, item que não fazia parte da geração K5. O K6, que já apresentava instruções compatíveis com MMX. Em sua segunda versão, o K6-2, o processador recebeu novas instruções multimédia desenvolvidas pela AMD, chamadas de (3DNow!). O K6-2 também recebeu um novo padrão de socket que aumentava de 66 para 100MHz o Clock externo possível ao processador.
K7
A maior inovação da geração Athlon (K7) é a unidade de ponto flutuante, junto com a microarquitetura geral. Eles também examinaram a arquitetura interna do Intel P6 e otimizaram o projeto da Intel aumentando a sua performance. No final, a equipe da AMD conseguiu um processador com performance 35% maior que o Intel de mesmo clock. Essas características contribuiram para um aumento da participação de mercado da empresa.
A nova linha de processadores K7 (AthlonXP) contava com uma nova subarquitetura, denominada Palomino, a qual já dispunha de cache L2 dentro do chip e compatibilidade com as instruções multimidia SSE (desenvolvidas pela Intel), entre outras melhorias e correções. Causando um aumento de performance geral em 10%. O preço para esta conquista foi um aumento de temperatura do processador, a qual só era corrigida com coolers potentes (e que muitas das vezes custavam caro). Houve ainda mais uma subarquitetura, denominada Barton, com cache L2 de 512KB, o que manteve os Athlon competitivos no mercado de processadores de ponta.
O athlon foi desenvolvido no ano de 1999 à 2005.Ele possui uma frequencia de 500 Mhz à 2333Mhz. foi desenvolvido por uma combinação de engenheiros da AMD e da antiga DEC sendo uma junção de ambas as tecnologias. é um micro processador que codifica instruções x86 em seu tempo de execução.
K8
Os AMD64 (K8) são uma evolução da arquitetura K7, onde a mudança mais perceptível é a inclusão de instruções 64 bits na “base x86” e a inclusão do controlador de memória RAM no próprio chip ao invés da controladora (ponte norte) da placa mãe, este um dos grandes responsáveis pelo grande ganho de desempenho de processamento no acesso à memória. Com isso a AMD gera seus próprios padrões de mercado, desenvolvendo e padronizando as instruções 64 bits (AMD64). O AMD Opteron é a versão para servidor do processador K8. Com isso o AMD Opteron compete atualmente com os Intel Xeon.
K10
Nova série de processadores de alto desempenho da AMD. Atualmente se encontra no mercado processadores de 2, 3, 4 e 6 núcleos, conhecidos como Phenom X2, X3, X4 e X6 respectivamente. Diferente das outras linhas de chips, como o Athlon 64 e 64 X2, possui cache L3 de 2MB, 4MB ou 6MB. Teve sua plataforma e arquitetura drasticamente modificadas, e já possui sua versão FX, com multiplicador destravado, tendo uma versão desse processador para o soquete F+.
Microarquitetura Nehalem
Microarquitetura Nehalem
A Microarquitetura Nehalem é a base da família de processadores Core i7.Ela faz parte da filosofia “tick-tock” da Intel. Essa filosofia prevê a apresentação de novas microarquiteturas e técnicas de fabricação em anos alternados. O “tick” equivale ao lançamento de uma nova técnica de fabricação eo “tock” significa o lançamento de nova microarquitetura. A Nehalem é o mais novo passo “tock” (2008) eo próximo “tick” será a técnica nova de fabricação com 32nm.
Recursos principais:
Multi-Threading simultâneos:
.Esse dispositivo simula dois processadores lógicos em um único processador físico, Assim um processador de quatro núcleos opera como se tivesse oito.
Melhoria na Smart Cache: Essa tecnologia foi aperfeiçoada pela microarquitetura Nehalem adicionando-se um cache L3 de até 8Mb, que é compartilhado entre os núcleos. Dentro de cada núcleo é mantido um cache L1 e um L2. A cache L3 serve como cópia de segurança.
Controlador de memória integrado: Em modelos mais antigos, o controlador de memória ficava localizado no interior da ponte norte do chipset e controlava o fluxo de dados enviando para o processador e para a memória. Com o avanço da tecnologia dos processadores, o barramento local que fazia essa conexão passou a ficar lento, tornando-se um gargalo.
O Barramento QuickPath Interconnect
Assim como o HyperTransport, o QuickPath fornece duas pistas separadas para a comunicações entre o processador e chipset, como você pode ver na Figura 3. Isto permite ao processador transmitir (“escrever”) e receber (“ler”) dados ao mesmo tempo (ou seja, em paralelo). Como na arquitetura tradicional o barramento externo é usado tanto para operações de entrada quanto para operações de saída, as leituras e escritas não podem ser feitas ao mesmo tempo.Falando em chipsets, a Intel lançará inicialmente uma solução com um único chip. Como nos processadores com controlador de memória integrado o equivalente ao chip ponte norte já está dentro do processador, o chipset funciona apenas como chip ponte sul ou “Hub controlador de E/S” ou simplesmente “IOH” (“I/O Hub”) no linguajar da Intel.
Turbo Boost:
Se o processador detecta que está abaixo de sua capacidade, temperatura ou limites, o Turbo Boost aumenta a frequência do clock para melhorar o desempenho dos núcleos ativos. A frequência do processador aumentará 133 MHz em intervalos curtos e regulares, caindo na mesma medida quando ultrapassar a capacidade máxima de processamento. A melhora é ainda mais significativa para aplicativos que utilizam apenas um thread. Microarquitetura Core
Microarquitetura Core
microarquitetura Intel Core, divulgada em 2006 pela Intel, é uma nova arquitetura que permite um aumento de desempenho combinado à um menor consumo de energia. Possui recursos avançados que permitem um melhor desempenho por Watt. Dentre estes recursos temos uma execução mais rápida de instruções maiores, uma melhora no sistema de consumo de energia que possibilita a desativação temporária de áreas ociosas, um sistema aprimorado de predição de instruções e dados e também algumas novas instruções multimídia.
O texto abaixo apresenta em linhas gerais essa nova arquitetura e seus principais recursos.
Intel Wide Dynamic Execution
A Execução Dinâmica é uma combinação de técnicas como a análise do fluxo de dados, execução especulativa, execução fora de ordem e tecnologia superescalar onde se tem mais de uma unidade de execução. A primeira vez que esta tecnologia foi usada pela Intel foi na microarquitetura Intel de 6ª geração, conhecida como P6, usada nos processadores Pentium Pro, Pentium II, and Pentium III. Para a microarquitetura Intel NetBurst, foi introduzido o Advanced Dynamic Execution, um dispositivo de execução especulativa proposto para manter a continuidade da execução de instruções dentro do processador. Além disso, a NetBurst possui um algoritmo de previsão de desvio (branch-prediction) mais eficaz diminuindo o número de reconfigurações do pipeline.
Com a microarquitetura Intel Core tem-se um ganho significativo da capacidade de despachar execuções devido ao Intel Wide Dynamic Execution. Essa tecnologia possibilita uma maior entrega de instruções por ciclos de clock melhorando tanto o tempo de execução como a utilização eficaz de energia. Cada núcleo de execução é, digamos, mais largo, possibilitando que cada núcleo busque, despache, execute e retorne até quatro instruções completas simultaneamente. Anteriormente a NetBurst podia trabalhar com ate três instruções por tempo, um ganho de desempenho de 33%. Outras melhorias incluem um melhor algoritmo de previsão de desvio, buffers de instruções maiores o que possibilita mais flexibilidade na execução além de outras melhorias que reduzem o tempo de execução.
Intel Advanced Smart Cache
A arquitetura Intel Core foi desenvolvida desde o começo prevendo-se o suporte a vários núcleos por processador. Diferentemente dos processadores anteriores, os processadores Intel Core com múltiplos núcleos compartilham a memória cache de nível 2 (L2).
A primeira vantagem da estratégia de compartilhar o cache L2 é que a quantidade de cache L2 pode ser alterada dinamicamente de acordo com a carga dos núcleos. Em um processador DualCore, quando um núcleo está inativo, o núcleo ativo fica com toda a cache L2 à sua disposição. Quando vários núcleos estão ativos a cache L2 é dividia proporcionalmente entre os núcleos de acordo com a freqüência de requisições feitas por cada núcleo à memória.
A segunda vantagem é que ao utilizar uma única cache L2 não é necessário utilizar técnicas para garantir a consistência de dados entre as caches dos vários núcleos, diminuindo a utilização do barramento entre o processador e a memória do sistema.
Uma terceira vantagem é que o espaço total disponível em cache L2 é melhor utilizado já que quando dois núcleos utilizam os mesmos dados eles não são duplicados em várias caches, sendo compartilhados pelos dois núcleos.
A última vantagem é que a microarquitetura Core possui lógica de controle adicional para permitir que os dados da cache L1 de um núcleo sejam transferidos para a cache L1 de outro núcleo passando pela cache L2 compartilhada. Isso permite um passo a menos (não é necessário transferir dados entre as caches L2 de cada núcleo) no compartilhamento de dados entre as caches L1 de diversos núcleos, potencialmente melhorando a performance do sistema quando vários núcleos executam a mesma tarefa.
Intel Smart Memory Access
Intel Smart Memory Access é o nome de um conjunto de técnicas utilizada para aumentar a performance do sistema de acesso à memória do processador. Consiste das técnicas de Pré-Carregamento e Desambiguação de Memória.Intel Advanced Digital Media Boost
O Intel Advanced Digital Media Boost é um recurso que melhora significativamente a performance quando executa instruções SSE. Tanto as operações de ponto de flutuação com dupla precisão da SIMD em 128-bits como as operações aritméticas de inteiros SIMD em 128-bits reduzem o número total de instruções necessárias para executar uma determinada tarefa do programa, e como resultado pode contribuir para um aumento total da performance. Eles aceleram uma grande quantidade de aplicações, incluindo vídeo, som, imagem, processamento de fotos, encriptação, financeiras, científicas e de engenharia. As instruções de SSE intensificam a arquitetura da Intel ao permitir que os programadores desenvolvam algoritmos que podem misturar pacotes de pontos de flutuação de precisão individual com inteiros, usando tanto as instruções SSE como as instruções MMX, respectivamente.
Em várias das antigas gerações de processadores, as instruções SSE, SSE2 e SSE3 em 128 bits eram executadas em um nível sustentado de uma instrução completa a cada dois ciclos de relógio—por exemplo, a mais baixa em 64 bits em um ciclo e a mais alta em 64 bits no próximo ciclo. O recurso Intel Advanced Digital Media Boost permite que estas instruções em 128-bits sejam completamente executadas em um nível de rendimento de uma por ciclo de relógio, efetivamente dobrando a velocidade da execução para estas instruções. Isto aumenta ainda mais a eficiência total da Microarquitetura Intel® Core™ através do aumento do número de instruções controladas por ciclo. O recurso Intel Advanced Digital Media Boost é particularmente útil para a execução de importantes operações de multimídia envolvendo gráficos, vídeo e áudio e para o processamento de outros conjuntos de dados ricos que utilizam instruções SSE, SSE2, e SSE3.
Microarquitetura NetBurst
Microarquitetuta NetBurst
A microarquitetuta NetBurst foi ulilizada nos primeiros modelos do Pentium 4 e por todos os processadores criados a partir do mesmo, como os Celerons, Pentium 4 Extreme Edition, Pentium D, Pentium Extreme Edition eo Xeon.
Ela é formada por quatro recursos principais:
Tecnologia Hyper Pipelined:
O pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividindo o trabalho de processar as instruções. É como uma linha de produção com vários operários, em que cada um monta uma peça, até termos no final o produto completo.
Rapid Execution Engine:
Todo processador atual é dividido em dois componentes básicos, as unidades de execução de inteiros e as unidades de ponto flutuante (FPU). A parte que processa as instruções envolvendo números inteiros é responsável pela maior parte das instruções e pelo desempenho do processador nos aplicativos do dia-a-dia, enquanto as unidades de ponto flutuante são as responsáveis pelo processamento das instruções envolvendo valores complexos, usadas por jogos e aplicativos gráficos.
Advanced Dynamic Execution:
Consiste em um dispositivo de execução especulativa, com objetivos de acelerar o fluxo de trabalho do processador e garantir que a unidade de execução do processador permaneça ocupado.
Execution Trace Cache:
É um tipo de memoria cache muita ultrarrápida que armazena instruções já decodificadas e prontas para serem processadas.
quinta-feira, 28 de outubro de 2010
Microarquiteturas Intel
A Intel possui diversas microarquiteturas, sendo que cada uma foi aperfeiçoando a anterior. Os processadores de uma mesma microarquitetura possuem características comuns.
Observe na tabela a seguir, a relação de microarquitetura Intel e seus processadores para desktop:
Microarquitetura | Processador |
P5 | Pentium Pentium MMX |
P6 | Pentium Pro Pentium II Pentium II Xeon Pentium III Pentium III Xeon |
NetBurst | Pentium 4 Xeon Pentium D |
Core | Core 2 Duo Core 2 Quad Core 2 Extreme |
Nehalem | Core i7 Core i7 Extreme |
sexta-feira, 22 de outubro de 2010
Processadores
Processador (CPU, Microprocessador, Unidade Central de Processamento, UCP)
O processador é a unidade central de processamento de computador ou sistema computacional.
O processador é um circuito integrado que executa instruções de máquina, realizando diversos cálculos e tomadas de decisão. É o cérebro do computador, pois qualquer tarefa é executa por ele.
O processador processa os dados que recebe, transformando-os em outros dados que chamamos de informação.
O processador também é denominado CPU (Central Processing Unit) ou UCP (Unidade Central de Processamento).
Microprocessador é o nome dado ao processador usado em PCs (Computadores Pessoais), servidor, notebook, workstation e mainframe usados por pessoas, empresas e instituições em geral.
Assinar:
Postagens (Atom)