NOTE: Esta resposta foi escrita há 8 anos atrás. Desde então, a programação paralela tornou-se mais relevante. Isto deve-se provavelmente aos limites de velocidade de relógio inerentes e aos limites de tamanho de transístor que se aproximam rapidamente.
O seu problema principal é o software não escrito para multi-core.
Veja o excelente artigo de Jeff Atwood sobre Escolhendo dual core ou quad core .
& > para a maioria do software, atinge um ponto de retorno decrescente muito rapidamente após dois núcleos. Em Quad-Core Desktops e Diminuição de Retornos &, questionei o quão eficazmente o software actual pode realmente utilizar até quatro núcleos de CPU, muito menos os inevitáveis oito e dezasseis núcleos de CPU que veremos daqui a alguns anos.
& É respondido aqui (destaque copiado do artigo de Jeff),
Contudo, houve aqui algumas surpresas, tais como Excel 2007, e a definição de “operações simultâneas” de Lost Planet. É possível que a engenharia de software acabe por avançar ao ponto de a velocidade do relógio importar menos do que o paralelismo. Ou eventualmente poderá ser irrelevante, se não conseguirmos escolher entre velocidades de relógio mais rápidas e mais núcleos de CPU. Mas entretanto, ** a velocidade do relógio ganha a maior parte do tempo. Mais núcleos de CPU não é automaticamente melhor***. Os utilizadores típicos estarão melhor com o CPU de núcleo duplo mais rápido possível que podem pagar.
A questão do Front-Side Bus* (esse termo sempre me divertiu). Com Nehalem as coisas mudam … como a ArsTechnica disse no ano passado.
A Lei de Moore deu aos desenhadores de processadores um embaraço de riquezas de transístores, e em nenhum lugar isso é mais aparente do que no processador Nehalem de 45nm da Intel. Estreando em variantes de 4 e 8 núcleos no final deste ano, Nehalem embala uma tonelada de hardware numa única tomada de processador. (Os primeiros números colocam a contagem de transistores de uma Nehalem de 4 núcleos em 781 milhões; ainda não apareceram números para o modelo de 8 núcleos). Mas tentar alimentar todo esse hardware com a arquitectura de barramento frontal existente na plataforma Intel seria uma loucura. Assim, igualmente importante, Nehalem também soa o toque de morte há muito esperado para a arquitectura de autocarros de frentes geriátricas positiva da Intel.
A mudança radical na situação da largura de banda do sistema da Intel que o novo QuickPath Interconnect (QPI) da Intel representa é talvez o maior factor único que moldou o design de Nehalem. Entre QuickPath e o controlador de memória integrado da Nehalem, um processador Nehalem terá acesso a uma quantidade sem precedentes de largura de banda agregada, especialmente em implementações de dois e quatro soquetes.
AMD moveu o controlador de memória para o processador mais cedo e utilizou o Hypertransport.