O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW
dc.contributor.advisor-co1 | Reis Junior, Neyval Costa | |
dc.contributor.advisor1 | Souza, Alberto Ferreira de | |
dc.contributor.author | Freitas, Christian Daros de | |
dc.contributor.referee1 | Schneebeli, Hans Jorg Andreas | |
dc.contributor.referee2 | Fernandes, Edil Severiano Tavares | |
dc.date.accessioned | 2016-12-23T14:33:33Z | |
dc.date.available | 2007-06-11 | |
dc.date.available | 2016-12-23T14:33:33Z | |
dc.date.issued | 2003-10-29 | |
dc.description.abstract | Superscalar machines fetch multiple scalar instructions per cycle from the instruction cache. However, machines that fetch no more than one instruction per cycle from the instruction cache, such as Dynamically Trace Scheduled VLIW (DTSVLIW) machines, have shown performance comparable to that of Superscalars. In this paper we present experiments which show that fetching a single instruction from the instruction cache per cycle allows the same performance achieved fetching multiple instructions per cycle thanks to the execution locality present in programs. We also present the first direct comparison between the Superscalars, Trace Cache and DTSVLIW architectures. Our results show that a DTSVLIW machine capable of executing up to 16 instructions per cycle can perform 21.9% better than a Superscalar and 6.6% better than a Trace Cache with equivalent hardware. In the comparison between a DTSVLIW machine and an Alpha 21264 machine, we have shown that the DTSVLIW can perform 24,17% better than Alpha using integer programs, and 60,36% better than Alpha using floating point programs. | eng |
dc.description.resumo | Máquinas Super Escalares trazem múltiplas instruções escalares da cache de instruções por ciclo. Contudo, máquinas que buscam na cache de instruções apenas uma instrução escalar por ciclo de relógio têm demonstrado níveis de desempenho comparáveis aos de máquinas Super Escalares, como é o caso de máquinas que seguem a arquitetura Dynamically Trace Scheduled VLIW (DTSVLIW). Neste trabalho, é mostrado através de experimentos que basta trazer uma instrução escalar por ciclo de máquina da cache de instruções para atingir praticamente o mesmo desempenho obtido trazendo várias instruções por ciclo graças à localidade de execução existente nos programas. Fazemos, também, a primeira comparação direta entre as arquiteturas Super Escalar, Trace Cache e DTSVLIW. Os resultados dos experimentos mostram que uma máquina DTSVLIW, capaz de executar até 16 instruções por ciclo, tem desempenho 21.9% superior que uma Super Escalar hipotética e 6.6% superior que uma Trace Cache com hardware equivalente. Quando comparada com uma máquina Alpha 21264, a máquina DTSVLIW apresenta um desempenho 24,17% superior, para os programas inteiros e, 60,36% superior, para os programas de ponto flutuante do SPEC2000. | |
dc.format | Text | |
dc.identifier.citation | FREITAS, Christian Daros de. O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW. 2003. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2003. | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/6349 | |
dc.language | por | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Mestrado em Informática | |
dc.publisher.department | Centro Tecnológico | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Informática | |
dc.rights | open access | |
dc.subject.br-rjbn | Arquitetura de computador | |
dc.subject.br-rjbn | Memória cache | |
dc.subject.cnpq | Ciência da Computação | |
dc.subject.udc | 004 | |
dc.title | O efeito da largura de Fetch no desempenho das arquiteturas super escalar, trace cache e DTSVLIW | |
dc.type | masterThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- dissertacao.pdf
- Tamanho:
- 513.43 KB
- Formato:
- Adobe Portable Document Format
- Descrição: