## ARC TD4

# Un CPU von Neuman complet (4h, dont 2h sur papier au debut), 27 mars 2025

## Construit à partir du poly de TD-TP des cours IF-AC et IF-AO

Dans ce TD, on va étudier un CPU simple 8 bits. Nous proposerons d'abord un assembleur possible pour cette machine simple et étudierons les notions d'encodage d'instruction, d'assemblage, de deassemblage, format binaire etc.

Puis il vous sera fournit le code au format Digital d'une architecture de CPU qui implémente ce jeu d'instruction. Il s'agit donc d'un petit processeur 8-bits décrit en Digital. il n'implémente pas toutes les instructions mais juste le saut, conditionnel et inconditionnel. Le travail consistera a modifier l'automate du CPU pour ajouter progressivement des instructions.

La micromachine, i.e. le processeur 8-bit, possède les spécifications suivantes :

- ses bus d'adresse et données sont sur 8 bits;
- le seul type de donnée supporté est l'entier 8 bits signé;
- il possède deux registres de travail de 8 bits, notés A et B.

Au démarrage du processeur, tous les registres sont initialisés à 0. C'est vrai pour A et B, et aussi pour le PC : le processeur démarre donc avec le programme à l'adresse 0.

Les instructions assembleur de ce processeur sont regroupées en 5 catégories : Instructions de calcul, Instructions d'accès à la mémoire, sauts absolus, sauts relatifs et comparaison arithmétique.

#### Instructions de calcul à un ou deux opérandes par exemple

$$B \rightarrow A$$
 21  $\rightarrow B$  not  $B \rightarrow A$  LSR  $A \rightarrow A$ 

$$B + A -> A$$
  $B \times -42 -> A$   $A \times -24 -> A$   $B - A -> A;$ 

#### Explications:

- la destination (à droite de la flèche) peut être A ou B.
- Pour les instructions à un opérande, celui ci peut être A, B, not A, not B, ou une constante signée de 8 bits. L'instruction peut être NOT (bit à bit), ou LSR (*logical shift right*). Remarque : le *shift left* se fait par A+A->A.
- Pour les instructions à deux opérandes, le premier opérande peut être A ou B, le second opérande peut être A ou une constante signée de 8 bits. L'opération peut être +, -, and, or, xor.

#### **Instructions de lecture ou écriture mémoire** parmi les 8 suivantes :

$$A \rightarrow *A$$
  $B \rightarrow *A$   $A \rightarrow *cst$   $B \rightarrow *cst$ 

La notation \*X désigne le contenu de la case mémoire d'adresse X (comme en C).

Comprenez bien la différence : A désigne le contenu du registre A, alors que \*A désigne le contenu de la case mémoire dont l'adresse est contenue dans le registre A.

#### **Sauts absolus inconditionnels** par exemple :

JA 42 qui met le PC à la valeur 42

JA 1b1 saute à l'adresse du *label* 1b1 (un label peut être mis au début de chaque ligne, avant l'instruction assembleur de cette ligne).

#### Sauts relatifs conditionnels par exemple JR −12 qui enlève 12 au PC

Cette instruction ajoute au PC un offset qui est une constante signée sur 5 bits (entre -16 et +15). Précisément, l'offset est relatif à l'adresse de l'instruction JR elle-même. Par exemple,

JR 0 est une boucle infinie, et JR 1 est un NOP (*no operation* : on passe à l'instruction suivante sans avoir rien fait).

La condition porte sur trois drapeaux (Z,C,N). Ces drapeaux sont mis à jour par les instructions arithmétiques et logiques.

- Z vaut 1 si l'instruction a retourné un résultat nul, et zéro sinon.
- C recoit la retenue sortant de la dernière addition/soustraction, ou le bit perdu lors d'un décalage.
- N retient le bit de signe du résultat d'une opération arithmétique ou logique.

#### **Comparaison arithmétique** par exemple B-A? ou A-42?

Cette instruction est en fait identique à la soustraction, mais ne stocke pas son résultat : elle se contente de positionner les drapeaux.

## 1 Encodage du jeu d'instruction

Les instructions sont toutes encodées en un octet comme indiqué par la table 1. Pour celles qui impliquent une constante (de 8 bits), cette constante occupe la case mémoire suivant celle de l'instruction. Les instructions micromachine peuvent donc avoir une longueur de un octet ou deux octets La table 2 décrit la signification des différentes notations utilisées.

TABLE 1 – Encodage du mot d'instruction

| bit                       | 7 | 6                         | 5 | 4         | 3      | 2     | 1     | 0 |
|---------------------------|---|---------------------------|---|-----------|--------|-------|-------|---|
| instruction autres que JR | 0 | codeop, voir table 3      |   |           | arg2S  | arg1S | destS |   |
| saut relatif conditionnel | 1 | cond, voir table 4 offset |   | signé sui | 5 bits |       |       |   |

TABLE 2 – Signification des différents raccourcis utilisés

| Notation | encodé par     | valeurs possibles                        |
|----------|----------------|------------------------------------------|
| dest     | destS=instr[0] | A si destS=0, B si destS=1               |
| arg1     | arg1S=instr[1] | A si arg1S=0, B si arg1S=1               |
| arg2     | arg2S=instr[2] | A si arg2S=0, constante 8-bit si arg2S=1 |
| offset   | instr[4 :0]    | offset signé sur 5 bits                  |

TABLE 3 – Encodage des différentes opérations possibles

| codeop | mnémonique            | remarques                                             |
|--------|-----------------------|-------------------------------------------------------|
| 0000   | arg1 + arg2 -> dest   | addition; shift left par A+A->A                       |
| 0001   | arg1 - arg2 -> dest   | soustraction; 0 -> A par A-A->A                       |
| 0010   | arg1 and arg2 -> dest |                                                       |
| 0011   | arg1 or arg2 -> dest  |                                                       |
| 0100   | arg1 xor arg2 -> dest |                                                       |
| 0101   | LSR arg1 -> dest      | logical shift right; bit sorti dans C; arg2 inutilisé |
| 0110   | arg1 - arg2 ?         | comparaison arithmétique; destS inutilisé             |
| 1000   | (not) arg1 -> dest    | not si arg2S=1, sinon simple copie                    |
| 1001   | arg2 -> dest          | arg1 inutilisé                                        |
| 1101   | *arg2 -> dest         | lecture mémoire; arg1S inutilisé                      |
| 1110   | arg1 -> *arg2         | écriture mémoire ; destS inutilisé                    |
| 1111   | JA cst                | saut absolu; destS, arg1S et arg2S inutilisés         |

Remarque: les codeop 0111, 1010, 1011, et 1100 sont inutilisés (réservés pour une extension future...).

QUESTION 1  $_{B+A}$  → Verifiez que vous comprennez les tables 3 et 2, quelle est l'encodage de l'instruction

TABLE 4 – Encodage des conditions du saut relatif conditionnel

| cond       | 00         | 01      | 10       | 11         |
|------------|------------|---------|----------|------------|
| mnémonique |            | IFZ     | IFC      | IFN        |
|            | (toujours) | si zéro | si carry | si négatif |

## 2 Lisons un peu d'assembleur

Que font les programmes suivants?

Trois petits programmes d'échauffement à gauche, un gros programme à droite (init, bcl et fini sont des labels permettant de faire un saut absolu à ces instructions).



Validez avec un enseignant.

#### 3 Assemblons et désassemblons

La section 1 précise le codage de chaque instruction sous forme binaire.

#### 3.1 Assemblage

Pour chacun de nos programmes d'échauffement, écrivez à droite de chaque instruction son code hexadécimal. Par exemple, on lit dans les tableaux de la section 1 que le code de 21->A est composé des deux octets : 01001100 (0x4C) suivi de la constante 21 (0x15). N'hésitez pas à commencer par l'écrire en binaire.

| Code ass | sembleur                                                            | binaire | hexadécima |
|----------|---------------------------------------------------------------------|---------|------------|
| progl:   | 21 -> A<br>42 -> B<br>B+A -> B                                      |         |            |
| prog2:   | *21 -> A<br>*42 -> B<br>B+A -> B<br>B -> *43                        |         |            |
| prog3:   | *100 -> A<br>*101 -> B<br>B-A ?<br>JR +2 IFN<br>B -> A<br>A -> *102 |         |            |

#### **Validez avec un enseignant.**

(Ce travail stupide et dégradant s'appelle l'assemblage (assembly), et vous avez déjà envie d'écrire un programme qui le fait pour vous. Un tel programme s'appelle un assembleur.)

#### 3.2 Désassemblage

Quel est le programme qui a pour codes hexadécimaux 4C, 6D, 4D, 80, 32, E2, 42, 80?

Quel est le programme qui a pour codes hexadécimaux 6D, 4D, 80, 32, E2, 42, 80? Concluez-en qu'il ne faut pas se tromper dans ses calculs d'offset quand on fait un saut.

#### **Validez avec un enseignant.**

(Ce travail rébarbatif et vexatoire s'appelle le désassemblage (*disassembly*), et le programme correspondant s'appelle un désassembleur – c'est le –d de objdump –d.)

## 4 Datapath et Automate de notre micro-machine

Interessons nous maintenant à la machine qui va exécuter cet assembleur. Nous présentons Ici le *datapath* de la micro-machine (Fig. 1). Pour l'instant on ne peut pas comprendre complètement ce *datapath* mais on peut en comprendre certaines parties.

QUESTION 2 ► Repérez sur cette figure : les registre A et B utilisés dans l'assembleur. Le compteur de programme ainsi que le registre d'instruction.

QUESTION 3 ► les signaux bleus sont ceux provenant de l'automate de contrôle (i.e. le décodeur d'instruction). l'acronyme "ce" signifie *clock enable*, ce sont des signaux qui vont activer ou désactiver le chargement de certains registres. Repérez par exemple, le signal qui vont autoriser le chargement d'une nouvelle instruction dans le registre d'instruction, ainsi que celui qui va autoriser la modification du compteur de programme

QUESTION 4 ► Les signaux sur la droite vont faire l'interface avec la mémoire : MA (Memory Data Address), MDO (Memory Data Out), MDI (Memory Data IN), ceI (Clock Enable Memory). Dans quels registres peuvent arriver les données venant de la mémoire. Et que contiennent ces données qui viennent de la mémoire?

Etudions maintenant un peu plus en détail l'architecture de l'unité de calcul de la micro-machine de la Fig. 1.

L'automate de contrôle (correspondant à la boite *Control Unit* sur la Fig. 1) est représenté en Fig. 2. On voit que cet automate comprend 6 états nommés InstrFetch, InstrDecode (correspondant aux notion de *Fetch* et *Decode* vues en cours), regWrite (correspondant au *Write Back*), incrPc (qui permet d'incrémenter PC pour lire une constante), cstFetch (qui charge une constante) et DoJA (qui executera l'instruction de saut absolu JA).



FIGURE 1 – Le datapath de la micro-machine.



FIGURE 2 – Automate de la version initiale de notre micro-machine Digital.

QUESTION 5 ► On comprend, en regardant cet automate, qu'il y a deux cycles possibles : l'un des cycle comporte trois états (donc trois cycles), l'autre en comporte 5 (donc 5 cycles). Comprenez vous dans quels cas on va utiliser trois états ou 5 états dans l'automate?

## 5 Lancement de la micromachine avec digital

Téléchargez sur Moodle le processeur VonNeuman (fichier nommé MM-Minimal.tar). Extrayez l'archive, cela crée un répertoire MM-Minimal. Descendez dans ce repertoire est ouvrez avec digital le fichier mm-minimale.dig

Le circuit comporte 3 parties :

- **MM Control Unit** : L'unité de contrôle ou décodeur d'instruction, qui implémente l'automate représenté en Fig 2 (et qui est aussi représenté par le bloc Control Unit sur la Fig. 1).
- MM DataPath : le chemin de donné, représenté en Fig. 1.
- Console : un module qui nous permet de surveiller l'évolution de la machine, grâce aux afficheurs sept segments branchés sur plusieure registres : MA (addresse mémoire), MDO (Donnée envoyée à la mémoire), MDI (donnée reçue de la mémoire), PC, RegIR et RegCst déjà vu en fin de dernier TD. On y voit aussi l'état courant de l'automate ainsi qu'un compteur du nombre de cycles effectués.
- RAM : pour faire les accès mémoire.

QUESTION 6 ► Faites le lien entre le fichier mm-minimale.dig et les figures 1 et 2. En particulier, vous prendrez soin de repérer l'ALU, l'automate de contrôle, les registres A, B, PC et Reg Cst.

QUESTION 7 ▶ quels sont les registres utilisés pour stocker l'état de l'automate, combien de registre pour combien d'état?

## 6 Execution d'un programme simple

La version de la micro-machine présent ici est capable d'interpréter les instructions suivantes :

- Instructions logiques et arithmétiques, y compris en 2 octets;
- Sauts absolus.

On rappelle le codage de certaines de ces instructions :

| Code assembleur | binaire             | hexadécimal |
|-----------------|---------------------|-------------|
| 21 -> A         | 0100 11x0 0001 0101 | 4C 15       |
| 42 -> B         | 0100 11x1 0010 1010 | 4D 2A       |
| B+A -> B        | 0000 0011           | 03          |
| JA 0x05         | 0111 1000 0000 0101 | 78 05       |

QUESTION 8 ► Visualisez d'abord le programme stocké dans la mémoire, pouvez vous le décoder? QUESTION 9 ► Pour l'exécuter sur la micro-machine, lancez la simulation du circuit sous Digital.

Dans la partie "Console", pour initialiser les registres, cliquez sur "Init", puis deux fois sur "CLK" puis à nouveau sur "Init" (Init doit être dans l'état 0, rouge, pour que le processeur avance.

Puis exécuter votre programme en faisant avancer l'horloge principale (à la souris en cliquant sur la "Clock Input" de la partie "Console", ou au clavier en tapant 'c'). Suivez le comportement de votre programme dans le processeur.

- Surveillez le registre RegPC pour voir l'avancement du compteur de programme
- Surveillez le registre RegIR pour voir le instructions décodées.
- Surveillez de registre RegCst pour voir les constantes utilisées.
- Suivez les transitions d'état sur le dessin de la figure 2.
- Que fait le programme au bout d'un moment?

<u>QUESTION 10</u> ► On rappelle ci-dessous le codage des instructions, repérez ou est faite la décomposition de l'instruction en ces différents champs. Ou est utilisé le champ codeop par exemple?

| bit                       | 7 | 6      | 5 | 4      | 3        | 2      | 1     | 0 |
|---------------------------|---|--------|---|--------|----------|--------|-------|---|
| instruction autres que JR | 0 | codeop |   |        | arg2S    | arg1S  | destS |   |
| saut relatif conditionnel | 1 | cond   |   | offset | signé su | 5 bits |       |   |

QUESTION 11 ► Repérez la partie du datapath qui incrémente PC. Dans quels états incrémentent-on le PC? Quand est ce qu'on incrémente le PC de autre chose que 1?

## 7 Construction par étapes de l'automate

L'automate actuel est capable de reconaître le codeop de toutes les instruction, mais les actions à effectuer ne sont pas toutes implémentées.

Nous allons progressivement augmenter l'automate pour ajouter l'implémentation des instructions manquantes. Pour cela, sauvegardez la micro-machine sous un autre nom (par exemple MM-Minimallogin.dig) et modifiez incrémentalement la machine en suivant les instructions qui vous sont données dans le sujet.

Nous allons d'abord ajouter l'opération de comparaison. Pour cela nous avons besoin d'activer les drapeaux (rappel, il y a trois drapeaux de 1 bit :  $\mathbb{N}$  : Negative,  $\mathbb{C}$  : Carry et  $\mathbb{Z}$  : Zero).

#### 7.1 Version 1 : Mise à jour des drapeaux et instruction de comparaison arithmétique

Pour l'instant, à chaque opération de l'ALU, votre processeur écrit le résultat dans un registre. Il produit les drapeaux Z, C et N mais ne les stocke pas. (Ces drapeaux sont nécessaires à l'exécution des branchements conditionnels que nous ajouterons dans la suite).

Dans cette partie, vous allez ajouter la mise à jour de ces drapeaux, ainsi que le nécessaire à l'exécution de l'instruction de comparaison arithmétique.

QUESTION 12 ► Allez voir l'unité arithmétique et logique, essayer de comprendre rapidement le design. Identifiez par exemple dans quelles opération le drapeau C (Carry) peut être mis à 1. Combien de bit le port Flags comporte-t'il

#### Sauvegarde des flags

Vous procéderez en deux étapes :

- Ajoutez, dans le datapath, un registre, nommé Flags, permettant de stocker les flags Z, C et N en sortie de l'ALU. (on utilisera un registre de 8 bits avec un splitter). Vous utiliserez le registre Reg8 présent dans le menu Components → custom. Pour que le registre apparaisse comme les autres, il faut lui mettre l'apparence "layout".
- ajoutez dans l'état regWrite la mise à jour du signal d'écriture (i.e. *enable*) du le registre Flags (ceFlags).

QUESTION 13  $\blacktriangleright$  Re-exécuter votre programme et vérifiez que le registre Flags est bien mis à jour. Modifiez le programme pour qu'il manipule des valeurs permettant de vérifiez que la valeur des flags est bien mise à jour correctement. Par exemple, vous choisirez de charger deux valeurs opposées dans A et B pour constater que leur somme fait bien passer le flag Z à 1. Ou vous choisirez des valeurs de façon à provoquer une retenue sortante (flag C à 1).

#### Comparaison arithmétique

Pour rappel, l'opcode, le mnémonique et le comportement de cette instruction sont rappelés dans la table 5. En particulier, vous constaterez (ou vous rappellerez) que **le seul effet de cette instruction est de mettre à jour les drapeaux Z, C et N**. Du point de vue de l'automate, l'ajout de cette instruction nécessite l'ajout d'un seul état nommé "noRegWrite". Les modifications à apporter à l'automate de contrôle sont visibles sur la version de la figure 3.

| codeop | mnémonique   | remarques                                       |
|--------|--------------|-------------------------------------------------|
| 0110   | arg1 - arg2? | Produit le résultat de arg1-arg2 sur la sortie  |
|        |              | mais ce ne sera pas enregistré dans un registre |

TABLE 5 – Rappel : descriptif de l'instruction de comparaison arithmétique

Ajoutez maintenant cet état à la partie "Control Unit" de votre micro-machine, en augmentant les parties "Transition Function" et "Output Function". Il faut penser à :

- à bien regarder la figure 3 pour comprendre ce qui va déclencher le passage dans l'état no RegWrite
- à ce que la machine à état passe dans l'état no RegWrite quand on a une comparaison
- que cet état mette à 1 le signal ceFlag
- que l'automate retourne dans l'état InstrFetch après l'état noRegWrite
- et à un autre truc encore que l'on vous laisse deviner.

**Test** Dans votre programme ajoutez une instruction de comparaison (vous trouverez le code hexadécimal de l'instruction dans le TD précédent), et testez le programme à nouveau. vérifiez bien que le contrôle de flôt revient à un mode normal après l'exécution de votre instruction et que le résultat de la comparaison est visible sur le registre des drapeaux.

## 8 Pour ceux qui ont finis : autres instructions

#### 8.1 Version 2: Le saut relatif inconditionnel

On vous demande d'ajouter la prise en charge du saut relatif. Dans un premier temps, on vous demande de ne pas implémenter le test qui permet de savoir si oui ou non le branchement doit être effectué. On parle dans ce cas de saut relatif inconditionnel. L'automate correspondant est donné à la figure 4.



FIGURE 3 – Le cycle de Von Neumann avec mise à jour des drapeaux et instruction de comparaison

#### 8.2 Version 3: Les sauts relatifs conditionnels

Afin de pouvoir exécuter des sauts conditionnels, on doit regarder la valeur des drapeaux (flags) qui permettent de décider si il faut faire le saut ou non. La figure 5 décrit l'automate attendu.

**Test** Implémentez maintenant dans un fichier prog2.hex le programme de la figure 6. Chargez leur en mémoire. Testez votre micro-machine.



FIGURE 4 – Le cycle de Von Neumann avec sauts relatifs inconditionnels



FIGURE 5 – Le cycle de Von Neumann avec sauts relatifs conditionnels

FIGURE 6 – Un programme utilisant le test et les branchements relatifs conditionnels (et inconditionnels).