# ARC TD6

QTRVSIM : un simulateur de l'architecture RISC-V (4h séance sur machine), 23 juin 2025

#### Mise en place

Nous allons utiliser le simulateur QtRVSim (https://github.com/cvut/qtrvsim) développé par l'Université de Prague à des fins pédagogiques pour comprendre le principe de fonctionnement des machines RISC ainsi que le pipeline des instructions dans un processeur RISC.

QtRVSim est un simulateur du jeu d'instruction du RISC-V (*instruction set simulator* : ISS). Nous nous contenterons de la version la plus simple du jeu d'instruction : RV32I (instructions riscv 32 bit en entier, c'est à dire sans multiplieur cablé). La description du jeu d'instruction du RISC-V est disponible en fin de ce sujet de TD ou, de manière complète, sur la page de l'organisation en charge du RISC-V (https://riscv.org/).

QtRVSim est installé sur les machines du département (commande qtrvsim\_gui), vous pouvez l'installer sur votre machine (instructions sur le README du github : https://github.com/cvut/qtrvsim), ou vous pouvez simplement l'utiliser dans un navigateur avec la version compilée pour WebAssembly :

https://comparch.edu.cvut.cz/qtrvsim/app/.

Une publication décrivant brièvement le simulateur est disponible ici : https://comparch.edu.cvut.cz/publications/ewC2022-Dupak-Pisa-Stepanovsky-QtRvSim.pdf

#### 2 Lancement de QtRVSim

Télécharger les exemples assembleur disponibles dans l'archive qtrvsim-files.tar sur Moodle. Nous allons commencer avec l'exemple intégré à QtRVSim qui modélise l'écriture sur le port série de la chaîne "Hello world".

1. Lancer QtRVSim, soit en utilisant la commande qtrvsim\_gui dans un shell, soit dans un navigateur web (https://comparch.edu.cvut.cz/qtrvsim/app/), laissez cochée la case "No pipeline no cache" et cliquer sur Example.

vous devez voir quelque chose qui ressemble à ce qui montré en Figure 1, nous simulerons un RISC-V sans pipeline des instructions (i.e. 1 cycle par instruction) sur le programme donné dans l'onglet template. S. Si vous ne voyez pas l'architecture du processeur comme sur la figure 1, il est dans l'onglet "Core".

En haut de l'interface vous voyez l'état des 32 registres avec leurs deux noms (les 32 registres du RISC-V sont rappelés en fin de sujet de TP, page 8, notez qu'en activant l'options Machine  $\rightarrow$  Mnemonics registers, vous pouvez voir les noms de registre de l'ABI et plutôt que les noms x1, x2, ...).

Sur la gauche vous voyez les instructions assembleur avec leur adresse en mémoire . Sur la droite en bas vous voyez l'état de la mémoire que vous pouvez explorer en entrant une adresse mémoire dans la case tout en bas à droite.

2. La première instruction à exécuter (dans le programme chargé en mémoire, colonne de gauche) est : lui x10, 0xffffc, que fait-elle? quelle est l'instruction correspondante dans le programme template. S de la Fig. 2

(l'instruction lui est expliquée en annexe page 9 du sujet de TP).



FIGURE 1 – Capture d'écran de l'interface de QtRVSim au démarrage

- 3. Cliquez **une fois** sur le bouton "step": L'instruction lui x10 0xffffc est maintenant grisée sur la gauche, c'est qu'elle vient d'être exécutée. Repérez sur la schématique du processeur (i.e. onglet "core"), la valeur du *program counter* PC. Repérez, toujours sur la schématique, la valeur en hexadécimal du registre d'instruction. Repérez la nouvelle valeur du registre x10. Quelle est la valeur du stack pointer SP?
- 4. Cliquez répétitivement sur le "step": Wous voyez les instructions successives s'exécuter dans l'architecture RISC-V et vous voyez dans la fenêtre "Terminal" en haut à droit, s'afficher petit à petit "Hello world". Nous allons comprendre ce programme dans la question suivante.

## 3 Compréhension du programme template. S

- Cliquer sur File → reload simulation et cliquer sur l'onglet template. S dans la fenêtre centrale. Le programme template. S commenté est montré en Fig. 2. Ce programme émule l'écriture d'une chaîne de caractères, caractère par caractère, sur un port série (qui est modélisé par le terminal en haut a droite de l'interface GUI de QtRVSim).
  - Il y a d'abord la définition d'un certain nombre de macros. par exemple celle-ci :
  - .equ SERIAL\_PORT\_BASE, 0xffffc000
  - qui définit l'adresse du port série comme étant <code>0xffffc000</code>. Cela signifie que si l'on écrit un caractère à l'addresse <code>0xffffc000</code>, ce caractère sera envoyé dans le terminal (il ne s'agit pas d'une caractéristique du processeur RISC-V mais plutôt de la carte mère sur laquelle va être soudée la puce du processeur RISC-V).
- 2. Repérez, sur le programme template. S dans QtRVSim, les sections de code (.text) et de données (.data), les directives .org indiquent à quelles adresses vont être chargées ces sections en mémoire. À quelle adresse commence le code? À quelle adresse sont rangée les données? Notamment la chaîne de caractère "Hello world". Allez explorer la mémoire pour retrouver ces données.
- 3. Sachant que le code ASCII de '1' est 0x6C, celui de 'e' est 0x65 et celui de 'H' est 0x48, comprenez-vous le contenu de la case 0x410?
- 4. Lisez le programme de template. S, comparez avec les instructions dans la mémoire pour voir la correspondance et comprenez les étapes :

```
start:
loop:
   li a0, SERIAL_PORT_BASE
                                   // load base address of serial port
                                  // load address of text
   la a1, text_1
next_char:
   lb t1, 0(a1)
                                   // load one byte after another
   beq t1, zero, end_char
                                   // is this the terminal zero byte
                                   // move pointer to next text byte
   addi a1, a1, 1
tx_busy:
   lw t0, SERP_TX_ST_REG_o(a0)  // read status of transmitter
   andi t0, t0, SERP_TX_ST_REG_READY_m // mask ready bit
   jal zero, next_char
                                  // unconditional branch to process next byte
end_char:
   ebreak // stop continuous execution, request developer interaction
   jal zero, end_char
.org 0x400
.data
data_1: .word 1, 2, 3, 4 // example how to fill data words
text_1: .asciz
              "Hello world.\n"
                               // store zero terminated ASCII text
```

FIGURE 2 – Exemple template. S de QtRVSim commenté. Les macros en majuscule sont définies au début du fichier (voir dans QtRVSim). Les registres du RISC-V sont détaillés en page 8

- (a) chargement de l'adresse du port série dans a0 (on a vu que cette instruction est transformée en lui).
- (b) chargement de l'adresse de la chaîne de caractère "Hello world" dans al, cela est fait en utilisant l'instruction auipc (*Add Upper Imm to PC*), le PC valant 0x208=520, on a bien 520+520=1040 (sachant que 1040 = 0x410 =l'emplacement des données du programme : .data).
- (c) chargement du caractère pointé par a1 dans t1 (rappelez vous que 1b ne charge qu'un octet).
- (d) Si le caractère chargé dans t1 est 0 on sort du programme par le label end\_char.
- (e) Sinon on incrémente a1 de 1 (a1 pointe alors sur le prochain caractère).
- (f) les trois instructions suivant le label tx\_busy sont là pour vérifier que le port série est disponible en réception, vous n'êtes pas censé les comprendre.
- (g) on écrit le caractère sur le port série (instruction sw t1, SERP\_TX\_DATA\_REG\_o (a0))
- (h) on reboucle en branchant à l'étape (c) ci-dessus.
- 5. Suivez l'exécution pas à pas du programme à nouveau, et vérifiez l'affichage du caractère à chaque étape (g) ci-dessus.

## 4 version pipelinée du RISC-V

QtRVSim propose une simulation de la version pipelinée du RISC-V que nous avons vu en cours. pour cela il suffit de faire une nouvelle simulation en cliquant sur file -> new simulation, de sélectionner le champs "Pipeline with hazard unit and cache" et de cliquer sur "Example".

La nouvelle version de l'architecture pipelinée, ressemble à celle présentée en figure 3. Les grandes barres verticales sont les registres séparant les étapes du cycle de Von Neuman, on voit clairement les 5 étapes de pipeline. Lors de la simulation, à chaque step, vous verrez les chemins sélectionnés s'activer en gras dans l'architecture pour suivre le *datapath*.



FIGURE 3 – Capture d'écran de l'interface de QtRVSim avec pipeline des instructions

- 1. Cliquer successivement pour "Step" vous voyez physiquement quelle instructions sont dans les zone *Instruction Fetch* (IF), *Instruction Decode* (ID), *Execute* (Ex), *Memory* (Mem), *Write back* (WB).
- 2. Comprenez vous ce qu'il se passe lors de l'insertion du nop à l'éxécution de l'instruction addi a1, a1, 1?
- 3. Observez ce qu'il se passe lorsqu'on arrive à l'instruction ebreak, pouvez vous comprendre ce qu'il se passe?

## 5 Utilisation de la pile : une simple boucle while

Cette section étudie l'exécution de ce programme C simple :

```
int main()
{
  int x = 10;
  while (x != 0)
    x = x-1;
  return x;
}
```

Le code assembleur pour ce programme est affiché en Figure 4. Ce code a été généré par le compilateur pour RISC-V avec l'options -O0, voir l'encadré ci-dessous.

```
#pragma qtrvsim show terminal
#pragma qtrvsim show registers
#pragma qtrvsim show memory
.globl _start
.globl __start
.org 0x00000200
.text
start:
_start:
           sp,sp,-32  # reserve 32 bytes in stack
s0,24(sp)  # Store s0 in stack (s0 used
    sd
          s0,24(sp)
                          # Store s0 in stack (s0 used by function)
    addi
           s0,sp,32
                        # s0 <- fp (frame pointer)
                          # a5 <- 10
    li
          a5,10
    SW
         a5,-20(s0)
                          # Store a5 in stack
    j
        L2
L3:
    lw
         a5,-20(s0)
                          # get a5 from stack
                         # a5 <- a5 - 1
    addi
           a5,a5,-1
          a5,-20(s0)
                          # store a5 in stack
    SW
L2:
    lw
          a5, -20(s0)
                          # get a5 from stack
    sext.w a5,a5
                        # sign extension (32 -> 64 bits)
           a5,zero,L3
                          # branch L3 is a5 != 0
    bne
    lw
          a5,-20(s0)
                          # get a5 from stack again (here a5 = 0)
          a0,a5
                          # a0 <- a5 (result of main)</pre>
    mv
    ld
          s0,24(sp)
                          # restore s0
                        # restore sp
    addi
           sp,sp,32
    jr
          ra
                          # return from main
#pragma qtrvsim tab core
```

 $FIGURE\ 4-Simple\ \verb|while| loop\ Risc-V assembly\ code\ generated\ from\ C-code\ (options\ -O0)$ 

#### Générer du code pour QtRVSim

Générer du code assembleur avec le compilateur gcc se fait simplement avec l'option –S. Mais pour générer du code pour RISC-V, il faut un *cross-compilateur*, c'est à dire un compilateur qui s'exécute sur une machine Intel mais qui génére du code RISC-V. Cette chaîne de compilation est disponible pour linux, par exemple ici https://github.com/riscv-collab/riscv-gnu-toolchain ou plus simplement avec le paquet gcc-riscv64-linux-gnu sur Ubuntu (gcc-riscv64-linux-gnu est installé sur les machines du département).

Une fois le compilateur installé, il suffit de compiler le programme avec la commande suivante :

```
riscv64-linux-gnu-gcc -S whileLoop.c -o whileLoop.S
```

Si l'on fait ça, le code généré pour la fonction main est le suivant :

main:

```
li a0,0 ret
```

En effet le compilateur riscv64-linux-gnu-gcc a optimisé le code (optimisation -O2 par défaut) et il a été capable de se rendre compte qu'à la fin de la boucle, x vaudrait 0, donc il a remplacé tout le programme par un simple return 0. C'est une bonne illustration de la puissance des optimisations des compilateurs aujourd'hui.

Pour éviter cette optimisation, on peut par exemple forcer à ne pas faire d'optimisation avec l'option -O0 :

```
riscv64-linux-gnu-gcc -S whileLoop.c -o whileLoop.S -O0
```

Le code généré n'est toujours pas directement exécutable par QtRVSim parce qu'un certain nombre de directives mises en place par gcc ne sont pas comprises par QtRVSim, mais il est facile de les remplacer à la main et de garder le code assembleur, c'est ce qui est fait dans la figure 4

- 1. Repassez en mode no pipeline, no cache (File  $\rightarrow$  new simulation  $\rightarrow$  start empty)
- 2. Chargez le programme whileLoopQtRVSim. S dans le simulateur, pour cela:
  - (a) Fermez l'onglet template. S si il est encore ouvert ( $File \rightarrow Close \ source$ )
  - (b) Chargez le programme whileLoopQtRVSim.S en cliquant sur le bouton Open Source:

    . le programme assembleur doit apparaître dans un nouvel onglet au centre.
  - (c) Compiler ce programme avec le bouton compile source and update memory: \(\bigvert \) (n'oubliez pas! sinon il n'est pas pris en compte pas qtrvsim).
  - (d) Lancer l'exécution pas à pas en appuyant sur step
- 3. Que fait l'instruction addi sp, sp, -32?
- 4. A quoi servent les manipulations sur s0 dans les deux première instruction? (rappeler vous le rôle de s0, cf page 8)
- 5. Allez vérifier que la valeur de la variable x du programme C est bien stockée dans la pile (i.e. explorez la mémoire en bas à droite) et qu'elle est décrémentée au cours de l'exécution du programme (hint: SP-20=0xbfffff00 0x14 =0xbffffeec).
- 6. Appuyer sur step jusqu'à ce que la valeur de x en mémoire atteigne 0, comprenez vous les 5 instructions restantes?
- 7. Comprenez vous maintenant le programme de la figure 4 complètement?

## 6 Écrivons de l'assembleur : une fonction simple

Dans cette partie, vous partirez du squelette de ficher assembleur recurs\_skeleton.S

— programmez une fonction simple qui renvoie la valeur i-1 ou i est l'argument de la fonction, appelez la depuis le main. l'argument sera mis dans le registre a5, le résultat sera mis dans le registre a0

Si vous utilisez un registre temporaire (mais ce n'est pas obligé), pensez à le sauvegarder sur la pile avant de l'utiliser et à le restaurer à la fin de la fonction.

#### 7 Ècrivons de l'assembleur : une fonction recursive

Dans cette partie, vous partirez du squelette de ficher assembleur recurs\_skeleton. S, remplacer call dec par call ser

— programmez maintenant la fonction série des entiers :  $ser(n) = \sum_{i=0}^{i=n} i$  de manière récursive : ser(n) = ser(n-1) + n (on ne programme pas la factorielle parce qu'il n'y a pas de multiplieur cablé dans cette version du riscV mais si c'est trop facile, créer une fonction de multiplication entière mul et programmez factorielle!).

Pour cela il faut mettre en place la pile et faire le calcul comme dans la fonction précédente et en plus

A nouveau, l'argument sera mis dans le registre a5, le résultat sera mis dans le registre a0

- 1. partez du squelette de ficher assembleur recurs\_skeleton.S
- 2. réserver 8 octets sur la pile, 4 pour l'argument, 4 pour l'adresse de retour
- 3. stockez l'argument *i* dans la pile
- 4. stockez l'adresse de retour dans la pile
- 5. tester si l'argument est nul
- 6. si il est nul, branchez en 9 si il n'est pas nul calculez i-1 dans le registre a 5
- 7. faite l'appel recursif
- 8. récupérer le résultat a0 et additionnez i avec ce que vous avez sauvegardé dans la pile
- 9. mettre le résultat dans a0
- 10. libérez les 8 octets de la pile.
- 11. retournez de la fonction avec l'instruction ret
- Calculer ser(3) vérifiez le résultat, donner la formule du nombre de cycle pour ser(n). jusqu'à quelle n peux t'on calculer ser(n)

# A Appendix 1: quick reference de l'ISA RISC-V

RISC-V card obtained from James Zhu from Berkeley University.

# Registers

| Register | ABI Name | Description           | Saver  |
|----------|----------|-----------------------|--------|
| x0       | zero     | Zero constant         | _      |
| x1       | ra       | Return address        | Caller |
| x2       | sp       | Stack pointer         | Callee |
| x3       | gp       | Global pointer        | _      |
| x4       | tp       | Thread pointer        | _      |
| x5-x7    | t0-t2    | Temporaries           | Caller |
| x8       | s0 / fp  | Saved / frame pointer | Callee |
| x9       | s1       | Saved register        | Callee |
| x10-x11  | a0-a1    | Fn args/return values | Caller |
| x12-x17  | a2-a7    | Fn args               | Caller |
| x18-x27  | s2-s11   | Saved registers       | Callee |
| x28-x31  | t3-t6    | Temporaries           | Caller |
| f0-7     | ft0-7    | FP temporaries        | Caller |
| f8-9     | fs0-1    | FP saved registers    | Callee |
| f10-11   | fa0-1    | FP args/return values | Caller |
| f12-17   | fa2-7    | FP args               | Caller |
| f18-27   | fs2-11   | FP saved registers    | Callee |
| f28-31   | ft8-11   | FP temporaries        | Caller |

# **RISC-V Instruction Set**

### **Core Instruction Formats**

| 31 27 26 25           | 24 20 | 19 1 | 5 | 14  | 12  | 11   | 7       | 6      | 0    |        |
|-----------------------|-------|------|---|-----|-----|------|---------|--------|------|--------|
| funct7                | rs2   | rs1  |   | fun | ct3 | :    | rd      | opo    | code | R-type |
| imm[11                | :0]   | rs1  |   | fun | ct3 | :    | rd      | opo    | code | I-type |
| imm[11:5]             | rs2   | rs1  |   | fun | ct3 |      | n[4 :0] | opo    | code | S-type |
| imm[12 10:5]          | rs2   | rs1  |   | fun | ct3 | imm[ | 4:1 11] | opo    | code | B-type |
| imm[31:12]            |       |      |   | :   | rd  | opo  | code    | U-type |      |        |
| imm[20 10:1 11 19:12] |       |      |   | rd  | opo | code | J-type  |        |      |        |

## **RV32I Base Integer Instructions**

| Inst   | Name                    | FMT | Usage              | Description (C)              |
|--------|-------------------------|-----|--------------------|------------------------------|
| add    | ADD                     | R   | add rd, rs1, rs2   | rd = rs1 + rs2               |
| sub    | SUB                     | R   | sub rd, rs1, rs2   | rd = rs1 - rs2               |
| xor    | XOR                     | R   | xor rd, rs1, rs2   | rd = rs1 ^ rs2               |
| or     | OR                      | R   | or rd, rs1, rs2    | rd = rs1   rs2               |
| and    | AND                     | R   | and rd, rs1, rs2   | rd = rs1 & rs2               |
| sll    | Shift Left Logical      | R   | sll rd, rs1, rs2   | rd = rs1 << rs2              |
| srl    | Shift Right Logical     | R   | srl rd, rs1, rs2   | rd = rs1 >> rs2              |
| sra    | Shift Right Arith*      | R   | sra rd, rs1, rs2   | rd = rs1 >> rs2              |
| slt    | Set Less Than           | R   | slt rd, rs1, rs2   | rd = (rs1 < rs2)?1:0         |
| sltu   | Set Less Than (U)       | R   | sltu rd, rs1, rs2  | rd = (rs1 < rs2)?1:0         |
| addi   | ADD Immediate           | I   | addi rd, rs1, imm  | rd = rs1 + imm               |
| xori   | XOR Immediate           | I   | xorii rd, rs1, imm | rd = rs1 ^ imm               |
| ori    | OR Immediate            | I   | orii rd, rs1, imm  | rd = rs1   imm               |
| andi   | AND Immediate           | I   | andi rd, rs1, imm  | rd = rs1 & imm               |
| slli   | Shift Left Logical Imm  | I   | slli rd, rs1, imm  | rd = rs1 << imm[0:4]         |
| srli   | Shift Right Logical Imm | I   | srli rd, rs1, imm  | rd = rs1 >> imm[0:4]         |
| srai   | Shift Right Arith Imm   | I   | srai rd, rs1, imm  | rd = rs1 >> imm[0:4]         |
| slti   | Set Less Than Imm       | I   | slti rd, rs1, imm  | rd = (rs1 < imm)?1:0         |
| sltiu  | Set Less Than Imm (U)   | I   | sltiu rd, rs1, imm | rd = (rs1 < imm)?1:0         |
| lb     | Load Byte               | I   | lb rd, imm(rs1)    | rd = M[rs1+imm][0:7]         |
| lh     | Load Half               | I   | lh rd, imm(rs1)    | rd = M[rs1+imm][0:15]        |
| lw     | Load Word               | I   | lw rd, imm(rs1)    | rd = M[rs1+imm][0:31]        |
| lbu    | Load Byte (U)           | I   | lbu rd, imm(rs1)   | rd = M[rs1+imm][0:7]         |
| lhu    | Load Half (U)           | I   | lhu rd, imm(rs1)   | rd = M[rs1+imm][0:15]        |
| sb     | Store Byte              | S   | sb rd, imm(rs1)    | M[rs1+imm][0:7] = rs2[0:7]   |
| sh     | Store Half              | S   | sh rd, imm(rs1)    | M[rs1+imm][0:15] = rs2[0:15] |
| SW     | Store Word              | S   | sw rd, imm(rs1)    | M[rs1+imm][0:31] = rs2[0:31] |
| beq    | Branch ==               | В   | beq rs1, rs2, imm  | if(rs1 == rs2) PC += imm     |
| bne    | Branch!=                | В   | bne rs1, rs2, imm  | if(rs1 != rs2) PC += imm     |
| blt    | Branch <                | В   | blt rs1, rs2, imm  | if(rs1 < rs2) PC += imm      |
| bge    | Branch ≥                | В   | bge rs1, rs2, imm  | if(rs1 >= rs2) PC += imm     |
| bltu   | Branch < (U)            | В   | bltu rs1, rs2, imm | if(rs1 < rs2) PC += imm      |
| bgeu   | Branch $\geq$ (U)       | В   | bgeu rs1, rs2, imm | $if(rs1 \ge rs2)$ PC += imm  |
| jal    | Jump And Link           | J   | jal rd, imm        | rd = PC+4; PC += imm         |
| jalr   | Jump And Link Reg       | I   | jalr rd, rs1, imm  | rd = PC+4; PC = rs1 + imm    |
| lui    | Load Upper Imm          | U   | lui rd, imm        | rd = imm << 12               |
| auipc  | Add Upper Imm to PC     | U   | auioc rd, imm      | rd = PC + (imm << 12)        |
| ecall  | Environment Call        | I   | ecall              | Transfer control to OS       |
| ebreak | Environment Break       | I   | ebreak             | Transfer control to debugger |

# **Pseudo Instructions**

| Pseudoinstruction          | Base Instruction(s)                                                | Meaning                         |
|----------------------------|--------------------------------------------------------------------|---------------------------------|
| la rd, symbol              | <pre>auipc rd, symbol[31:12] addi rd, rd, symbol[11:0]</pre>       | Load address                    |
| l{b h w d} rd, symbol      | <pre>auipc rd, symbol[31:12] l{b h w d} rd, symbol[11:0](rd)</pre> | Load global                     |
| s{b h w d} rd, symbol, rt  | <pre>auipc rt, symbol[31:12] s{b h w d} rd, symbol[11:0](rt)</pre> | Store global                    |
| $fl\{w d\}$ rd, symbol, rt | <pre>auipc rt, symbol[31:12] fl{w d} rd, symbol[11:0](rt)</pre>    | Floating-point load global      |
| fs{w d} rd, symbol, rt     | <pre>auipc rt, symbol[31:12] fs{w d} rd, symbol[11:0](rt)</pre>    | Floating-point store global     |
| nop                        | addi x0, x0, 0                                                     | No operation                    |
| li rd, immediate           | Myriad sequences                                                   | Load immediate                  |
| mv rd, rs                  | addi rd, rs, 0                                                     | Copy register                   |
| not rd, rs                 | xori rd, rs, -1                                                    | One's complement                |
| neg rd, rs                 | sub rd, x0, rs                                                     | Two's complement                |
| negw rd, rs                | subw rd, x0, rs                                                    | Two's complement word           |
| sext.w rd, rs              | addiw rd, rs, 0                                                    | Sign extend word                |
| seqz rd, rs                | sltiu rd, rs, 1                                                    | Set if $=$ zero                 |
| snez rd, rs                | sltu rd, x0, rs                                                    | Set if $\neq$ zero              |
| sltz rd, rs                | slt rd, rs, x0                                                     | Set if < zero                   |
| sgtz rd, rs                | slt rd, x0, rs                                                     | Set if > zero                   |
| fmv.s rd, rs               | fsgnj.s rd, rs, rs                                                 | Copy single-precision register  |
| fabs.s rd, rs              | fsgnjx.s rd, rs, rs                                                | Single-precision absolute value |
| fneg.s rd, rs              | fsgnjn.s rd, rs, rs                                                | Single-precision negate         |
| fmv.d rd, rs               | fsgnj.d rd, rs, rs                                                 | Copy double-precision register  |
| fabs.d rd, rs              | fsgnjx.d rd, rs, rs                                                | Double-precision absolute value |
| fneg.d rd, rs              | fsgnjn.d rd, rs, rs                                                | Double-precision negate         |
| beqz rs, offset            | beq rs, x0, offset                                                 | Branch if $=$ zero              |
| bnez rs, offset            | bne rs, x0, offset                                                 | Branch if $\neq$ zero           |
| blez rs, offset            | bge x0, rs, offset                                                 | Branch if $\leq$ zero           |
| bgez rs, offset            | bge rs, x0, offset                                                 | Branch if $\geq$ zero           |
| bltz rs, offset            | blt rs, x0, offset                                                 | Branch if < zero                |
| bgtz rs, offset            | blt x0, rs, offset                                                 | Branch if > zero                |
| bgt rs, rt, offset         | blt rt, rs, offset                                                 | Branch if >                     |
| ble rs, rt, offset         | bge rt, rs, offset                                                 | Branch if $\leq$                |
| bgtu rs, rt, offset        | bltu rt, rs, offset                                                | Branch if $>$ , unsigned        |
| bleu rs, rt, offset        | bgeu rt, rs, offset                                                | Branch if $\leq$ , unsigned     |
| j offset                   | jal x0, offset                                                     | Jump                            |
| jal offset                 | jal x1, offset                                                     | Jump and link                   |
| jr rs                      | jalr x0, rs, 0                                                     | Jump register                   |
| jalr rs                    | jalr x1, rs, 0                                                     | Jump and link register          |
| ret                        | jalr x0, x1, 0                                                     | Return from subroutine          |
| call offset                | <pre>auipc x1, offset[31:12] jalr x1, x1, offset[11:0]</pre>       | Call far-away subroutine        |
| tail offset                | <pre>auipc x6, offset[31:12] jalr x0, x6, offset[11:0]</pre>       | Tail call far-away subroutine   |
| fence                      | fence iorw, iorw                                                   | Fence on all memory and I/O     |

# B Pour ceux que ça intéresse : analyse de code de Fibonacci (généré par le compilateur)

1. Visualisez le programme fib.c ci dessous, comprenez son exécution. Si vous voulez le compiler et l'exécuter, utilisez la commande suivante :

```
gcc fib.c -o fib
```

Puis exécutez le programme en tapant ./fib

```
#include <stdio.h>
int fib (int i)
{
  if (i<=1) return(1);
  else return(fib(i-1)+fib(i-2));
}
int main (int argc, char *argv[])
{
  fib(2);
}</pre>
```

- 2. Charger la version assembleur dans QtRVSim, c'est le fichier fib-00-QTRVSIM. S (l'appel a printf a été commenté car il ne marche pas dans QtRVSim).
- 3. Comprenez le programme assembleur fib-00-QTRVSIM. S, il a été commenté en Fig. 5. Ce programme a été généré à partir du fichier fig.c (avec les printf commentés) par le cross compilateur riscv64-linux-gnu-gcc avec la commande:

```
riscv64-linux-gnu-gcc -S fib.c -00 -o fib-00-QTRVSIM.S
```

- 4. Chargez et compiler le programme dans QtRVSim. Suivez l'exécution pas à pas en dessinant l'état de la pile, à partir du label fib, en supposant que le register \$a0 contienne la valeur 2, argument transmit à fib, suivez les étapes suivantes :
  - Appuyez sur step jusqu'à l'appel de fib (instruction jalr ra, 20 (t1) à l'adresse 0x228. dessinez la pile (a l'envers, i.e. grandes adresses en bas) à ce moment du programme. A quoi correspond ce jalr? que contient le registre a0?
  - Appuyer sur step pour visualiser les registres sauvegardés dans la pile, quels sont-ils et pourquoi sont-ils sauvegardés? ou est l'instruction de test i<= 1? allez jusqu'à cette instruction et dessinez la pile dans cet état.
  - Appuyer sur step jusqu'à l'instruction d'appel récursif à fib (adresse 0x288), quelle est la valeur de a0 à ce moment là, et que représente cette valeur?
  - Appuyer 4 fois sur step et dessiner le nouvel état de la pile.
  - Appuyez sur step jusqu'à l'instruction de comparaison à 1 (blt), cette fois ci la fonction prend l'autre branche (puisque i<=1) et va simplement retourner 1. Visualisez pas à pas la restauration des registres ra, s0 et s1 quelle va être l'adresse de retour indiqué dans ra? Dessinez le nouvel état de la pile après le retour de l'appel fib(1). ou est le résultat de l'appel fib(1)?
  - Continuer à dérouler le programme pour le deuxième appel récursif (fib (0)), quel est le résultat de l'appel à fib (2) et dans quel registre est-il mis. Dessinez la pile après le retour à la fonction main
- 5. Vérifier sur la figure 6 que vous comprenez bien l'évolution de la pile avec des appel de fonctions.
- 6. Comment peut-on voir l'assembleur x86 pour le programme fib.

```
fib:
        addi
                   sp, sp, -48 #set stack for fib (48 Bytes = 12 words)
                   ra,40(sp)
        SW
                              #store return adress in stack
                   s0,32(sp)
                               #store s0 in stack (callee saved)
        SW
                   s1,24(sp)
                               #store s1 in stack (callee saved)
        addi
                   s0, sp, 48
                               #set frame pointer to old SP
                               #get function argument
                   a5,a0
        mν
                   a5,-36(s0) #store argument (i) in stack
        SW
                   a5,-36(s0) #? it seems that prev. instr. set a5 to 0
        l w
        sext.w
                   a4,a5
                               #a4 <- i
                   a5,1
                               #a5 <- 1
        li
                               \# branch to L1 if i > 1
        bqt
                   a4,a5,L2
        li
                   a5,1
                               # (else branch) set R5 to 1 (result)
        j
                   L3
                               # branch L3
L2:
        lw
                   a5,-36(s0) #get i (argument of fib)
                   a5, a5, -1
                               #compute i-1
        addiw
        sext.w
                   a5,a5
                               #useless ?
        mν
                   a0,a5
                               #set i-1 in argument register (s0)
        call
                   fib
                               #recursive call to fib(i-1)
        mν
                   a5,a0
                               #get result from recursive call fib(i-1)
                   s1,a5
                               #put result in s1
        mν
                   a5,-36(s0) #get i (argument of fib)
        lw
        addiw
                   a5, a5, -2
                               #compute i-2
        sext.w
                   a5,a5
                               #useless ?
                   a0,a5
                               #set i-2 in argument register (s0)
        mν
        call
                   fib
                               \#recursive call to fib(i-2)
        mν
                   a5,a0
                               #get result from recursive call fib(i-2)
        addw
                   a5,s1,a5
                               \#a5 < -fib(i-1) + fib(i-2)
                   a5,a5
                               #useless?
        sext.w
L3:
                   a0, a5
                               #put result (1) in a0
        mν
                               #restore return adresse
                   ra, 40 (sp)
        l w
        l w
                   s0,32(sp)
                               #restore frame pointer
        lw
                   s1,24(sp)
                               #restore s1
        addi
                   sp, sp, 48
                               #remove fib stack
                               #return to caller code
```

FIGURE 5 – Code assembleur RiscV commenté correspondant au programme fib.c (generated from C-code options -O0)



FIGURE 6 – Différents état de la pile lors de l'exécution de l'appel fib (2)