Ergonomie du web
  Intro | Particularités | Méthode | Outils | Plan du site | Recherche | Questions et commentaires 
  Dans cette section:   Choix | Classement de cartes | Évaluation | Critères | Test | Liens utiles |  


Haut de page
Test d'utilisabilité

Le test d'utilisabilité permet de mesurer avec une précision appréciable, les problèmes ergonomiques d'un site ou d'un logiciel. On distingue deux types de tests d'utilisabilité. D'abord les tests scénarisés, puis les tests exploratoires.

Les premiers, plus efficaces, peuvent s'effectuer plus tôt dans le développement. Les deuxièmes, moins complets, ont tout de même le mérite de fournir des informations à très faible coût.

"Apple, in its User-Centered Design course, goes so far as to say that you can follow every guideline in Human Interface Guidelines: The Apple Desktop Interface, and still have an unusable interface. Apple's human factors experts say that their guidelines are called just that--guidelines--because it would be impossible for them to anticipate every situation that any developer might encounter. They go one step further, and say that every good user interface violates at least one of the guidelines. To prove their point, they show how one user interface feature can follow and break the same guideline, and how another function can be implemented following different guidelines depending on the context. What advice do they offer? Test early, and test often."
Source: Prototyping in the software development cycle.

Combien d'utilisateurs?

Règle générale, à peu près cinq à dix participants (ou groupe de deux participants travaillant en équipe), par type de public cible, à un test d'utilisabilité scénarisé permettent d'identifier un nombre appréciable de problèmes ergonomiques. Notre expérience avec plusieurs centaines de tests supportent cette affirmation, mais des exceptions existent.

D'ailleurs, les chercheurs ne s'entendent pas sur le nombre idéal d'utilisateurs qui permettraient d'identifier tous les problèmes ergonomiques (si celà est possible...). Christine Perfetti et Lori Landesman, dans un article intitulé "Eight Is Not Enough (for Usability Testing)", émettaient en 2003 l'hypothèse intéressante que les sites commerciaux présentent un plus grand nombre d'activités possibles qu'un logiciel type, et qu'en ce sens un plus grand nombre d'utilisateurs sont requis pour tester un site comparativement au logiciel en général.

Retenons qu'en tenant compte des contraintes économiques et temporelles d'à peu près tous les projets web aujourd'hui (il en va de même, malheureusement, pour à peu près tous les produits interactifs), la tenue de quelques tests, plus petits, est possible, tandis qu'un test systématique, avec un nombre statistiquement valable d'utilisateurs, serait trop complexe, trop long et trop coûteux. Perfetti et Landesman proposent d'ailleurs une stratégie de tests en continue dans le cadre de laquelle un ou deux utilisateurs sont rencontrés chaque semaine.

De plus, il ne faut pas oublier les objectifs même des tests, qui servent d'abord à identifier les problèmes critiques, non à définir des normes et des lois statistiques. En ce sens, une série de petits tests, les uns après les autres en tenant comptes des itérations apportées au site en développement, permettent ultimement d'identifier tous les problèmes devant nécessairement être corrigés. On testera tant que le produit ne sera pas satisfaisant, ou tant que le budget et l'échéancier le permettront.

Le test d'utilisabilité scénarisé

Des utilisateurs doivent effectuer une ou des tâche(s) spécifique(s) sur, par exemple, une maquette à évaluer, comme trouver une information ou s'inscrire à un événement.

Au préalable, les expérimentateurs auront fixé un seuil de réussite pour chaque activité. La définition d'un seuil de réussite est un facteur critique à la valeur d'un pareil test. Si les seuils ne sont pas réalistes ou trop accessibles, les résultats seront biaisés et pourront induire en erreur toute l'équipe de développement. Règle générale, si une majorité d’utilisateurs invités à un test échoue à une tâche donnée, les analystes tenteront d’identifier les éléments d’utilisabilité ayant entraîné les erreurs, puis tenteront d’y remédier.

Normalement, plusieurs activités sont prévues pour un même test. Néanmoins, les professionnels s'entendent pour ne pas dépasser une durée de 60 à 90 minutes par test, durée après laquelle les participants perdent leur concentration. Inversement, il est aussi possible de réaliser des tests de très courte durée, avec seulement une ou deux activités, lorsque les échéanciers sont serrés ou que le système à évaluer est bien délimité, succinct.

Le test d'utilisabilité exploratoire

Pour ce test, des utilisateurs sont invités à utiliser librement le site à évaluer. Les problèmes d'utilisabilité rencontrés sont notés afin d'être corrigés. Ce test peut s'effectuer très rapidement, mais il faut faire attention au choix des participants. Un voisin de bureau peut fournir des informations dans sa façon d'utiliser le site, mais il ne constitue pas nécessairement un échantillon représentatif de la réelle communauté des utilisateurs du site. Ces activités sont encore plus intéressantes lorsqu'elles sont menées dans un environement naturel pour les utilisateurs, i.e. en dehors du laboratoire d'utilisabilité.


Suite