UX Research Intern en banque digitale : trianguler des méthodes pour décider au rythme hebdomadaire chez ING Espagne

J'ai intégré l'unité spécialisée de UX Research d'ING Espagne comme intern et j'ai rejoint un programme qui opérait déjà à cadence hebdomadaire : 5 tests non modérés par semaine, analyse et recommandations au backlog chaque vendredi. Pendant 3 mois, j'ai exécuté ~60 tests d'utilisabilité de l'app Twyp, l'analyse heuristique d'Inversión Naranja et contribué à un card sorting et un tree testing avec 120 participants.

ING Bank España

UX Research Intern

2019 · 3 meses

Madrid, España

Banca digital / Fintech

Le problème

Trois équipes produit, une unité de research, de l'évidence qui ne pouvait pas attendre le trimestre

ING Espagne devait alimenter trois équipes produit en parallèle avec de l’évidence utilisateur actionnable : Twyp (app de paiements et cashback), Inversión Naranja (site commercial de produits d’investissement) et le site commercial principal, qui évaluait une restructuration de la navigation. L’équipe UX Research opérait comme unité de service interne avec une cadence hebdomadaire structurée autour de 5 tests non modérés par semaine sur UserZoom. J’ai intégré ce programme en tant qu’intern et j’ai pris en charge une partie de l’exécution et de l’analyse.

Discovery

Comment le discovery a été mené : ce qui était mien, ce qui appartenait à l'équipe

Le programme combinait quatre méthodes en parallèle. Je marque explicitement ce que j’ai exécuté et où j’ai contribué à l’analyse dans des études plus larges de l’équipe.

Analyse heuristique d’Inversión Naranja (mon exécution). Évaluation experte du site de produits d’investissement : problèmes de naming, hiérarchie visuelle et cohérence dans l’architecture de l’information. Livrable : rapport heuristique avec résultats priorisés.
Card sorting guerrilla d’Inversión Naranja (mon exécution). 5 sessions en présentiel avec des profils internes, cartes physiques. Livrable : rapport de pré-test pour l’étude formelle de l’équipe.
Programme de tests hebdomadaires de Twyp (mon exécution). 4 sprints thématiques sur les flux principaux de l’app. ~60 tests non modérés sur UserZoom. Livrables : 4 rapports de clôture de sprint.
Card sorting formelle, Tree testing et SUS (contribution à l’analyse). Études exécutées par l’équipe avec ma contribution à la collecte et l’analyse des données.

Insight

Valider uniquement avec des profils internes n'est pas un raccourci : c'est un angle mort

Le card sorting guerrilla avec 5 employés de l’unité d’investissement a donné 100% de réussite pour associer les catégories de fonds à leurs descriptions. Lu en isolation, la donnée disait « le système fonctionne ». Quand l’équipe a élargi l’étude à 15 participants incluant des profils sans produits d’investissement, le taux est tombé à 40%.

L’écart n’était pas du bruit statistique. C’était la preuve que le problème de naming n’était pas perceptible de l’intérieur. Ce pré-test guerrilla a construit l’argument qui a justifié l’étude élargie.

Décisions et arbitrages

Trois décisions méthodologiques dans un rôle Intern

01

Analyse heuristique avant les études avec les utilisateurs

L’équipe allait exécuter card sorting et tree testing sur Inversión Naranja. J’ai proposé de faire d’abord l’évaluation experte. L’alternative était de passer directement au research utilisateurs en exploration ouverte. J’ai choisi l’évaluation experte en premier.

Arbitrage : sacrifier une partie de la découverte ouverte en faveur d’une hypothèse initiale. En pratique, l’analyse heuristique a permis de cadrer les questions du card sorting avec des catégories spécifiques à tester plutôt qu’en exploration libre.

02

Card sorting guerrilla avec échantillon interne comme pré-test

Avant le card sorting formel de l’équipe, j’ai proposé une version guerrilla avec 5 employés de l’unité d’investissement et des cartes physiques. L’alternative était d’attendre l’étude formelle avec un échantillon externe. J’ai choisi d’exécuter le guerrilla en premier.

Arbitrage : échantillon biaisé (seulement des internes) avec une valeur de pré-test potentiellement élevée. Ce pré-test a généré l’insight des 100% → 40% qui a changé le cadrage du problème.

03

Opérer dans le modèle hebdomadaire hérité, ne pas le re-concevoir

Le rythme de 5 tests par semaine n’était pas ma décision : c’était comment la banque opérait déjà le research opérationnel. La décision propre, dans ce modèle, était comment structurer le rapport hebdomadaire pour que l’équipe produit puisse agir sans modération supplémentaire — synthèse brève, résultats actionnables, recommandations priorisées.

Processus

De l'évaluation experte au cycle hebdomadaire actionnable

01
Intégration à l'équipe UX Research

Semaines 1–2. Formation aux outils (UserZoom, format des rapports), shadowing de tests existants.

Livrable : intégration opérationnelle au programme de research.
02
Analyse heuristique d'Inversión Naranja

Semaines 2–3. Évaluation experte sur le naming, la hiérarchie visuelle et l’architecture de l’information.

Livrable : rapport heuristique avec résultats priorisés.
03
Card sorting guerrilla d'Inversión Naranja

Semaines 3–4. 5 sessions en présentiel avec des profils internes, cartes physiques.

Livrable : rapport de card sorting (pré-test de l’étude élargie de l’équipe).
04
Programme de tests hebdomadaires de Twyp

Semaines 3–14, en parallèle. 4 sprints thématiques, ~60 tests non modérés, 4 rapports de clôture de sprint.

Livrables : Sprint Envoyer de l’argent, Sprint TC-SMS-PIN, Sprint Remises 1, Sprint Remises 2.
05
Contribution aux études élargies de l'équipe

Semaines 6–12. Support au card sorting avec 15 participants, tree testing avec 120, collecte et analyse du programme SUS.

Livrables (de l’équipe, avec ma contribution) : données de tree testing, analyse SUS continue.
06
Synthèse et passation

Dernières semaines. Consolidation des recommandations au backlog et transfert au UX Lead pour la continuité post-stage.

Résultats et impact

Ce que le research a livré

01

Décision de naming débloquée

La triangulation heuristique (mon exécution) + card sorting guerrilla avec 100% de réussite interne (mon exécution) + card sorting élargi avec 40% sur des profils externes (équipe) a construit l’argument qui a amené l’équipe à re-concevoir le naming des fonds depuis la perspective des utilisateurs sans produits d’investissement.

02

Implémentation sélective sur le site commercial

Le tree testing avec 120 participants a évité un re-design en bloc. Il a montré des améliorations où implémenter (Assurances 31%→92%, Shopping 62%→93%) et une régression à laisser intacte (Twyp 94%→80%). L’équipe a recommandé d’implémenter uniquement les améliorations validées.

03

Risque évité sur Twyp

Les tests hebdomadaires ont identifié une friction structurelle dans le flux de paiement (taux de succès de 39%) et des problèmes de compréhension du cashback chez les utilisateurs non bancarisés, avant d’atteindre la production à grande échelle. Sans ce rythme continu, les patterns seraient passés invisibles entre des études trimestrielles.

04

Recommandations adoptées au backlog

L’analyse heuristique d’Inversión Naranja et les rapports des 4 sprints de Twyp ont été incorporés au backlog des équipes produit correspondantes.

Ce que je ne peux pas rapporter

Je n’ai pas accès aux métriques d’implémentation post-stage. Les recommandations sont arrivées au backlog, mais je ne peux pas rapporter honnêtement ce qui a été implémenté, quand ni avec quel impact mesurable en production. Je n’étais pas non plus lead du tree testing des 120 participants ni du think-out-loud A/B : ce sont des études de l’équipe auxquelles j’ai contribué à l’analyse. La distinction entre exécution directe et contribution fait partie de ce cas.

Réflexion

Ce que j'ai appris en entrant dans le research opérationnel de l'extérieur

Ce stage a été mon entrée dans le research à l’échelle entreprise, au sein d’une unité spécialisée qui opérait déjà avec son propre modèle. La leçon structurelle a été de comprendre comment trianguler l’évidence : l’analyse heuristique indique quoi valider ; le card sorting vérifie si les utilisateurs comprennent le système ; le tree testing confirme s’ils peuvent naviguer avec succès. Les trois ensemble construisent un argument que chacun isolément ne peut pas soutenir.

L’autre apprentissage : la valeur d’un intern dans un programme de research opérationnel mature ne provient pas de la conception du programme — il est déjà défini. Elle provient de l’exécution fiable, de la livraison dans les délais et de la capacité à livrer des synthèses actionnables sans supervision constante. C’est ce que j’ai essayé de faire.