Aller au contenu

SkillBridge

Data & AI provider pour le dataspace éducation & compétences — écosystème Prometheus-X / DASES.

À partir de traces d'apprentissage normalisées en xAPI, SkillBridge construit un profil de maîtrise par apprenant, segmente la population en profils pédagogiques par clustering non supervisé, et émet des recommandations explicables — le tout exposé via une API HTTP et démontré par une vitrine Streamlit.

Fil rouge

flowchart LR
    A["App éducative<br/>(persona Léa)"]:::ext
    L["LRC<br/>Prometheus-X"]:::ext
    P["PLRS<br/>coffre apprenant"]:::sim
    D["PDC<br/>échange consenti"]:::sim
    S["SkillBridge<br/>provider"]:::own
    R["Recommandations<br/>explicables"]:::own

    A -->|événements bruts| L
    L -->|xAPI DASES| P
    P -->|trace consentie| D
    D -->|trace| S
    S -->|profil + cluster + recos| R

    classDef ext fill:#fff3e0,stroke:#e65100,stroke-width:1px
    classDef sim fill:#f5f5f5,stroke:#999,stroke-width:1px,stroke-dasharray: 4 2
    classDef own fill:#e0f2f1,stroke:#00897b,stroke-width:1.5px
Légende Sens
Orange Brique externe réelle utilisée
Gris pointillé Simulé au niveau 1 (réel au Lot 4 pour le PDC)
Teal Code SkillBridge (ce repo)

Périmètre démontré (commits visibles)

  • Lot 1 — génération d'un dataset xAPI synthétique scénario maths primaire, archétypes spécialisés, enrichissement par compétences (ADR 001, ADR 002, ADR 007)
  • Lot 2 — profilage, clustering KMeans + silhouette empirique (k=4, silhouette 0.309), recommandations explicables avec sentence-transformers (ADR 003)
  • Lot 3 — interopérabilité via le LRC réel (/convert_custom), mapping YAML maison CSV → xAPI (ADR 004, ADR 005, ADR 006)
  • Lot 5a/b — API FastAPI (OpenAPI 3 sur /docs) + vitrine Streamlit consommant l'API
  • Lot 4 (à venir) — déploiement du PDC réel
  • Lot 5d (à venir) — déploiement Coolify / Hetzner

Pour démarrer

git clone https://github.com/sodigitaljeremy/skill-bridge.git
cd skill-bridge
make sync        # uv sync --extra dev
make dataset     # génère data/generated/
make demo        # API + Streamlit (http://localhost:8501)

Plus de détails : tutoriel de prise en main.

Honnêteté de la démo

Cette démo expose ses limites assumées plutôt que les masquer :

  • Le profil DASES retourné par le LRC est null — aucun template ne couvre nos verbes passed/failed sur exercices (ADR 005).
  • 95 % du dataset est généré directement en xAPI ; seul un échantillon est réellement passé par le LRC pour la démo (reproductibilité vs démonstration d'interop).
  • La projection 2D PCA n'explique que ~57 % de la variance — la séparation se joue sur les 12 dimensions ; la heatmap des centroïdes est plus informative.
  • Le PLRS et le PDC sont simulés au niveau 1 (PDC réel = Lot 4).

Liens