Fiabiliser le matching TMDB avec annee et score de confiance #12

Open
opened 2026-04-12 18:09:06 +00:00 by thibaud-lclr · 0 comments
thibaud-lclr commented 2026-04-12 18:09:06 +00:00 (Migrated from gitea.lclr.dev)

1. Le souci

Le matching TMDB se base principalement sur le titre alors que l'annee est disponible dans les donnees Letterboxd. Cela augmente les faux positifs pour les remakes, titres ambigus et sorties proches.

2. Proposition de solution

Faire un matching plus robuste en tenant compte de l'annee, du titre original et d'un score de confiance avant validation finale.

3. Proposition d'implementation

  • injecter l'annee dans la requete TMDB quand elle est connue ;
  • comparer title, original_title, release_date et eventuellement langue ;
  • definir des seuils : match auto, match ambigu a revoir, echec ;
  • stocker le motif d'echec/ambiguite pour l'historique d'import.
## 1. Le souci Le matching TMDB se base principalement sur le titre alors que l'annee est disponible dans les donnees Letterboxd. Cela augmente les faux positifs pour les remakes, titres ambigus et sorties proches. ## 2. Proposition de solution Faire un matching plus robuste en tenant compte de l'annee, du titre original et d'un score de confiance avant validation finale. ## 3. Proposition d'implementation - injecter l'annee dans la requete TMDB quand elle est connue ; - comparer `title`, `original_title`, `release_date` et eventuellement langue ; - definir des seuils : match auto, match ambigu a revoir, echec ; - stocker le motif d'echec/ambiguite pour l'historique d'import.
Sign in to join this conversation.
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference: thibaud-lclr/ltbxd-actorle#12
No description provided.