« Les langues sont le meilleur miroir de l’esprit humain, et une analyse exacte de la signification des mots ferait mieux connaître que tout autre chose les opérations de l’entendement. »
— Leibniz, Nouveaux essais sur l’entendement humain
Didactique & Édition
Traduction de traités de droit malikite & théologie Ash'arite et conception de portails bilingues (fr.mahdara.org, heritagemohammadien.fr).
Vision (HTR)
Pipelines de transcription de manuscrits anciens (manuscrits maghrébins, Leibniz).
Crowdsourcing
Plateforme collaborative (Khatt-GPT) d'annotation et d'apprentissage didactique.
Ingénierie Logicielle
Architectures web et pipelines applicatifs (Next.js, PHP, Python, Rust en cours d'apprentissage).
Parcours R&D : sciences de l'écrit et plateformes
Travaux de modélisation appliqués aux manuscrits historiques et déploiement d'architectures SaaS collaboratives.
Python R&D
HTR de manuscrits maghrébins anciens (Qwen 9B)
Fine-tuning supervisé (LoRA/QLoRA via Unsloth) de Qwen 3.5 9B sur un dataset d'écriture cursive historique. CER cible : 13%. (Modèle privé, possiblement open-source prochainement).
Répartition réelle du Dataset Maghrébin
Volume Total11 205 lignes annotées
Splits de Données
Entraînement : 9 524 lignes (85%)
Validation : 560 lignes (5%)
Test : 1 121 lignes (10%)
Distribution des Sources
RASAM I & II : 8 444 lignes
BULAC (Suppl.) : 962 lignes
Annotations Perso : 931 lignes
BnF (Suppl.) : 581 lignes
MMSH Archives : 287 lignes
Axes de modélisation & R&D
Pré-entraînement masqué (MAE) : Initialisation de l'encodeur ViT par reconstruction de pixels masqués (He et al., 2021) pour stabiliser la vision face aux dégradations du papier.
Crowdsourcing : Ingestion de nouvelles annotations validées via la plateforme Khatt-GPT.
Visualisation de la transcription (Maghrebi HTR)
و الخامس ما اضيف الى واحد من هذه الاربعة المذكورة تقول في المضاف الى المضمر غلامي
Transcrit (Qwen-VL LoRA - 13% CER)
Glissez pour simuler la transcription automatique en arabe classique
Glissez pour aligner la formule originale avec sa transcription LaTeX
TypeScript R&D | Next.js
mybahr : Analyseur prosodique et métrique (العروض)
Phase active de développement (75% d'achèvement)
Moteur d'analyse prosodique déterministe de la poésie arabe (علم العروض) en monorepo TypeScript et Next.js 15.
Pipeline d'analyse déterministe en 4 étapes
1
Normalisation
Nettoyage de l'arabe (tatweel, alif/hamza).
2
Phonologie
Syllabification diacritée (CV, CVC, CVV, CVVC).
3
Prosodie
Matching des 16 mètres (buhur) et règles de Zihaf/'Illa.
4
Rime (Qafiya)
Extraction de la signature métrique (rawi, wasl, tasis).
Découpage de l'architecture en packages (TypeScript)
Package (monorepo)
Rôle & Fonctionnalité
État
@mybahr/phonology
Tokenizer phonétique sensible aux harakat (diacritiques) et syllabification.
Complété (100%)
@mybahr/prosody
Détection déterministe des buhur avec taf'ila et règles poétiques classiques.
Complété (95%)
@mybahr/qafiya
Extraction de la rime et contrôle de la cohérence métrique trans-vers.
Complété (95%)
@mybahr/diagnostics
Détection de déviations structurelles avec spans de source bilingues.
Complété (90%)
@mybahr/llm
Interface asynchrone (OpenAI/Anthropic) isolée pour suggestions de composition.
Complété (90%)
@mybahr/web
Interface web Next.js 15 (App Router, Tailwind v4) et routes API associées.
En cours (50%)
38 tests unitaires de validation fonctionnelle passent avec succès.
Next.js 16+ | Crowdsourcing
Khatt-GPT : Plateforme Collaborative HTR
Plateforme web de crowdsourcing pour la transcription collaborative de manuscrits maghrébins. Ingestion didactique d'annotations pour enrichir les datasets.
Application interactive d'enseignement de la grammaire arabe (I'rab) et de traduction (Hackathon SDAIA, Riyad). Fine-tuning du LLM ALLAM (IBM Watsonx.ai) avec des datasets propriétaires.
ALLAM LLMIBM Watsonx.aiArabic NLPI'rab DatasetSDAIA Saudi
Next.js 16+ | Workspace
HTR & Audio Transcription Workspace
Workspace collaboratif HTR (segmentation de lignes, aide à la traduction) et transcription vidéo/audio (Whisper STT).
Next.js 16+Line SegmentationSpeech-to-TextWhisper / TranslationLocal LLM API
Didactique & humanités
Maison d'édition & transmission
Direction artistique, typographie fine et traduction de grands traités bilingues d'arabe classique.
Livre traditionnel de l'enseignement du droit Malikite au Maghreb, traduit et commenté par Hicham YASSIN.
Commentaire d’Al-ʿAshmāwiyyah
Livre traditionnel de l'enseignement du droit Malikite au Maghreb, traduit et commenté par Hicham YASSIN.
La réponse suffisante
Ouvrage de l'érudit Muhammad al-ʿArabī ibn al-Sā'iḥ (enterré à Rabat), traitant principalement de la question du maître spirituel d'éducation (tarbiyyah).
1 / 3
Exemples d'ouvrages classiques traduits, commentés et édités par Hicham YASSIN.
Hicham YASSIN
Traitement Automatique de l'Écrit, Calcul & Humanités Numériques
R&D en Traitement de l'Écrit, Alignement LLMs/VLMs & Ingénierie Full-Stack Next.js 16+
Actuellement en Master 2 Informatique (ATAL / Traitement Automatique de la Langue) avec une base initiale en mathématiques-économie (double licence). Mon profil associe le développement web (Next.js, Python, Rust en cours d'apprentissage) à des travaux sur le pré-entraînement, le post-entraînement et l'alignement de modèles (GRPO, VAPO). Orienté R&D.
Éducation & Formation
2024 - 2026Université de Nantes, France
Master 2 Informatique - Parcours ATAL (Apprentissage et Traitement Automatique de la Langue) & Smart Computing
Spécialisation en Deep Learning, traitement de la parole (STT), vision par ordinateur et NLP (traduction, modèles génératifs).
Projet de Recherche (PHILIUUM) : HMER (Reconnaissance d'expressions mathématiques manuscrites) sur le corpus Leibniz (LS2N, dir. Prof. Harold MOUCHÈRE).
• Modélisation : Images en niveaux de gris, supervision multi-tâche (Symbol Counting, Tree-CoT).
• Décodage : Reranking multi-échelle, consensus et routage hybride Rectangle/Polygone (ExpRate de 73.99%).
2021 - 2024Université du Mans, France
Double Licence Mathématiques & Économie
Algèbre linéaire, probabilités, statistiques approfondies, analyse réelle, économétrie et optimisation de fonctions.
Français (maternelle)Arabe classique (littéraire)AnglaisTypographie & Édition
Expériences entrepreneuriales
Éditions Héritage Mohammadien (depuis 2019)
Fondateur. Traduction de traités de droit malikite & théologie Ash'arite. Conception web de heritagemohammadien.fr et de fr.mahdara.org (traducteur et webmaster). Organisation de conférences à Paris.
Dark Kitchen — Restauration rapide (UberEats & Deliveroo)
Création et pilotage d'un restaurant virtuel (Korean Fried Chicken) : gestion intégrale de la cuisine, de la chaîne logistique et de la direction artistique.
Autres expériences opérationnelles
• Secrétaire : Rédaction administrative et gestion de planning.
• Ouvreur de théâtre : Accueil du public et gestion de salle.
• Jardinier & éboueur : Travaux physiques et entretien paysager/salubrité.
Langues
Français : Maternelle
Arabe classique : Expertise littéraire et compréhension orale
Anglais : C1
Passions et réflexion
Échecs & Théorie des jeuxLogique complexe & PuzzlesArt de la typographie & reliure médiévalePhilosophie des sciencesTransmission didactique