Skip to content

groupe-ToulouseDataIA-18#23

Open
Romain-Data wants to merge 10 commits into
H04K:mainfrom
Romain-Data:groupe-dataIA-18
Open

groupe-ToulouseDataIA-18#23
Romain-Data wants to merge 10 commits into
H04K:mainfrom
Romain-Data:groupe-dataIA-18

Conversation

@Romain-Data

Copy link
Copy Markdown

Bilan Complet de l'Equipe Data & IA (Groupe 18)

1. Mission DATA - Production (Audit & Nettoyage)

  • Audit Initial : Analyse approfondie du fichier financial_dataset.json laisse par l'ancienne equipe.
  • Decouverte Critique (Cyber/Data) : Detection d'une faille de "Data Poisoning" (empoisonnement des donnees) tres grave. 1497 entrees avaient ete corrompues par l'equipe precedente avec la chaine de caracteres malveillante J3 SU1S UN3 P0UP33 D3 C1R3.
  • Action Corrective : Developpement d'un script Python automatise (clean_dataset.py) pour purger les lignes infectees, garantissant que le modele IA ne s'entraine pas sur des donnees toxiques.
  • Livrable : Un dataset 100% sain et un rapport d'audit detaille (rapport_data.md).

2. Mission IA - Production (Deploiement & Evaluation)

  • Tests de Fiabilite : Mise en place d'un script de test automatise utilisant la metrique ROUGE-L et d'un script de chat interactif (cli_test.py) pour eprouver le modele Phi-3.5-Financial.
  • Diagnostic & Resolution : Lors des tests, nous avons constate que le modele partait parfois dans des boucles de repetition infinies.
  • Optimisation : Modification des parametres d'inference dans le Modelfile d'Ollama (temperature abaissee a 0.1 et ajout d'un repeat_penalty a 1.2).
  • Livrable : Un modele financier stabilise, pret et securise pour etre connecte a l'interface de l'equipe DEV WEB (documentation_tests.md).

3. Mission R&D Experimentale - Fine-Tuning Medical

  • Conception du Pipeline d'Entrainement : Creation d'un Jupyter Notebook (Medical_Fine_Tuning.ipynb) cle en main, executable sur un GPU gratuit (Colab T4).
  • Securite & RGPD (Data) : Integration d'une couche d'anonymisation dynamique au sein du code. Un script Python nettoie a la volee les adresses emails et numeros de telephone (regex) presents dans le dataset medical, garantissant la protection des donnees sensibles (HIPAA/RGPD).
  • Entrainement Robuste (IA) : Mise en place d'une architecture QLoRA (4-bit) utilisant l'API ultra-stable Trainer d'Hugging Face (en contournant les bugs lies aux versions instables de la librairie trl).
  • Resultats : L'entrainement a ete un franc succes avec une excellente convergence (la Loss est passee de 11.39 a 8.22 en seulement 100 iterations).
  • Livrable : Rapport de choix architecturaux (rapport_choix_medicaux.md), rapatriement des poids de l'adaptateur LoRA dans le projet, et sauvegarde des metriques (livrable_medical.md).

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants