Aller au contenu

IA

Rester à jour en IA générative : mes sources de veille

Introduction

Aborder l'IA en général est déjà assez complexe. D’un point de vue externe, on n’a pas idée à quel point le domaine est vaste. Et une fois qu’on est dedans, c’est infini. On peut passer toute une carrière sur une petite spécialité de l’IA, comme par exemple les séries temporelles, ou encore travailler sur le traitement du langage (NLP), sans forcément savoir ce qui se passe dans les autres catégories d’IA comme les systèmes de recommandation, la vision par ordinateur, etc.

Vous vous dites que c’est déjà compliqué, mais imaginez maintenant qu’il y ait des nouveautés toutes les semaines. C’est exactement ce qu’on vit depuis 2-3 ans avec l’IA générative, une catégorie de l’IA qui évolue extrêmement vite, avec de nombreux acteurs : OpenAI, Anthropic, Deepseek, Alibaba, XAi, HuggingFace, Pleias, Mistral... Bref, je pense que cela pourrait faire l’objet d’un article de blog à part entière.

Suivre tout cela est donc très complexe : des modèles sortent presque tous les jours, de nouvelles techniques, des produits... 24 heures ne suffisent clairement pas pour tout voir.

Comme c’est mon métier et que je suis passionné par le sujet, j’ai pris l’habitude de suivre tout ça au quotidien, en essayant de ne pas trop en faire et en gardant du plaisir. Je me suis donc dit qu'il serait intéressant d’écrire un article sur les sources qui me permettent de rester à jour.


Comprendre l'IA générative : LLM, exemples, limites (partie 2)

Introduction

Dans la première partie de cette exploration de l'intelligence artificielle, j'ai cherché à rendre accessibles des notions souvent floues comme le machine learning et le deep learning. Dans cet article, je vous propose de plonger ensemble dans un domaine dont tout le monde parle depuis deux ans : l'IA générative.

Avec l'essor impressionnant d'outils comme ChatGPT, Perplexity ou Midjourney, l'IA générative s'est imposée sur le devant de la scène. Contrairement aux autres formes d'IA qui se contentent d'analyser ou de classer des données (vision, séries temporelles, données tabulaires, NLP classique...), cette technologie est capable de créer de nouvelles données. Que ce soit pour générer du texte, des images, ou même de l'audio. En gros, tout réside dans le mot "Générative" : pour faire simple c'est une forme ou domaine d'IA qui va permettre de générer un nouveau contenu.

Dans cette partie, je vais simplement expliquer ce qu'est l'IA générative, comment ça marche, donner des exemples concrets, et montrer à quoi ça sert vraiment. L'idée, c'est de voir comment les machines ne se contentent plus de comprendre ce qu'on leur donne, mais arrivent carrément à créer du nouveau contenu.


Comprendre l'intelligence artificielle : guide simple (partie 1)

Introduction

L'intelligence artificielle séduit de plus en plus de curieux et de professionnels, grâce à des outils comme ChatGPT. Ces avancées ont transformé notre manière d'interagir avec la technologie et placé l'IA au centre des discussions. Avec l'IA générative, nous pouvons désormais produire du texte, des images et bien d'autres contenus grâce à des modèles d'apprentissage.


Comment améliorer un RAG par l'analyse d'erreur

Souvent, pour améliorer une application d'IA comme un RAG ou un agent, il est plus judicieux de se concentrer sur l'analyse fine des erreurs plutôt que de céder à la tentation d'ajouter systématiquement de nouveaux outils. Voyons pourquoi cette approche pragmatique est souvent la plus efficace, et surtout comment la mettre en place concrètement avec les bons outils de mesure.


Utiliser ChatGPT efficacement : limites, prompts et cas d'usage

Utiliser ChatGPT efficacement pour automatiser les tâches répétitives est déjà une réalité dans de nombreuses entreprises. Grâce à l'intelligence artificielle générative, il est possible d'améliorer la productivité, de gagner du temps et d'optimiser les processus quotidiens. Dans cet article, je vais essayer de vous donner quelques pistes pour utiliser ChatGPT efficacement.

C'est la première fois qu'une IA possède la capacité de communiquer par écrit de manière claire, au point qu'on puisse lui demander d'écrire un article marketing, rédiger un mail, automatiser des tâches ou résoudre un problème mathématique...

Parmi les exemples d'utilisation de ChatGPT que je viens de citer, il y en a un qu'il vaut mieux éviter de confier à ChatGPT : résoudre un problème de maths. En effet, ChatGPT n'est absolument pas fiable pour ce type de tâches, sauf si vous connaissez déjà la réponse.

Dans leur forme actuelle, les modèles d'intelligence artificielle comme ChatGPT ne sont pas conçus pour réellement comprendre les raisonnements en général et présentent également d'autres limites. C'est pourquoi, pour utiliser efficacement ce type d'IA générative, il est essentiel de bien en connaître les limites et d'adopter les bonnes pratiques.


AI Engineer : le nouveau rôle du data scientist en IA générative

AI Engineer : qui c'est, et pourquoi le terme existe

Un AI engineer, c'est celui qui intègre des modèles d'IA générative en production sans les entraîner lui-même. Il part de modèles existants, des LLM accessibles par API ou en open source, et son travail consiste à les transformer en quelque chose d'utile et de fiable : un RAG, un agent, une chaîne de traitement qui tient en production. C'est un rôle qui n'existait pas vraiment il y a trois ans.

Je suis Anas Rabhi, data scientist freelance, et c'est de plus en plus comme ça que je décris ce que je fais. C'est surtout une nouvelle appellation. En data science, le rôle a toujours bougé selon les capacités de chacun et selon ce dont l'entreprise avait besoin : la même personne a pu être appelée data scientist, ingénieur IA, machine learning engineer, parfois les trois. « AI engineer » est la dernière de ces étiquettes, celle qui colle au travail qu'on fait depuis l'arrivée de l'IA générative. Cet article explique ce qu'elle recouvre, pourquoi elle est apparue, et en quoi elle diffère du data scientist et du ML engineer.

Réussir un projet IA : ce qui se joue avant le code

Réussir un projet IA se décide avant la première ligne de code

Ce qui fait qu'un projet IA fonctionne se décide bien avant de toucher au moindre bout de code. Pas dans le choix du modèle, pas dans le framework, pas dans le pipeline. Dans le cadrage : la problématique métier, l'objectif et sa mesure, la donnée réelle, la question de savoir si l'IA est même nécessaire, et l'utilisateur qui devra s'en servir.

Avec le temps, j'ai fini par passer le plus clair de mon énergie sur ce qui vient avant l'IA. Pas sur l'IA elle-même. C'est contre-intuitif quand on est ingénieur, mais c'est là que se joue la différence entre un projet qui tient et un projet qui finit dans un tiroir.

Reranker RAG : Cohere, BGE, Jina, Voyage comparés

Le retrieval hybride récupère les bons chunks. Le reranker les met dans le bon ordre.

Vous avez implémenté un retrieval hybride BM25 + vectoriel. Votre recall@10 est correct. Pourtant, le LLM produit des réponses médiocres : l'information pertinente est bien dans les 10 chunks remontés, mais elle est au rang 8 ou 9. Le LLM l'ignore ou la dilue dans le bruit des chunks du dessus.

C'est le problème que le reranker résout. Pas le recall, la précision. Pas "trouver", mais "mettre en premier ce qui compte".

Dans cet article, je compare les quatre rerankers les plus utilisés en production (Cohere, BGE, Jina, Voyage) avec les arrivants notables de 2025-2026, les chiffres de benchmark publics, les prix réels, et une recommandation directe par profil de projet.

Sécuriser un RAG : injection, fuites de données, RBAC

Sécuriser un RAG, c'est plus simple qu'un audit de sécurité classique, et plus difficile qu'on le croit

Un RAG en production, c'est trois composants qui s'enchaînent : un retriever qui cherche dans vos documents, un contexte injecté dans un prompt, un LLM qui génère une réponse. Chacun de ces trois maillons est un vecteur d'attaque distinct. Ignorer l'un des trois, et votre système est vulnérable, même si les deux autres sont parfaitement sécurisés.

La bonne nouvelle : la moitié des garde-fous ne coûtent rien. La mauvaise : l'autre moitié demande une vraie refonte architecturale si vous n'y avez pas pensé dès le début.