Créer un chatbot IA local avec Ollama et Open WebUI : Partie 1
Installer et déployer un LLM en local avec Ollama

Publié le dimanche 1 mars 2026; Mis à jour le dimanche 1 mars 2026 par Valentin LORTET

Par curiosité, j’ai voulu déployer sur mon ordinateur un chatbot IA local et y intégrer mon jeu de données. Après quelques recherches, j’ai choisi d'utiliser Ollama et Open WebUI. Dans ce tutoriel, je vais expliquer comment reproduire chez vous.

Les modèles de langage sont gourmands en ressources et nécessitent du matériel adapté. L’objectif de ce tutoriel n’est pas d’obtenir un assistant ultra-rapide, mais de construire un POC fonctionnel, capable de tourner sur un ordinateur classique, même si les réponses prennent plusieurs secondes.

Dans mon cas, j’utilise un Mac Apple Silicon (M4). Les réponses prennent une dizaine de secondes, ce qui reste acceptable pour une preuve de concept.

Objectifs

Pour ce projet, je souhaite :

Un chatbot avec lequel discuter ;
Un fonctionnement entièrement hors ligne ;
La possibilité d’intégrer mes propres données ;
La capacité de donner des consignes spécifiques (type de réponses, humour, ton...) ;
Un projet exécutable sur une machine standard (macOS, Windows ou Linux).

Mettre en place un chatbot IA (LLM) local

Commençons le projet simplement : installons un chatbot IA (LLM) local qui fonctionne avec des modèles existants.

Pour cela, j'ai décidé d'utiliser Ollama pour sa simplicité.

Ollama

Ollama est une application gratuite et open source qui permet d'exécuter un modèle de langage directement sur son ordinateur. C’est une solution légère, adaptée à un POC. Il suffit d’installer l’outil et de télécharger un modèle.

Installer Ollama

Ollama est disponible via une interface graphique (GUI) ou en ligne de commande (CLI). Personnellement, j'utilise la version graphique, mais la version en ligne de commande fonctionne tout aussi bien.

Ollama est disponible via Docker, mais d’après mon expérience, je ne le recommande pas : cela peut dégrader significativement les performances sur une machine personnelle.

Pour installer Ollama (macOS, Windows ou Linux), rendez-vous sur la page de téléchargement du projet et :

Téléchargez l’exécutable (version graphique) ;
Ou exécutez la commande fournie dans un terminal (mode CLI).

Choisir un modèle

La seconde étape consiste à choisir un modèle. Le modèle représente en quelque sorte la “personnalité” du chatbot.

Un modèle est entrainé sur un large volume de textes. Selon la nature des données utilisées (documents scientifiques, blogs, livres de cuisine, forums…), il pourra avoir un style, des connaissances et des compétences différentes.

J’ai décidé d’utiliser le modèle mistral-nemo car il est français. Libre à vous d’en choisir un autre selon vos besoins.

L'objectif principal d’un modèle n’est pas de restituer des connaissances générales, mais surtout de traiter des informations qu’on lui fournit et de les reformuler intelligemment.
C’est sur cet aspect que nous allons nous appuyer pour lui intégrer nos propres données par la suite.

Choisir le nombre de paramètres (xb)

La plupart des modèles sont disponibles en plusieurs tailles (exprimées en “xb”, par exemple 7b, 12b, etc.).

En règle générale :

Plus il y a de paramètres, plus le modèle est "intelligent" ;
Mais plus il est exigeant en ressources (RAM, CPU, GPU).

Dans mon cas, je vais donc utiliser mistral-nemo:12b . Cette version tourne correctement sur mon ordinateur portable, avec des réponses en quelques secondes. Selon votre configuration, n’hésitez pas à tester une version plus légère (ou plus lourde) si nécessaire.

Télécharger le modèle

Version graphique

Dans l’interface graphique :

Sélectionnez un modèle dans la liste en bas à droite ;
Envoyez un message ;
Le téléchargement démarre automatiquement si le modèle n’est pas encore présent sur votre machine.

Version ligne de commande

Dans un terminal, saisir :

(bash)
1ollama run mistral-nemo:12b

La commande téléchargera automatiquement le modèle si nécessaire, puis lancera une session interactive.

Échanger avec le chatbot

Version graphique

Il suffit d’ouvrir l’interface et de commencer à discuter.

Version CLI

Dans un terminal, saisir :

(bash)
1ollama run mistral-nemo:12b

Vous pouvez alors poser vos questions directement dans la console.

Où en sommes-nous ?

À ce stade :

Vous avez un chatbot fonctionnel ;
Il fonctionne 100 % hors ligne.

En revanche, il ne dispose que de ses connaissances générales issues de son entraînement.

Si vous commencez à lui parler d’un sujet très spécifique ou interne à votre organisation, les réponses risquent d’être approximatives.

Conclusion (prochaine étape)

Nous avons maintenant un LLM local, autonome et opérationnel. Mais il reste générique.

Dans la prochaine partie, nous verrons comment intégrer nos propres données afin de transformer ce simple chatbot en véritable assistant.

― Valentin LORTET

Partie suivante (Partie 2)Intégrer ses propres données à son chatbot (RAG et personnalisation)

Découvrir d’autres articles

Développement

Mes templates HTML : Partie 2
Template HTML Split View responsive

Publié le vendredi 12 décembre 2025

Pour démarrer mes projets HTML rapidement, j'aime me baser sur des modèles que j'ai préparés à l'avance. Ce second template propose une zone d’édition et un rendu visuel, avec une interface responsive pensée pour le mobile.

Mes Projets

Projet GoCampus

Publié le lundi 1 septembre 2014

GoCampus était une plateforme Web et Android permettant l'accès aux agendas, aux notes et à d'autres fonctionnalités pour les étudiants de l'Université de Nantes.

Intelligence artificielle

Créer un chatbot IA local avec Ollama et Open WebUI : Partie 2
Intégrer ses propres données à son chatbot (RAG et personnalisation)

Publié le dimanche 1 mars 2026

Dans la première partie de ce tutoriel, nous avons déployé simplement un chatbot IA local avec Ollama. Dans cette deuxième partie, nous allons y intégrer nos connaissances à l'aide du RAG et d’Open WebUI.

Domotique Home Assistant Développement

Générer une liste d'anniversaires depuis Home Assistant et un calendrier

Publié le mercredi 13 août 2025

Afin de ne plus oublier aucun anniversaire, j'utilise Home Assistant depuis plusieurs mois pour recevoir des notifications d'anniversaire personnalisées, à partir d'un calendrier

Développement Docker Ansible

Déployer un projet Docker avec Ansible et Swarm

Publié le mercredi 20 août 2025

Ansible et Docker occupent une place essentielle dans la gestion et le déploiement de mes projets sur mes serveurs. Pour automatiser et fiabiliser mes déploiements, j’ai conçu un playbook Ansible qui me permet de lancer mes applications Docker.

3D Développement

Créer un jeu VR (réalité virtuelle) en JavaScript avec A-Frame : Partie 1
Les prérequis à connaître pour la conception 3D

Publié le lundi 16 février 2026

Cela fait longtemps que je souhaitais faire un article sur A-Frame, une "bibliothèque" JavaScript qui permet de créer un environnement VR (réalité virtuelle) aussi simplement que l'on manipule du HTML. Nous allons voir ici les prérequis.

Développement

Manipulation de fichiers CSV en JavaScript Vanilla

Publié le vendredi 31 octobre 2025

Il m'arrive régulièrement de manipuler des fichiers CSV en JavaScript. Pour mes besoins assez limité, j'aime bien réutiliser des petits bouts de code que je vais partager ici.

Hors sujet Secourisme

Carte de « citoyen sauveteur » de Staying Alive - Hors sujet

Publié le vendredi 10 octobre 2025

Je tenais à saluer l'initiative de Staying Alive pour la création d'une carte de « citoyen sauveteur »

React/Next.js Développement

WebR : Mise en œuvre et création d'un composant React/Next.js

Publié le dimanche 3 août 2025

Dans cet article, je décris l'implémentation d'une console R (via WebR) dans React/Next.js

Ça existe encore les blogs en 2025 ?

Publié le vendredi 24 janvier 2025

Le bug de l'an 2000 a 25 ans et nous entamons une nouvelle révolution avec la démocratisation de l'intelligence artificielle. Mais pourquoi me lancer dans un blog qui semble sorti d'une autre époque ?

Mes Projets

2ACT.fr - Le site de l'Association des Attachés des Collectivités Territoriales

Publié le vendredi 1 juillet 2016

En 2016, j'ai eu l'opportunité de réaliser le site 2ACT.fr (To Act) pour l'« Association des Attachés des Collectivités Territoriales ».

Mes Projets

PSEQuiz - Apprendre et progresser

Publié le lundi 6 janvier 2020

PSEQuiz est une application que je me suis faite à des fins de révision. Elle était à l'origine dédiée à l'univers du secourisme.

Tout voir