Découpeur Sémantique — divisez de longs textes pour les LLM en local, sans couper en pleine idée
Découpez un long document ou une base de code en blocs adaptés au LLM — sans jamais couper en plein paragraphe ni en pleine fonction.
Long text or code to split
Comment ça marche
Collez un long document ou une base de code et fixez une taille de bloc maximale. Le découpeur sépare aux sauts de paragraphe et jamais à l'intérieur d'un bloc de code délimité, ne recourant aux limites de phrase que si un bloc est trop grand. Chaque bloc est numéroté pour les coller dans l'ordre dans le LLM.
Pourquoi découper le texte pour les LLM ?
Un prompt plus long que la fenêtre de contexte d'un modèle doit être découpé — mais une coupe naïve par caractères tombe au milieu d'une phrase, d'un objet JSON ou d'une fonction, et le modèle perd le fil. Le découpage sémantique ne coupe qu'aux limites de paragraphe et garde les blocs de code intacts, de sorte que chaque bloc numéroté est autonome. Collez-les dans l'ordre et le modèle suit le document comme s'il n'avait jamais été découpé.
FAQ
- Mon texte est-il envoyé ?
- Non. Le découpage s'exécute entièrement dans votre navigateur en JavaScript — votre document ne quitte jamais l'appareil. La page envoie seulement un compteur d'usage anonyme (le nom de l'outil et la taille de l'entrée), jamais le contenu.
- Comment garde-t-il des blocs cohérents ?
- Il découpe aux doubles sauts de ligne (paragraphes) et garde les blocs de code délimités entiers. Les coupes par phrase ou brutes ne servent qu'en dernier recours pour les blocs trop grands.
- Y a-t-il une limite de taille ?
- Seulement la mémoire de votre appareil. Sans serveur, vous pouvez découper des documents de plusieurs mégaoctets ; les entrées volumineuses sont traitées sans figer la page.
- Quelle taille de bloc utiliser ?
- Fixez-la sous la fenêtre de contexte de votre modèle, en laissant de la place pour la réponse — par exemple 8 000 à 12 000 caractères par bloc pour un modèle de chat courant.