Fragmentador Semántico — Divide Texto Largo para LLM en Local, Sin Cortar a Mitad de Idea
Divide un documento o base de código largo en fragmentos del tamaño del LLM — sin cortar nunca a mitad de párrafo o de función.
Long text or code to split
Cómo funciona
Pega un documento largo o una base de código y fija un tamaño máximo de fragmento. El fragmentador divide por saltos de párrafo y nunca dentro de un bloque de código delimitado, recurriendo a los límites de frase solo cuando un bloque es demasiado grande. Cada fragmento va numerado para pegarlos en el LLM en orden, conservando el contexto.
¿Por qué fragmentar texto para LLM?
Un prompt más largo que la ventana de contexto de un modelo hay que dividirlo — pero un corte ingenuo por caracteres cae a mitad de una frase, de un objeto JSON o de una función, y el modelo pierde el hilo. La fragmentación semántica corta solo en los límites de párrafo y mantiene intactos los bloques de código, así cada fragmento numerado es autónomo. Pégalos en orden y el modelo sigue el documento como si nunca se hubiera dividido.
FAQ
- ¿Se sube mi texto?
- No. La fragmentación se ejecuta íntegramente en tu navegador con JavaScript — tu documento nunca sale del dispositivo. La página solo envía un contador de uso anónimo (el nombre de la herramienta y el tamaño de la entrada), nunca el contenido.
- ¿Cómo mantiene coherentes los fragmentos?
- Divide por dobles saltos de línea (párrafos) y mantiene intactos los bloques de código delimitados. Los cortes por frase o duros solo se usan como último recurso para bloques mayores que el tamaño fijado.
- ¿Hay límite de tamaño?
- Solo la memoria de tu dispositivo. Al no haber servidor puedes fragmentar documentos de varios megabytes; las entradas grandes se procesan sin congelar la página.
- ¿Qué tamaño de fragmento debo usar?
- Fíjalo por debajo de la ventana de contexto de tu modelo, dejando espacio para la respuesta: por ejemplo, de 8.000 a 12.000 caracteres por fragmento en un modelo de chat típico.