v1.0.6 — Apache 2.0

Servidor d'IA que corre 100% en local.
Memòria persistent entre converses.
Zero dades al cloud.

Producte mínim viable per al món real. Obert a feedback de la comunitat. 🚀

macOS
Descarrega el DMG
v1.0.6 · Apple Silicon
Linux
Descarrega l'AppImage
v1.0.6 · ARM64 · Ubuntu 24.04+ · ~1.1 GB
chmod +x nexe-app_*.AppImage && ./nexe-app_*.AppImage

Sis pilars

Local i Privat

Corre completament al teu ordinador. Cap conversa, cap dada, cap document no surt mai del teu dispositiu. Privacitat absoluta garantida per arquitectura.

Memòria RAG

Recorda informació entre sessions amb embeddings de 768 dimensions a Qdrant. Indexa documents MD, PDF i TXT. Activa o desactiva col·leccions individualment des del sidebar.

Multi-backend

MLX natiu per Apple Silicon, llama.cpp universal, o bridge a Ollama. Canvia de model i backend sense reescriure res. API unificada.

Modular

Cada backend és un plugin independent. Afegeix funcionalitats noves sense tocar el core. Arquitectura dissenyada per créixer i experimentar.

Memòria Automàtica

El servidor auto-desa informació rellevant de les converses amb detecció d'intencions trilingüe, deduplicació intel·ligent i poda automàtica. Pots esborrar fets amb MEM_DELETE i veure cada guardat en un bloc blau col·lapsable.

Multilingüe

Sistema i18n complet en CA/ES/EN per a la interfície, system prompts, etiquetes RAG i missatges d'error. Canvia d'idioma sense reiniciar.

Quatre comandes

01 — Clona el repositori
$ git clone https://github.com/jgoy-labs/server-nexe
$ cd server-nexe
02 — Instal·lació guiada
# Detecta hardware, tria backend i model
$ ./setup.sh
03 — Arrenca el servidor
$ ./nexe go
# → http://localhost:9119
# → http://localhost:9119/ui
04 — Xat amb memòria
$ ./nexe chat --rag
# Guarda informació:
$ ./nexe memory store "..."

Tria el teu motor

RECOMANAT · MAC

MLX

Natiu per Apple Silicon. Màxim rendiment al teu M1/M2/M3. Usa el GPU Neural Engine al 100%. La millor opció si tens un Mac modern.

Apple Silicon GPU accelerat mlx-community
UNIVERSAL

llama.cpp

Compatible amb tots els formats GGUF. Funciona a Mac (Metal GPU), Linux i Windows. Lleuger, flexible i molt actiu a la comunitat.

GGUF Metal GPU Multi-plataforma
BRIDGE

Ollama

Si ja tens Ollama instal·lat, NEXE pot usar-lo directament com a backend. Aprofita tots els models que ja tens baixats.

Ollama API Reutilitza models Fàcil integració

Explora el projecte

Comença ara

Descarrega'l. Trenca'l. Experimenta.

NEXE és el teu assistent local. Pregunta-li com funciona, com crear plugins o com ampliar-lo. Recorda el context. Sempre en local.