v1.0.6 — Apache 2.0

Servidor d'IA que corre 100% en local.
Memòria persistent entre converses.
Zero dades al cloud.

Producte mínim viable per al món real. Obert a feedback de la comunitat. 🚀

macOS

Descarrega el DMG

v1.0.6 · Apple Silicon

Linux

Descarrega l'AppImage

v1.0.6 · ARM64 · Ubuntu 24.04+ · ~1.1 GB

chmod +x nexe-app_*.AppImage && ./nexe-app_*.AppImage

GitHub Releases

MLX

llama.cpp

Ollama

RAG

Qdrant

Privacitat total

FastAPI

Plugins

768-dim embeddings

OpenAI compatible

Apple Silicon

Dual-key auth

MLX

llama.cpp

Ollama

RAG

Qdrant

Privacitat total

FastAPI

Plugins

768-dim embeddings

OpenAI compatible

Apple Silicon

Dual-key auth

Per què NEXE

Sis pilars

Local i Privat

Corre completament al teu ordinador. Cap conversa, cap dada, cap document no surt mai del teu dispositiu. Privacitat absoluta garantida per arquitectura.

Memòria RAG

Recorda informació entre sessions amb embeddings de 768 dimensions a Qdrant. Indexa documents MD, PDF i TXT. Activa o desactiva col·leccions individualment des del sidebar.

Multi-backend

MLX natiu per Apple Silicon, llama.cpp universal, o bridge a Ollama. Canvia de model i backend sense reescriure res. API unificada.

Modular

Cada backend és un plugin independent. Afegeix funcionalitats noves sense tocar el core. Arquitectura dissenyada per créixer i experimentar.

Memòria Automàtica

El servidor auto-desa informació rellevant de les converses amb detecció d'intencions trilingüe, deduplicació intel·ligent i poda automàtica. Pots esborrar fets amb MEM_DELETE i veure cada guardat en un bloc blau col·lapsable.

Multilingüe

Sistema i18n complet en CA/ES/EN per a la interfície, system prompts, etiquetes RAG i missatges d'error. Canvia d'idioma sense reiniciar.

Comencem

Quatre comandes

01 — Clona el repositori

$ git clone https://github.com/jgoy-labs/server-nexe
$ cd server-nexe

02 — Instal·lació guiada

# Detecta hardware, tria backend i model
$ ./setup.sh

03 — Arrenca el servidor

$ ./nexe go
# → http://localhost:9119
# → http://localhost:9119/ui

04 — Xat amb memòria

$ ./nexe chat --rag
# Guarda informació:
$ ./nexe memory store "..."

Backends disponibles

Tria el teu motor

RECOMANAT · MAC

MLX

Natiu per Apple Silicon. Màxim rendiment al teu M1/M2/M3. Usa el GPU Neural Engine al 100%. La millor opció si tens un Mac modern.

Apple Silicon GPU accelerat mlx-community

UNIVERSAL

llama.cpp

Compatible amb tots els formats GGUF. Funciona a Mac (Metal GPU), Linux i Windows. Lleuger, flexible i molt actiu a la comunitat.

GGUF Metal GPU Multi-plataforma

BRIDGE

Ollama

Si ja tens Ollama instal·lat, NEXE pot usar-lo directament com a backend. Aprofita tots els models que ja tens baixats.

Ollama API Reutilitza models Fàcil integració

Documentació

Explora el projecte

Què és NEXE Filosofia, casos d'ús i roadmap del projecte. → Instal·lació Guia completa pas a pas per posar-ho en marxa. → Arquitectura Arquitectura modular en tres capes: Core → Plugins → Serveis. → API REST Referència completa. Compatible OpenAI /v1/chat/completions. → Sistema RAG Com funciona la memòria persistent amb Qdrant i embeddings. → Modular Sistema de plugins modular i com crear-ne de nous. → MEM_SAVE Memòria automàtica: detecció d'intencions, deduplicació i poda intel·ligent. →

Comença ara

Descarrega'l. Trenca'l. Experimenta.

NEXE és el teu assistent local. Pregunta-li com funciona, com crear plugins o com ampliar-lo. Recorda el context. Sempre en local.

Descarrega el DMG Guia d'instal·lació