Inspiración

Nos inspiramos en la fricción cognitiva que sufren estudiantes y profesionales: el momento en que una idea brillante se pierde porque el proceso de guardarla y clasificarla interrumpe el flujo de trabajo. Queríamos crear un "Inbox" donde la IA haga el trabajo sucio de organizar, mientras el humano mantiene el control.

Cómo lo construimos

  • Cerebro: Groq Cloud (Llama 3.3 Versatile) para inferencia en milisegundos.
  • Voz: Whisper-large-v3 para transformar audios en notas accionables.
  • Interfaz: Streamlit, aprovechando su capacidad de prototipado rápido para herramientas de datos.
  • Visualización: Grafos dinámicos para representar conexiones no lineales entre notas.

Desafíos y Aprendizaje

El mayor reto fue gestionar el estado multi-modal: procesar vídeos, audios y PDFs de forma unificada. Aprendimos a implementar un Router Cognitivo que identifica el tipo de contenido y propone etiquetas y resúmenes de forma proactiva, reduciendo la carga mental del usuario.

¿Qué sigue?

Nuestro objetivo es la privacidad total mediante modelos locales (Ollama) y una integración profunda con herramientas como Obsidian, permitiendo que el conocimiento sea verdaderamente portátil y duradero.

Built With

Share this project:

Updates