Inspiración
Nos inspiramos en la fricción cognitiva que sufren estudiantes y profesionales: el momento en que una idea brillante se pierde porque el proceso de guardarla y clasificarla interrumpe el flujo de trabajo. Queríamos crear un "Inbox" donde la IA haga el trabajo sucio de organizar, mientras el humano mantiene el control.
Cómo lo construimos
- Cerebro: Groq Cloud (Llama 3.3 Versatile) para inferencia en milisegundos.
- Voz: Whisper-large-v3 para transformar audios en notas accionables.
- Interfaz: Streamlit, aprovechando su capacidad de prototipado rápido para herramientas de datos.
- Visualización: Grafos dinámicos para representar conexiones no lineales entre notas.
Desafíos y Aprendizaje
El mayor reto fue gestionar el estado multi-modal: procesar vídeos, audios y PDFs de forma unificada. Aprendimos a implementar un Router Cognitivo que identifica el tipo de contenido y propone etiquetas y resúmenes de forma proactiva, reduciendo la carga mental del usuario.
¿Qué sigue?
Nuestro objetivo es la privacidad total mediante modelos locales (Ollama) y una integración profunda con herramientas como Obsidian, permitiendo que el conocimiento sea verdaderamente portátil y duradero.
Log in or sign up for Devpost to join the conversation.