Este directorio contiene varios proyectos y prácticas desarrolladas en Python, explorando diferentes áreas como la visión por computadora, el uso de inteligencia artificial, el procesamiento de audio y la criptografía visual.
El trabajo de pixel es una representación de la criptografía porque en la criptografía en imágenes cambia por números y esos números son parte del código binario, de manera similar a las letras para crear oraciones, pero esta es una versión simplificada. Es un juego interactivo creado con Tkinter donde el usuario tiene 15 segundos para encontrar un píxel oculto cuyo valor RGB ha sido modificado en una imagen. Al encontrar el píxel correcto, se van revelando palabras para formar un mensaje final oculto.
Sistemas de reconocimiento de voz que escuchan audio en coreano y lo traducen al español de forma automática, reproduciendo la respuesta hablada.
traductor.py: Utiliza librerías clásicas comospeech_recognition,deep_translatorygTTS.traductor voz.py: Una versión más robusta que integra la API de Google Gemini (Generative AI) para realizar traducciones mucho más naturales. Incluye manejo de errores de límite de cuota y protección de credenciales mediante variables de entorno (.env).
Un proyecto de visión por computadora utilizando OpenCV y MediaPipe (Face Mesh). El programa detecta los puntos de la cara del usuario a través de la cámara web, calcula la apertura de la boca (distancia entre el labio superior e inferior) y, dependiendo de esta, superpone dinámicamente diferentes imágenes o "filtros" de gatos reaccionando en tiempo real a los gestos.
Un instrumento musical interactivo. Utiliza la cámara web junto con OpenCV y MediaPipe Hands para detectar las manos del usuario. La pantalla muestra 12 "pads" virtuales que, al ser "tocados" en el aire con los dedos, reproducen distintos sonidos de batería, sintetizadores o voces gestionados por Pygame. Incluye animaciones de ondas de audio y permite activar un modo "loop" al mostrar ambas manos abiertas.