Skip to content

Bienvenido a VocalParam

VocalParam es un sistema de código abierto diseñado para unificar el proceso de grabación y configuración de voicebanks para síntesis vocal (UTAU/OpenUtau).

Status Quo: Sprint 3 Finalizado (Visual Editor & DSP)

Actualmente el proyecto ha completado su núcleo visual y de análisis. Contamos con un editor interactivo con espectrograma, sincronización bidireccional y un generador OTO automático inteligente, además de un motor de grabación profesional refinado.

Filosofía del Proyecto: El "Zero-Switch"

Desde su concepción, VocalParam ha sido diseñado bajo la premisa de eliminar el cambio constante de aplicaciones durante la creación de un voicebank. Tradicionalmente, un creador debe grabar en OREMO y luego parametrizar en SetParam o vLabeler.

Nuestra filosofía Zero-Switch unifica estas fases: - Calidad en el Origen: Al visualizar y escuchar mientras grabas, detectas errores fonéticos al instante. - Flujo Sofisticado: Una interfaz premium que respeta la precisión técnica exigida por los motores de síntesis vocal modernos.

Características Principales

  • Grabación 7-Moras Pro: Metrónomo de baja latencia con Count-in sónico y visual.
  • WaveformCanvas Interactivo: Editor visual con Espectrograma STFT, RMS y drag-and-drop de marcadores.
  • Auto-Oto Híbrido: Generación automática de parámetros basándose en BPM y análisis DSP de transientes.
  • Sincronización Bidireccional: Edición fluida entre la tabla de parámetros y el visor visual.
  • Gestión de Recursos: Control total sobre carpetas de destino y escucha integrada (Play/Listen).

Estructura del Proyecto

El proyecto sigue una arquitectura MVC (Modelo-Vista-Controlador) para asegurar que sea fácil de mantener y escalar.

graph TD
    UI[Interfaz de Usuario] --> Controller[Controladores]
    Controller --> Core[Lógica Core / Modelos]
    Core --> Files[(Archivos WAV/INI)]

Consulte la Guía de Usuario para empezar.