VOCALOID: pídele a Elvis Presley que cante tu canción

La música ejerce un gran poder sobre nuestras emociones. Amplifica las emociones, tal y como lo hace una poesía, un discurso conmovedor o el final trágico de una telenovela. Por ejemplo, las composiciones simples consistentes en sólo cuatro o cinco notas nos sugieren una alegría infantil, un horror exacerbado o una nostalgia sostenida y soportable, depende de qué notas escojamos.

Pero el elemento que realmente exacerba el poder emocional de la música es la voz humana. Las letras de las canciones, un grito, un gemido, un llanto, un lamento, un gruñido, un arrullo, una risa, una queja, un aullido, una aclamación e infinidad de armaduras acústicas y reclamos dirigidos al sistema límbico del cerebro.

Imaginaos, pues, una biblioteca vocal compuesta por las grandes voces del panorama musical de todos los tiempos. Sería algo así como una conservar el estilo literario de un poeta a fin de crear todos los sonetos que nos apetezca con su sello personal. Algo semejante es lo que pretende VOCALOID en el mundo de la música.

VOCALOID es el producto del trabajo del Grupo de Investigación en Tecnología Musical (MTG) dirigido por Xavier Serra, en la Universidad Pompeu Fabra de Barcelona. ¿Os imagináis componer una canción y escucharla interpretada por la voz de Elvis Presley? Ése es el espíritu de VOCALOID.

Este software sintetiza el sonido interpretativo a partir de bibliotecas vocales ligadas a músicas grabadas por cantantes reales. Así pues, no siempre es posible obtener los datos imprescindibles de todos los cantantes. Para que VOCALOID sea efectivo, es necesario conseguir grabaciones con sólo la voz sin presencia de acompañamiento musical. Por ejemplo, no poseemos este tipo de grabaciones de Frank Sinatra.

Además de usar las nuevas tecnologías, el punto crucial de todo esto es tener muy bien almacenados todos los registros y matices de las grabaciones de un cantante, segmentando sus varios componentes en una base de datos. La música y voz (fonética, expresividad…) pasan a ser ondas y estas gráficas sinusoidales tienen sus frecuencias, amplitudes, máximos, mínimos, etc. Son las técnicas del llamado SPP (Spectral Peak Processing) puestas al servicio de la interpretación. Los parámetros extraídos del cantante real, la información total sobre la canción (letra y música) y el reconocimiento y alineamiento de la voz de usted van a sonar al final con una voz “híbrida” muy imitativa.

Además, el grupo continúa trabajando en la simulación de sonidos de instrumentosEs el caso del diseño de un violín virtual, proyecto coordinado por el investigador Alfonso Pérez. Durante su tesis doctoral, decenas de violinistas ejecutaron su repertorio de piezas en el laboratorio del grupo de investigación. De esta manera, durante el año pasado Pérez desarrolló un programa capaz de reconocer esos gestos cuando se replicaban con un instrumento ficticio y de reproducir los sonidos correspondientes.

Vía | Vitaminas matemáticas de Claudi Alsina

Recibe "Xatakaletter", nuestra newsletter semanal

Explora en nuestros medios