PROJECT, DESIGN AND MANAGEMENT

ISSN: 2603-5820

Cómo citar este artículo:

Rodríguez, C.A., López-Peláez Casellas, M. P., & Arambarri, J. (2020). Una estrategia metodológica para la optimización de procesos de producción de música POP, basada en modelos computacionales. Project, Design and Management, 2(2), 23-42. doi: 10.29314/pdm.v2i1.398

UNA ESTRATEGIA METODOLÓGICA PARA LA OPTIMIZACIÓN DE PROCESOS DE PRODUCCIÓN DE MÚSICA POP, BASADA EN MODELOS COMPUTACIONALES

Carlos Alberto Rodríguez
Antonio José Camacho University Institution (Colombia)
calberod21@gmail.com ·http://orcid.org/0000-0003-4719-8539

Maria Paz López-Pelaez Casellas
University of Jaén (Spain)
mlpelaez@ujaen.es

Jon Arambarri
Iberoamerican University Foundation (Spain)
jon.arambarri@funiber.org

Date received: 01/01/2020 / Date reviewed: 21/09/2020 / Date accepted: 25/10/2020


Resumen. Se propone el diseño de una estrategia metodológica compuesta por modelos computacionales, tecnología musical y reglas básicas de composición armónica. La estrategia integra diferentes herramientas como lenguajes de programación, algoritmos y reutilización librerías para la extracción de características fuertes a las muestras producidas por un intérprete, así como la ejecución de procesos estocásticos discretos que generan melodías acotadas por reglas básicas de composición de música Pop. Las melodías generadas son convertidas en series que posteriormente son reproducidos de forma controlada, por un dispositivo MIDI (Musical Instrument Digital Interface) y acotadas por reglas de composición musical que contribuyen a disminuir la monotonía melódica. Para garantizar la integración de todos los elementos como un sistema que genera iteraciones, se utilizan protocolos de control abierto entre lenguajes de programación y herramientas que permiten la interconexión y comunicación entre los diferentes componentes tecnológicos que conforman la estrategia. Una vez concluido el proceso de generación de fragmentos melódicos, estos son transmitidos a un gestor de audio y copiados en cada canal del gestor en un formato de tipo estándar MIDI. Esta información, además de ser editable, brinda la posibilidad al productor de reutilizar estas pistas como materia prima de trabajo para generar mayores escenarios y posibilidades creativas, cuando se desarrolla un proceso de producción de música Pop.

Palabras clave: Fragmentos musicales, MIDI, Modelos estocásticos, Music Information Retrieval, Reglas de composición musical, SMI

METHODOLOGICAL STRATEGY FOR OPTIMIZATION OF PRODUCTION PROCESSES OF POP MUSIC, BASED ON COMPUTATIONAL MODELS

Abstract.The design of a methodological strategy consisting of computational models, musical technology and basic rules of harmonic composition is proposed. The strategy integrates different tools such as programming languages, algorithms and reuse libraries for the extraction of strong characteristics from the samples produced by an interpreter, as well as the execution of discrete stochastic processes that execute melodies limited by basic rules of composition of Pop music. generated melodies are converted into series that are later played in a controlled way, by a MIDI device (digital interface of musical instruments) and bounded by musical composition rules that reduce melodic monotony. To specify the integration of all the elements as a system that generates iterations, use open control protocols between programming languages and tools that allow the interconnection and communication between the different technological components that make up the strategy. Once the process of generating melodic fragments is complete, these are transmitted to an audio manager and copied to each channel of the manager in a standard MIDI format. This information, in addition to being editable, provides the producer with the possibility of reusing these tracks as raw material for work to generate greater situations and creative possibilities when developing a Pop music production process.

Keyword: Rules of musical composition, Recovery of musical information, Stochastic Models, Music production, Musical Fragments.


Introducción

A pesar de que son innumerables las herramientas tecnológicas que soportan procesos de producción de música pop, la flexibilización de actividades que hacen parte del desarrollo de este tipo de producciones no deja de presentar desafíos que deben ser estrictamente planificados y abordados desde una estrategia metodológica. Problemas como la integración de diferentes herramientas de computación, interacción entre aplicativos, generación de contenidos de música editables en formatos estándar, la reutilización de características fuertes extraídas a las colecciones almacenadas en el gestor de audio, y la transmisión de datos editables al gestor de audio digital, hacen que estos retos se puedan enfrentar desde la utilización de un plan que genere valor al proceso de producción musical, y que además involucre herramientas que sistematizan actividades que tradicionalmente consumen muchos recursos de tipo técnico y humano.

Los creadores de este tipo de esbozos no dejan de encontrar desafíos cuando se trata de materializar cada idea creativa. Actividades como la grabación de sonidos y captura de instrumentos musicales se hacen tradicionalmente con costosos equipos y espacios diseñados acústicamente para la captura de voces e instrumentos musicales. Es importante resaltar que después de finalizar algunas actividades se deben destinar muchas horas en edición a las muestras capturadas, a esto se suma que el responsable del manejo del gestor de audio debe contar experiencia en la gestión de este tipo de proyectos. No deja ser importante mencionar que en muchas ocasiones se presenta el caso de que la persona que maneja el gestor de audio, no tenga un amplio conocimiento musical y esto también puede limitar los pequeños proyectos que regularmente no cuentan con un numeroso grupo humano trabajando en la elaboración del mismo. Todos estos elementos hacen que tradicionalmente se consuman muchos recursos de tipo técnico y humano en el desarrollo de estos procesos productivos.

La pertinencia de elaborar un plan metódico que guie la integración de diferentes herramientas tecnológicas, cobra importancia cuando se logra flexibilizar actividades de estudio y se aprovechan tecnologías alternativas a las tradicionales en el proceso de producción. La integración de diferentes herramientas, conectadas por intermedio de protocolos de comunicación, y la generación automática de fragmentos melódicos se convierten en un apoyo para el productor musical, pues con la transmisión de datos representados en instrumentos, escalas, arpegios y efectos en los canales del gestor, se otorga la posibilidad al productor de explorar diferentes escenarios y ambientaciones que permiten obtener diferentes resultados de producción. Sin embargo, el desafío radica en aprovechar estas tecnologías como una solución estratégica y estructurada dentro del complejo proceso de producción de música pop.

Algunas orientaciones para resolver problemas en procesos de generación de sonido o la combinación de cualquiera de estas formas con fines de producción musical son descritas en este apartado, por ejemplo, la propuesta de (Thorogood, Fan y Pasquier, 2019) donde buscan reducir los costos de grabación de sonidos, la recuperación de bases de datos y la generación artificial de sonidos con el fin de producir paisajes sonoros. En el diseño de (Turchet y Barthet, 2019) se propone un sistema ubicuo de guitarra inteligente para práctica musical colaborativa. Los investigadores buscan la convergencia entre herramientas tecnológicas colaborativas y sociales que interactúan dentro del campo de ecosistemas de computadoras interconectadas en internet para la música, concepto propuesto por Turchet et al. (2018). Los autores definieron este concepto como el conjunto de dispositivos interconectados entre sí y con capacidades de cómputo para lograr un objetivo musical. Para contextualizar los conceptos tecnológicos tratados hasta el momento, se comenzará por definir el concepto de protocolo MIDI sobre el cual Rumsey y McCormick (2004, p.97) afirman que es “un estándar para la comunicación en serie de información de control entre dispositivos musicales”. Otra tecnología que hace parte de esta propuesta es el concepto de dispositivos humana computadora y, más específicamente, los instrumentos musicales inteligentes (SMI), estos elementos se definirán como un dispositivo con características de cómputo y con la capacidad de conectarse a redes de datos, diseñados con propósitos musicales. Las herramientas digitales como los gestores de audio y lenguajes de programación son integradas por intermedio de protocolos Open Sound Control (OSC), un protocolo para interconectar aplicativos, instrumentos musicales digitales y computadoras. Las aplicaciones de capa intermedia (Middleware) son herramientas para la interconexión entre diferentes aplicaciones.

Detallando la configuración de esta estrategia se puede afirmar que es una combinación que integra herramientas y técnicas con el fin de generar fragmentos melódicos acotados por reglas básicas de composición musical. Estos fragmentos son generados por sistemas automáticos que fueron diseñados para esta estrategia. La presente propuesta se compone de modelos computacionales, tecnología musical y reglas básicas de composición armónica. La estrategia integra diferentes herramientas como lenguajes de programación, diseño y reutilización de algoritmos y librerías para la extracción de características fuertes a las muestras producidas por un intérprete, así como la ejecución de procesos estocásticos discretos que generan melodías acotadas por reglas básicas de composición de música Pop. Los fragmentos generados son convertidos en series que posteriormente serán reproducidos de forma controlada por un dispositivo SMI. Un resumen gradual de cómo se integran cada una de las partes, se puede resumir de la siguiente forma:


Método

Componentes

Para garantizar la integración de todos los elementos que componen una estrategia metodológica como un sistema que genera iteraciones, se utilizan protocolos de control abierto entre lenguajes de programación y herramientas que permiten la interconexión y comunicación entre los diferentes componentes tecnológicos que conforman la estrategia. Una vez que se concluye el proceso de generación de fragmentos melódicos, estos son transmitidos a un gestor de audio y copiados en cada canal del gestor en un formato de tipo estándar MIDI. Esta información, además de ser editable, brinda la posibilidad al productor de reutilizar estas pistas como materia prima de trabajo para generar mayores escenarios y posibilidades creativas, cuando se desarrolla un proceso de producción de música Pop.

¿Necesidad de una estrategia?

La necesidad de utilizar una estrategia que apoye y genere valor en la elaboración de composiciones musicales, se sustenta en que hasta para el músico más inspirado el paso del tiempo y el peso de sus producciones anteriores, comienzan a limitar su capacidad creativa. Desde los años 60 y 70 se publicaron artículos que serían referentes para las investigaciones en composición automática: Pattern in Music de Herbert Simon y Richard Summer (1993) y Analysis of Tonal Harmony de Terry Winograd (1968). Particularmente, en los estudios de Simon y Summer se intenta una sistematización de los procesos mentales en el oyente, basados en la estructura de la música tonal, aplicando una metodología rigurosa en el procesamiento de la información. Algunos investigadores (Hiller, 1979; Inoñán, 2010) han experimentado con cadenas de Markov, un modelo matemático más simple y controlable, consistente en un tipo especial de procesos estocásticos discretos en los que la probabilidad de que ocurra un evento depende del inmediatamente anterior. En el trabajo de Hori y Sagayama (2016), los investigadores realizan una variación al algoritmo de viterbi, generalmente utilizado para minimizar la complejidad de tocar una frase en instrumentos de cuerda. El cambio introducido en el trabajo de estos investigadores consiste en una variación del algoritmo denominado Minimax algoritmo de Viterbi con el fin de minimizar los movimientos en las frases más complejas de ejecutar, y maximizando la probabilidad de transición apoyados en modelos de cadenas ocultas de Markov (HMM). Una propuesta de composición musical basada en sistemas complejos, donde el autor utiliza sistemas caóticos para la generación automática de música, dado que “facilitan la manipulación de la monotonía melódica y generan fragmentos musicales diferentes, variando un poco las condiciones iniciales del sistema caótico” (Coca, 2009, p.16). Un resumen técnico de esta propuesta metodológica es representado en la Figura 1.

Figura 1. Diagrama esquemático de la metodología para generación de fragmentos melódicos.

Nota: Fuente. Autoría propia

Reglas básicas de armonía

La generación de fragmentos melódicos con cierta coherencia discursiva se basa en una combinación de reglas básicas de composición musical, junto con modelos y técnicas de computación. Este conjunto de elementos tiene como fin parametrizar algoritmos que en parte buscan romper la monotonía melódica propia que produce la aleatoriedad. Las reglas de armonía musical se tratan en este trabajo como un conjunto de equivalencias o parametrizaciones de un sistema. Este compendio de reglas tiene uno sus principales referentes en los años 1900 con las propuestas de Heinrich Schenker y Arnold Schoenberg, consideradas contradictorias, que, sin embargo, conllevaron a un cambio que permitió la clasificación de todo acorde formado por la superposición de 3 a 12 notas a partir de un bajo o nota fundamental. La armonía funcional se define como un conjunto de notas simultáneas que generalmente acompañan las melodías garantizando coherencia en el discurso.

Armonía Funcional

El concepto de armonía funcional es el que se adopta en este trabajo para establecer reglas de parametrización en un sistema. Según Galbis (2006): “cuando hablamos de armonía nos referimos al aspecto vertical de música, los sonidos simultáneos que llamamos intervalos y acordes y a sus posibles encadenamientos” (p. 50). En los años 1900, de acuerdo con el Diccionario Harvard de Música (2001), Hugo Riemann inventó el término armonía funcional en su propuesta Teoría de armonía tonal (1897), definido como la nota principal que recibe el nombre de tónica. Esta es la idea principal que se aplica a los algoritmos de composición musical, componentes clave de toda la estrategia metodológica que se desarrolla a lo largo de este trabajo. Cuando en una guitarra un músico coloca sus dedos en dos o más posiciones en el mástil, realiza la construcción de un acorde. Los acordes en su construcción básica son determinados por reglas de armonía funcional y tradicional, donde el eje central del acorde es la tónica y lo acompañan dos tonos más que se definen como grados; una tercera, conocida como mediante, y una quinta conocida como dominante. Estos grados son definidos en la armonía funcional de la siguiente forma:

Generación de Acordes

Otro elemento importante para la reproducción de fragmentos melódicos son los acordes, en el campo de la armonía reciben el nombre de triada mayor consonante para los acordes conformados por tercera mayor y quinta perfecta; de triada menor consonante, conformada por tercera menor y una quinta perfecta, y una triada disminuida, conformada por una tercera menor y una quinta disminuida. La combinación de los anteriores grados en acordes de tres sonidos, compuestos por dos terceras superpuestas y constituyen la base del sistema tonal tradicional. Estos acordes son necesarios para la formación de escalas y están descritos de la siguiente forma: acorde perfecto mayor (3ª mayor + 3ª menor), acorde perfecto menor (3ª menor + 3ª mayor), acorde disminuido (3ª menor + 3ª menor), acorde aumentado (3ª mayor + 3ª mayor) y acorde mayor con 5ª disminuida (3ª mayor + 3ª disminuida). (Roca y Molina, 2006). La configuración básica de un acorde está conformada por la nota raíz o tónica fundamental, la tercera o mediante y la quinta o dominante, configuración que recibe el nombre de tríada.

Cuando se interpreta un acorde de tres sonidos sobre la tónica de una escala mayor, se está interpretando un acorde mayor, y de la misma forma si la interpretación del músico es en una escala menor, el acorde será menor. La diferenciación entre un acorde y otro se da en el tercer tono, que, como su propia denominación indica (mediante o modal), nos dice si el modo es mayor o menor.

Generación de Escalas

Otro elemento armónico determinante son las escalas, un conjunto de tonos que pueden ser simulados en vectores para flexibilizar su manipulación melódica y ejecutar con cierta aleatoriedad; dependiendo de la configuración de este vector, se pueden formar escalas mayores, menores, así como variaciones de las mismas. Suponiendo una misma escala de tiempos, se consideran doce valores representados en tonos y semitonos, Harte (2010) lo representa en el siguiente conjunto: {C, C♯, D, D♯, E, F, F♯, G, G♯, A, A♯, B}, que consiste en los doce atributos de tono como se utilizan en la notación de música occidental. Una equivalencia de cada valor de este conjunto de tonos y semitonos se puede identificar como un conjunto de enteros {1,2,..., 12}, donde 1 se refiere al tono C, 2 al tono C♯, y así sucesivamente. La forma como se define una escala mayor es una lista de siete tonos y semitonos (T-T-T-S-T-T-T), donde los semitonos hacen la diferencia entre una escala mayor o menor. Un vector binario es el que decide la lógica de tonos y semitonos, un ejemplo es el vector de unos y ceros “[1,1,1,0,1,1,1]” que representa la escala mayor donde uno representa un tono y cero representa un semitono. El vector que representa la escala menor quedaría con un cero en la tercera posición y en la sexta “[1,1,0,1,1,0,1]”.

Extracción de características fuertes

El sistema MIR que fue diseñado para este proyecto se encarga de extraer el tono principal de la muestra y luego compara el error que arroja el programa frente al tono en el que fue diseñado el fragmento musical. La idea básica del algoritmo es encontrar distancias claves al tono principal; en concreto, intervalos de quinta perfecta, relativa mayor y menor, y mayor y menor paralela. El sistema MIR que fue diseñado para este proyecto se encarga de extraer el tono principal de la muestra y luego compara el error que arroja el programa frente al tono en el que fue diseñado el fragmento musical. La idea básica del algoritmo es encontrar distancias claves al tono principal; en concreto, intervalos de quinta perfecta, relativa mayor y menor, y mayor y menor paralela ver Figura 2.

Figura 2. Relación con la clave correcta.

Nota: Fuente. (https://www.music-ir.org/mirex/wiki/2019:Audio_Key_Detection,2019)

Técnicas de composición musical

La reproducción de fragmentos melódicos no solo debe ser acotada por reglas de composición musical, las técnicas musicales también son aprovechadas para la estructuración de los mismos. La permutación de series musicales es una técnica de composición musical utilizada desde principios del siglo XX y llamada serialismo, que fue inspirada por el dodecafonismo, otra técnica de composición musical creada por Arnold Schönberg y que está basada en los 12 tonos de la escala cromática. Entre los más reconocidos compositores de la técnica serialista se encuentran Alban Berg y Anton von Webern (Romero, 2004). Esta técnica musical facilita la manipulación melódica a la hora de generar síntesis en un lenguaje de programación.

Técnicas de síntesis

Una matriz estocástica es formada a partir de las características fuertes extraídas a un fragmento de audio. Las matrices programadas en métodos como una estructura sintáctica son las cadenas de Markov, un caso específico de los procesos estocásticos; son una herramienta dentro del campo de la investigación de operaciones que permite analizar el comportamiento y gobierno de determinados tipos de procesos estocásticos. Según Kolman y Hill (2013), plantean que “Una cadena de Markov es aquella en que la probabilidad de que el sistema esté en un estado particular en un periodo de observación dado, depende solamente de su estado en el periodo de observación inmediatamente anterior” (p.119). Cada una de estas cadenas consta de n estados definidos en una matriz de transición T. Esta matriz será generada por un sistema de síntesis especialmente diseñado para este trabajo en el lenguaje de programación ChucK, sus creadores Kapur y otros (2015) lo definen como: “ChucK es un lenguaje de programación diseñado específicamente para la creación de música y síntesis de sonido en tiempo real” (p.3). En este tipo de matrices las probabilidades y cambios de estado son generadas por algoritmos que hacen parte de este sistema de síntesis. Las probabilidades de cambio se representan matemáticamente como el producto de las dimensiones que componen esta matriz, mientras los valores de la matriz serán generados aleatoriamente y no pueden ser negativos. En la presente propuesta se realiza un ajuste para garantizar que la suma de cada fila sea igual a 1. La aritmética aplicada por los algoritmos entre las matrices estocásticas y las escalas musicales produce vectores que contienen melodías ya afectadas por parámetros y reglas de composición. Esta generalización permite encontrar todos los demás vectores de estado, pero para desarrollar este proceso se requieren una serie de subprocesos, que fueron construidos como componentes de software. Este sistema es una herramienta lógica orientada a la síntesis de audio y compuesta por módulos que interactúan entre sí con el fin de generar fragmentos melódicos. Esta herramienta toma como materia prima los patrones o metadatos generados en el otro sistema de recuperación, también diseñado en el contexto de esta investigación, esta herramienta se encarga del reconocimiento de características fuertes a muestras digitales de audio.

Estructura lógica de la herramienta para síntesis

La herramienta orientada a la síntesis musical es un diseño compuesto por módulos que son clases o estructuras sintácticas complejas. Estas estructuras se ejecutan en una máquina virtual en diferentes hilos o programas sincronizados en ejecución para garantizar la eficiencia en tiempo real. Estos subprocesos o hilos se ejecutan en forma serial o paralela. Un modelo que describe este sistema y sus componentes es representado en la Figura 3.

Figura 3. Diagrama de componentes del sistema.

Nota: Fuente. Autoría propia

Un fragmento digital de audio de 30 segundos es analizado y como resultado arroja un tono principal correspondiente a una tonalidad de naturaleza mayor o menor, inmediatamente los métodos que ejecutan algoritmos dentro del sistema de síntesis generan escalas mayores, acordes, modos, matrices estocásticas, filtros y vectores.

Clases y métodos

Un paquete con cuatro complejas estructuras es desarrollado para la generación de matrices estocásticas de transición. Estas matrices son compuestas por números aleatorios y cumplen con las condiciones que requiere una matriz de esta naturaleza. Esta estructura sintáctica, correlacionada cardinal y comunicacionalmente, son la base para la agrupación de los principales métodos de cálculo y generación. En la Figura 5 se representan las clases, métodos y relaciones de las estructuras sintácticas que funcionan como directivas para todos los instrumentos sintetizados que pueden intervenir en la composición de fragmentos. Ver Figura 4.

Figura 4. Diagrama de clases principales.

Nota: Fuente. Autoría propia

Un módulo de síntesis ejecuta un objeto orquestador que instancia objetos de las clases de generación y de una clase correspondiente a un instrumento melódico. Una vez se coloca en ejecución, comienza a lanzar métodos de generación hasta escribir un vector melódico y persistente, comportándose como una base de datos para todos los instrumentos musicales de reproducción y diferentes objetos en el sistema de síntesis. En el siguiente diagrama se describe la comunicación entre componentes de software al generar un fragmento melódico, ver Figura 5.

Figura 5. Diagrama de clases principales.

Nota: Fuente. Autoría propia

Información contenida en los metadatos

Todas las herramientas anteriormente explicadas, que interactúan entre sí, trabajan con el fin de transmitir información a un gestor de audio digital en un formato estándar y editable. Como se puede observar en la figura 3 que ilustra la composición general de la estrategia, cada una de estas técnicas y herramientas aporta datos e información importante para generar fragmentos melódicos, que luego deben ser transmitidos al gestor de audio en formatos MIDI y de audio digital WAV.

Existe una comunicación entre el sistema de extracción de características fuertes y el sistema de síntesis; la comunicación entre estos dos sistemas se consigue por intermedio de metadatos, y a continuación se describe la composición del formato de archivo para los resultados generados por los diferentes módulos del sistema MIR, ver Figura 6.

Figura 6. Definición del formato de archivo para los resultados generados por los diferentes módulos del sistema MIR

Nota: Fuente. Autoría propia

Generación de escalas

Un conjunto de métodos es utilizado para la generación de escalas, acordes y modos. Estos algoritmos utilizan un vector de unos y ceros que representa la diferencia entre los intervalos de una escala, lo que quiere decir que uno (1) representa una diferencia de dos posiciones y un cero (0) una diferencia de una posición, ver Figura 7.

Figura 7. Posiciones MIDI vs NOTAS musicales.

Nota: Fuente. Autoría propia

La lógica del programa toma la decisión de sumar un tono o un semitono durante el ciclo de generación de la escala, a la vez que una constante K de forma aleatoria selecciona el modo de una escala musical específica. Un primer método a describir es la generación de las escalas mayores, teniendo en cuenta que se deben fijar reglas de composición musical para las escalas mayores. El método desarrollado en este trabajo arma una cadena numérica representada en un vector de elementos enteros, este vector es equivalente a una lista de valores MIDI posicionadas según la clasificación de la escala que se encuentre en generación. Describiendo la generación de una escala mayor, este algoritmo toma decisiones según la posición del vector que se encuentre en inicialización. De igual forma, el método generación a la escala mayor es representado a continuación, ver Figura 8.

Figura 8. Algoritmo de generación de la escala mayor.

Nota: Fuente. Autoría propia

Generación de acordes y modos

En el caso de acordes mayores y menores se generan triadas conformadas por los tres tonos básicos a los que se adiciona el VII y IX, a los que el algoritmo aleatoriamente reproduce con menor intensidad. Este algoritmo inicializa el valor del tono dependiendo el valor de cada posición de un vector. Por ejemplo, a la escala mayor le corresponden las posiciones 0, 3 y 4 del vector, que son equivalentes a los acordes mayores. Las posiciones 1, 2 y 5 son correspondientes a los acordes menores. Por último, la posición 6 del vector es correspondiente al acorde disminuido. En el caso de los acordes correspondientes a la escala menor natural, es importante denotar que el algoritmo de generación de estos acordes inicializa el valor del tono dependiendo el valor de cada posición de un vector. Las posiciones (0,3,4) del vector son equivalentes a los acordes menores; las posiciones (2,5,6) son equivalentes a los acordes mayores y, por último, la posición (1) del vector es correspondiente al acorde disminuido. Ver figura 9.

Figura 9. Algoritmo de generación de modos.

Nota: Fuente. Autoría propia

La generación de modos en escalas musicales es otra técnica musical que aporta a la recreación de una escala mayor o menor. A pesar de que las escalas mayores y menores resumen las características de las escalas modales, al recrear la escala o ejecutar su reproducción se acentúan diferencias entre un contexto modal y un contexto tonal Balderrabano (2019). Para este caso, este algoritmo generaliza los modos para las escalas mayores y menores: básicamente recibe como datos de entrada el modo y una constante numérica de intervalos, que corresponde a la constante de sumatoria para transportar la escala recibida a cada uno de los modos. Ver Figura 10.

Figura 10. Algoritmo de generación de escalas modales.

Nota: Fuente. Autoría propia

Generación de fragmentos melódicos

Los productos generados son fragmentos melódicos consistentes en acordes, petriodos, frases o semifrases, que se generan por cada intervalo de tiempo, y se dividen en intervalos que son múltiplos del tiempo inicial detectado para una muestra de audio digital. Para este caso y como están programados los algoritmos de este trabajo, el valor más pequeño para cada frase dependerá de la detección del tiempo a la muestra de audio que realice el sistema de extracción de características fuertes, y de la división que realiza la música al tiempo en figuras blancas, negras, corcheas y semicorcheas, cada figura es múltiplo del tiempo fundamental. La Figura 11 representa la secuencia de actividades, mensajes y procesos hasta llegar al proceso de producción. Una vez que la información es traducida por un software Middleware, que trabaja entre el lenguaje de programación y los canales del gestor de audio, la información es transmitida hasta llegar a los canales del editor en formato de datos MIDI. El productor edita los datos de cada canal haciendo uso de herramientas de edición y transformación del gestor de audio digital.

Figura 11. Iteración entre procesos, actividades y mensajes.

Nota: Fuente. Autoría propia

Trasmisión de datos un gestor de audio

Los datos transmitidos en los canales se convierten en la materia prima para que el productor cree, recree o experimente diferentes escenarios. Esta materia prima se convierte en otros artefactos intermedios, tales como efectos de sonido, arpegios, prolongaciones y todo lo que la creatividad y conocimiento le permita editar a la persona que esté al frente del gestor de audio digital. El accionamiento de dispositivos MIDI y dispositivos interfaz humano computador adiciona un poco más de sensibilidad al fragmento generado por el sistema computacional. Estos dispositivos disparan arpegios y efectos que leen la información generada por el sistema, pero, en este caso, las calidades de estas ejecuciones dependen del dispositivo agregado y la sensibilidad expresiva del ejecutante.

Evaluación perceptiva de fragmentos melódicos y su simplificación

La evaluación perceptiva de estos fragmentos melódicos requiere de una herramienta para recolectar la opinión de una muestra de expertos, para tal fin se diseña un formulario digital que recoge datos y percepciones aplicadas a una población de músicos, productores e ingenieros, quienes luego de escuchar las reproducciones generadas por estos fragmentos, consignan su percepción en un cuestionario que está compuesto por variables discretas de tipo politómicas.

Los instrumentos utilizados para analizar la información recolectada en los cuestionarios, son herramientas tecnológicas para el análisis de datos y están consolidados en el mercado actual. Por ejemplo, el paquete estadístico para ciencias sociales “SPSS”, diseñado por la casa de software IBM es actualmente una de las aplicaciones líderes en el mercado desde los años 80 SPSS (2020). Otra herramienta utilizada para análisis de resultados es el paquete “XLSTAT”, un aplicativo que se instala dentro de las funcionalidades de Excel y se ancla dentro de sus propios menús haciendo uso de las hojas de datos XLSTAT (2020).

Para analizar y simplificar los resultados consignados en el cuestionario, se utiliza una técnica estadística multivariada en este caso se utilizan la técnica análisis factorial, que es un método de simplificación en subconjuntos de variables, estos subconjuntos representan las calificaciones más relevantes hechas por los evaluadores, además identifican las variables que los expertos consideraron con mayor interés.

Elementos del modelo de evaluación

En el entorno musical la improvisación se conoce como el arte de producir o concebir una parte de una canción o pieza, que puede ser una melodía o un arreglo sin planear previamente, a partir de algunos recursos disponibles Erkkilä (2000). Uno de los modelos más populares para la evaluación musical fue el implementado por Swanwick (2002) denominado CAP (Composition, Audition and Performance), modelo que luego fue adaptado por Alberola [20] quien realiza su propia versión. En este nuevo modelo, Alberola consideró que los elementos imprescindibles para la evaluación de una interpretación musical son fluidez, sonido, postura, notas y ritmo.

El método estadístico

En este caso se aplica una técnica estadística llamada análisis factorial, un método de análisis multivariado que presenta ventajas sobre otros métodos estadísticos, pues no es necesario un inmenso conjunto de datos para ejecutar procesos de análisis de datos encontrando buenas medidas de confiabilidad, además con este método se busca explicar la variabilidad en función del número de factores que se evidencian después del procesamiento de datos. Esta técnica también agrupa variables pertenecientes a cada uno de los factores relevantes, y releva la importancia que los encuestados confirman de cada variable al responder el cuestionario.


Resultados

Para el caso de este trabajo, y teniendo en cuenta que la interpretación es realizada por un modelo computacional, se elabora la siguiente propuesta consignada en la Tabla 3, donde se incluyen solo cuatro elementos: sonido, notas, ritmo y edición. La población de expertos que apoyaron la evaluación de esta estrategia computacional estuvo conformada por un grupo de 20 expertos: 10 músicos, 5 productores y 5 ingenieros, los cuales consignaron su opinión en una herramienta de recolección de datos y percepciones. Ver figura 12.

Figura 12. Formulario de evaluación de fragmentos melódicos.

Nota: Fuente. Autoría propia

Un primer análisis realizado a las (N=20) calificaciones hechas por los expertos o productores evidencia que las consideraciones realizadas son de una estrecha diferenciación, ya que los valores de la desviación típica oscilan entre (SD=0.089 y SD=0.150), de igual forma, las medidas de la media oscilan entre (M=3.70 y M=4.03). De un total de (N=20) casos, ninguno fue excluido, ni tampoco fue necesario realizar la eliminación de algún caso, lo que quiere decir que la eliminación de algún caso no conllevaría a mejorar los porcentajes de correlación de la matriz de datos.

Partiendo de que la mayoría de las variables presentan interrelaciones significativas, se afirma que las relaciones existen porque las variables son manifestaciones comunes de factores "no observables" de forma directa. En este análisis se pretende llegar a un cálculo de esos factores, resumiendo datos, clarificando las relaciones entre las variables y sin pérdida excesiva de información (Mahía, 2011). El proceso de análisis factorial proporciona una imagen de la estructura profunda de un conjunto de variables a procesar. Una vez se procesa este conjunto de variables, se optimiza a una estructura más simple, con menos dimensiones, de donde se obtiene la misma información generalizando el entendimiento de los datos obtenidos en toda la muestra. De esta manera se simplifica el modelo, eliminando redundancias expresadas en altas correlaciones entre variables, dando como resultado un conjunto de variables en factores estructurales. Asensio (2015) afirma que “el análisis factorial simplifica las múltiples y complejas relaciones que puedan existir entre un conjunto de variables observadas ” (p. 165).

El resumen de casos procesados en la presente muestra arroja una buena medida de fiabilidad Alpha de Cronbach’s (coeficiente que sirve para medir la fiabilidad de una escala de medida). En este caso, la medida es (α= 0.886), por tanto, se procesan la totalidad de los 20 casos para 11 variables. A continuación, se describen los resultados de la prueba de fiabilidad resumidos en tablas. González Alonso & Pazmiño Santacruz (2015) definen al Alpha de Cronbach’s como un indicador indispensable para evaluar el grado de correlación entre las variables de un instrumento. También es importante resaltar que los dos primeros factores explican más del 50% del total de la varianza. Esto permite afirmar que en los dos primeros componentes se confirma la mayor cantidad de calificaciones hechas por los expertos. Ver figura 13.

Figura 13. Resumen de la varianza explicada.

Nota: Fuente. Autoría propia

La suma acumulada de los cuatro primeros componentes acumula un total de V=77.468%, esto significa que la gran mayoría de varianza explicada es contenida en estos cuatro componentes. Al realizar un análisis factorial exploratorio con base en la teoría subyacente de que los factores son independientes, Choque (2014) afirma que: “VARIMAX es un método que busca redistribuir la varianza a lo largo de todos los componentes en la matriz de carga” (p.103).

La selección de los pesos de las variables que componen cada factor se realizará de forma manual, seleccionando la variable de mayor peso en cada factor. Una vez agrupadas las variables de mayor valor dentro de la matriz, se resaltan como el subconjunto que forma cada componente, como se ilustra en la Figura 14.

Figura 14. Componentes formados de la encuesta.

Nota: Fuente. Autoría propia

Aunque los resultados del análisis factorial arrojan la misma cantidad de factores que los propuestos inicialmente en la herramienta de evaluación, estos sufren una nueva organización y son compuestos por otras variables. Estos factores evidencian esa estructura subyacente que emerge después de un exhaustivo procesamiento de los datos. La nueva organización se plantea en la figura 15:

Figura 15. Factores resultantes.

Nota: Fuente. Autoría propia


Discusión y conclusiones

Después de un total de seis rotaciones de la matriz de datos, el total de la varianza explicada en todos los factores inclina la balanza hacia el primer factor, donde se confirma el 28.404%. Este porcentaje reafirma de manera muy importante las posibilidades de edición y reutilización, dada la influencia de cada una de las variables en este primer factor de posibilidades y flexibilidad para crear nuevos escenarios. Esto permite afirmar que esta calificación es significativa y se acerca de forma cualitativa y cuantitativa a lo propuesto en los objetivos de esta estrategia metodológica. Los demás factores definen independientemente una varianza aproximada del 17% por cada uno, lo que permite concluir que las variables agrupadas en el primer factor fueron las más relevantes para las personas que diligenciaron el instrumento de evaluación. Un reacomodamiento de las variables en cada uno de los factores permite generar una visión más organizada de la estructura que compone cada factor. La evaluación de fragmentos melódicos se agrupa en factores, y a la vez cada factor agrupa diferentes variables. En el caso del Factor 1 que es el más relevante para la flexibilización del proceso de producción de música pop, las variables que lo conforman son (X4,X6,X8,X10,X11); el Factor 2 evalúa la dimensión de claridad y sonoridad en los distintos tonos y acordes, este factor quedó compuesto por las variables (X1,X3,X5); el Factor 3 evalúa la dinámica en la reproducción del fragmento y quedó compuesto por las variables (X7,X9), y el Factor 4 evalúa la mezcla entre los diferentes instrumentos y solo lo compone la variable X2. Ver figura 16.

Figura 16. Factores resultantes.

Nota: Fuente. Autoría propia

 

El diseño de esta estrategia metodológica permite la integración de diferentes métodos y tecnologías que, al unirlas, logran generar una información editable y reutilizable en un escenario diferente al que fue planteado en la composición inicial por el productor. También es importante resaltar que esta micro arquitectura diseñada en el sistema de síntesis, permite la ejecución con dispositivos de interacción humana computador; dispositivos que, al generar eventos dentro del sistema de síntesis, son una opción más expresiva a la monotonía que por naturaleza propia trata de imponer la aleatoriedad.

Al ser Chuk un lenguaje de programación relativamente joven y con una gran orientación a la síntesis de audio, no goza de una fuerte popularidad en muchas facultades de arte o ingeniería. Por tal motivo, no existe en el mundo una inmensa comunidad de desarrolladores que compartan un amplio conjunto de librerías con enfoque estadístico matemático. Esta escasez de librerías de libre acceso hace que el desarrollo de este tipo de proyectos a partir de este lenguaje sea más largo y cuidadoso.

Para el desarrollo de este trabajo no fue conveniente hacer uso de todas las características fuertes extraídas a muestras de audio. Al extraer muchas variantes de energía de una muestra, desde cualquier técnica de extracción, se logran acercamientos importantes a la muestra original. Esta situación no es favorable para los objetivos de este trabajo, por lo tanto, se debe tener prudencia con la cantidad de características extraídas. 


Referencias

Aguaded Gomez , J. I., & Cabrero Almenara, J. (1995). Educacion y Medios de Comunicación en el contexto iberoamericano. Universidad de Huelva, Universidad de Sevilla, Universidad de Buenos Aires .

Banks, M. (2007). Using Visual Data in Qualitative Research. London: SAGE Publications Ltd.

Bowman, M. (1994). Using video in research. Spotlights. The Scottish Council for Research in Education, 3.

Bravo Ramos, J. L. (1996). ¿Qué es el vídeo educativo? Comunicar. https://doi.org/10.3916/25049

Calandra, B., Brantley-Dias, L., K. Lee, J., & Fox, D. (2009). Using Video Editing to Cultivate Novice Teachers’ Practice. Journal of Research on Technology in Education, 94.

Chicago, U. o. (s.f.). Data Research and Development Center (DRDC). Retrieved from http://drdc.uchicago.edu/what/video-research.html

Colombia, U. N. (2016). Sistema de Información de la Amazonia Colombiana. Retrieved from http://www.unal.edu.co/siamac/sig/metadatos1.html

Derry, S. (2012). The Video Mosaic Collaborative. Retrieved from http://www.wcer.wisc.edu/

Derry, S. J. ( 2007). Guidelines for video research in education. Recomendations for an expert panel. Chicago, Illinois: Data Research and Developement Center

Downing, M. (2008). Why Video? How Technology Advances Method. The Qualitative Report, 13(2), 173-177. Retrieved from https://nsuworks.nova.edu/tqr/vol13/iss2/3

Fernández, F. (2010). Estampas etnográficas de Yucatán. Mérida: Ediciones de la Universidad Autonoma de Yucatan.

Goldman, R., Pea, R., Barron, B., & Denny, S. (2006). Video Research in the learning sciences. Mahwah, New Jersey: Lawrance Erlbaum Associates.

Gómez , F. J. (2010). El analisis de textos audiovisuales: Significacion y sentido. Santander: Shangrilla.

Heras, A. I., & Miano, A. (2012). El lenguaje audiovisual en la investigación social y la comunicación pública del conocimiento. Ciencia, Público y Sociedad, 1, 18-40. Retrieved from https://www.aacademica.org/ana.ines.heras/89.pdf

Hernández, O. (1997). Construccion teorica metodologica de la antropologia visual. Antropologia visual (págs. 38-49). México: Universidad Nacional Autonoma de México. Retrieved from http://visa.ens-lyon.fr/visa

Hubert , K., Bernt , S., Raab , J., & Soeffner , H.-G. (2006). Vide- Analysis. Methodology and Methods. Frankfurt am Main, Berlin, Bruxelles, New York,Oxford, Wien: Peter Lang.

Jewitt, C. (2012). An Introduction to Using Video for Research. London: National Center for Research Methods. Institute of Education.

Kafai, Y., Sandoval, W., Enyedi, N., Scoth Nixon, A., & Herrera , F. (2004). Procedings of the Six International Conferences of the Learning Sciences. Embracing Diversity in the Learning Sciences (pág. 664). Santa Monica, CA: University of California Los Angeles .

Kikgöz, Y. (Octubre de 2011). A blended Learning study on implementing video recorded speaking tanks-based classroom instruction. TOJET: The Turkish Online Journal of Educational Technology, 10(4).

Kissmann, U. T. (2009). Video Interaction Analysis: Methods and Methodology. Frankfurt: PETER LANG .

Martínez, A. (2009). La antropología Visual. Madrid: SINTESIS.

Mehan, H. (1979). Learning Lessons: Social Organization in the Classroom. Cambridge: Harvard University Press.

Ojeda, J. I., Moreno , P., & Ramírez , T. M. (2015). Estudio microsocial y comunicativo de la actuación en la construcción del conocimiento en el aula universitaria. Ámbitos. Revista Internacional de Comunicación, 28. Retrieved from https://institucionales.us.es/ambitos/estudio-microsocial-y-comunicativo-de-la-actuacion-en-la-construccion-del-conocimiento-en-el-aula-universitaria/

Payant, C. (2014). Incoporating Video-Mediated Reflective Tasks in MATESOL Programs. TESL Canada Journal/ Revue TSL du Canada, 94.

Pink , S. (2001). Doing Ethnography: Images, Media and Representation in Research . London: London: Sage.

Raddon, M.B., Raby, R. & Sharpe, E. (2009). The Challenges of Teaching Qualitative Coding: Can a Learning Object Help? International Journal of Teaching and Learning in Higher Education, 21(3), 336-347. Retrieved from https://www.learntechlib.org/p/50998/

Ramírez, A., & Sanchez, P. A. (2015). El vídeo como herramienta de investigación educativa. Voces múltiples y mundos posibles. In III Encuentro Nacional sobre Comunicación y Juventud (pp. 302-312). Mérida: Universidad Autonoma de Yucatan.

Ramírez, J. R. (2015). Rasgar su piel par habitar sus huesos. In Encuentro Nacional de Investigadores de Colombia ENID (pp. 11-22). Manizales: Universidad de Manizales.

Sanchez Escobedo, P. A. (2014). Los profesores universitarios y las TIC: prescripciones de sus usos. In P. A. Sanchez Escobedo, Docencia y gestion en la educacion superior (p. 184). México: Pearson Educacion.

Schwartz, D. L., & Moore , J. L. (1994). Show how you know: A visual Medium for Demostrative Discourse. In Annual Meeting of the American Educational Research Association (p. 150). New Orleans: ERIC.

Sharpn J. Derry . (2007). Guidelines for Video Research in Education: Recomendations of an expert panel. (pp. 90). Chicago, Ilinois: Data Research and Development Center .

Standford, N. S. (7 de Noviembre de 2003). Talk Bank. Retrieved from http://talkbank.org/

Theureau, J. (2009). L’observatoire des cours d’action, des cours de vie relatifs à une pratique et de leurs articulations collectives et les traces de l’activité. In B. Cahour & C. Licoppe, (orgs.), Atelier "L'apport de la confrontation aux traces de sa propre activité (pp. 1-27). París: Telecom-Paritech,

Tiberghien, A., & Veillard, L. (2013). Instrumentation de la recherche en éducation. Paris: Éditions de la Maison des sciences de l’homme.

VISA. (2016). Vidéos de situations d'enseignement et d'apprentissage. Retrieved from http://visa.ens-lyon.fr/visa/presentation