Luis de Góngora y la fábula mitológica del Siglo de Oro: clasificación de textos y análisis léxico con métodos informáticos ensayo de Antonio Rojas Castro rojas.castro.antonio@gmail.com
Luis de Góngora, por Velázquez |
Resumen Tras la difusión de la Fábula de Polifemoy Galatea de Luis de Góngora en 1613, los poetas del siglo xvil expandieron las posibilidades poéticas de la mitología clásica y establecieron un diálogo con las Metamorfosis de Ovidio creando poemas épicos breves de estilo elevado. En este artículo se pretende conseguir tres objetivos: en primer lugar, describir en términos cuantitativos un corpus de 25 fábulas mitológicas escritas por poetas como Luis de Góngora, Lope de Vega, Francisco de Quevedo, Juan de Jáuregui o Villamediana, entre otros; en segundo lugar, clasificar los textos con el paquete Stylo teniendo en cuenta como medida las palabras más frecuentes; de esta manera, se espera comprobar la validez de la división entre poetas «oscuros» y poetas «claros». Por último, analizar el léxico a partir de las palabras clave generadas con AntConc y la frecuencia relativa de los cultismos léxicos obtenidas con R. Palabras clave cultismo léxico; estilometría; fábula mitológica; Juan de Jáuregui; Luis de Góngora; Lope de Vega Abstract Luis de Góngora and the mythological fable of the Golden Age: Classification of texts and lexical analysis using computer methods After the dissemination of Luis de Góngora’s Fábula de Polifemo y Galatea in 1613, a number of Spanish poets expanded the treatment of myths and established a dialogue with Ovid’s Metamorphoses. As a result of this process, a great amount of short epic poems was composed in the following years. This article aims to achieve three objectives: firstly, to describe in quantitative terms a corpus of 25 epyllia written by poets such as Luis de Góngora, Lope de Vega, Francisco de Quevedo, Juan de Jáuregui and Villamediana, among others. Secondly, the texts are classified using the Stylo package, which takes into account the most frequent words in an attempt to verify the traditional division between “dark” poets and “light” poets. Finally, the lexicon of these works is analyzed taking into consideration the keywords generated with AntConc, and the relative fTequency of learned borrowings obtained using R. Keywords learned borrowings; stylometry; epyllion; Juan de Jáuregui; Luis de Góngora; Lope de Vega Introducción Tomando como punto de partida la recepción de las Soledades en el siglo xvii, Dámaso Alonso identificó seis características del estilo de Góngora que cubren el léxico y la sintaxis: cultismos, alusiones mitológicas y fabulosas, hipérbaton, repetición de fórmulas estilísticas, léxico suntuario y colorista, e imágenes y metáforas (Alonso 1972). Estas características fueron estudiadas en los poemas previos a 1611 y en las obras consideradas «difíciles» —la Fábula de Polifemo y Galatea, las Soledades, la Fábula de Píramo y Tisbe, y el Panegírico al duque de Lerma—. La conclusión a la que llegó Alonso es que las características de la «poesía nueva» estaban presentes en los poemas anteriores a 1611; y, por tanto, la novedad de unos poemas que habían sido considerados «oscuros» no era cualitativa sino cuantitativa: Ninguna de las características de vocabulario, sintaxis, metáfora, hipérbole, colorismo, alusiones mitológicas, alusiones históricas, juego de palabras, etcétera, eran desconocidas en los versos del poeta anteriores a 1611. La diferencia es de cantidad; todos estos elementos están ahora acumulados, superpuestos, entrecruzados en una misma estrofa, tal vez en un mismo verso; cada uno de ellos multiplica sus propias dificultades por las de todos los otros dando al producto un aspecto que no puede revelar el análisis pormenorizado de cada uno de los factores. (Alonso 1972: 213 [la cursiva es mía]) El estilo de Góngora también fue estudiado por Robert Jammes (Góngora 1994) en la introducción a su edición de las Soledades. El investigador francés señaló más características como el uso frecuente de ciertas palabras (dar, aun, a pesar de y no), la eliminación de conjunciones o adverbios temporales, el uso del presente en lugar del pretérito perfecto para narrar, del pretérito en lugar del pluscuamperfecto, y del adverbio ya para referir tanto un momento pasado como presente. Ahora bien, para Jammes, el cultismo y el hipérbaton, que habían centrado la atención de la crítica, no eran las causas reales de la oscuridad; en realidad, esta se debía al carácter elusivo del poema y a la abundancia de conceptos[1]. Habida cuenta de todo esto, es posible afirmar que el estudio del estilo de Góngora se ha centrado en una serie de recursos expresivos que imitan el latín y que tienen por objetivo alejar los modos de expresión de la lengua comunicativa, de la prosa. Aunque Alonso y Jammes percibieron el estilo gongorino en términos cuantitativos —la frecuencia y el uso de una serie de palabras—, la poesía del cordobés o su influencia en otros poetas aún no han sido objeto de estudios estilométricos con métodos informáticos. Esta situación podría cambiar gracias al incremento del acceso a ediciones digitales y a herramientas de análisis textual producido en los últimos cinco años. En efecto, tras los trabajos pioneros de Marcos Marín (1994) e Irizarri (1997), la estilometría se ha convertido en unas de las líneas de investigación más innovadoras de las Humanidades Digitales (Calvo Tello 2016; Fradejas Rueda 2016). Por estos motivos, para estudiar el estilo de Luis de Góngora y su influencia, se ha creado un corpus de 25 textos[2]. Tras barajar algunos metros como la silva y géneros como el poema épico, se seleccionaron únicamente textos identificados tradicionalmente como fábulas mitológicas porque este género experimentó un revivalgracias a la Fábula de Polifemoy Galatea de Góngora. Por tanto, es previsible encontrar las características de su estilo en textos que son de autoría distinta. Como Juan Matas Caballero ha señalado, tras la difusión del Polifemo y las Soledades, «todos los poetas —apologistas y detractores— quedarían definitivamente gongorizados, y el destello literario del racionero cordobés terminó brillando con más o menos fortuna en todos los poetas que le siguieron» (2005a: 207). La monumental obra de José María de Cossío (1952)[3] y los trabajos más recientes de Mercedes Blanco (2010) y de Sofie Kluge (2014) nos proporcionan las bases para saber con seguridad qué textos pueden considerarse fábulas mitológicas, cuáles son sus características más importantes, y qué clases, estilos o subgéneros podemos distinguir: culto o gongorino, claro, burlesco, etc. Este renovado interés por parte de la crítica ha ido acompañado por la edición de algunos de los textos más importantes del género, tanto en formato impreso como digital, a diferencia, por ejemplo, del poema épico, menos accesible, a mi juicio, en términos editoriales. También hay que tener en cuenta que la extensión de la fábula mitológica es mucho mayor y, además, algo más homogénea, como se verá en el siguiente apartado, que la extensión de otros tipos de textos que recibieron el influjo gongo-rino como la silva. La selección de los textos, pues, estuvo guiada por la tradición crítica previa, el acceso a ediciones modernizadas y la representatividad, es decir, la búsqueda de un equilibrio entre la variedad y la uniformidad[4]. Así, pues, tras la lectura de la bibliografía mencionada, se buscaron ediciones impresas y digitales. Las fuentes impresas —la gran mayoría— fueron digitalizadas para obtener documentos en formato PDF; a continuación, estos documentos fueron procesados con FineReader, un programa de reconocimiento óptico de caracteres (OCR). De esta manera, se obtuvo un archivo de texto plano (TXT), que fue revisado y corregido teniendo en cuenta la fuente original. Por lo que respecta a las ediciones digitales, se utilizaron dos fuentes principales. Por un lado, la Biblioteca Virtual Miguel de Cervantes, de donde se obtuvieron las cuatro fábulas de Luis Barahona de Soto y de Jacinto Polo de Medina publicadas en formato HTML; por el otro, el Observatoire de la Vie Litéraire (OBVIL), el centro de Humanidades Digitales de la Universidad Paris-Sorbon-ne y Pierre et Marie Curie[5]. Este centro sirve como infraestructura al proyecto Pólemos dirigido por Mercedes Blanco para publicar en formato XML/TEI la poesía de Góngora y editar un centenar de textos del siglo xvii relacionados con la polémica gongorina originada tras la difusión de las Soledades. En concreto, los textos de Góngora descargados del OBVIL son la Fábula de Polifemo y Gala-tea, y la Fábula de Píramoy Tisbe editados por Antonio Carreira.
A fin de que los resultados expuestos aquí puedan ser reproducidos y evaluados por parte de estudiantes e investigadores (Fialho y Zyngier 2014), se ha publicado el corpus de fábulas mitológicas en la plataforma GitHub[6] De esta manera, se espera comprobar la validez de algunas clasificaciones tradicionales y proporcionar estadísticas sobre el uso del cultismo léxico[7] que nos permitan hacer comparaciones con otros textos y autores. Como se verá, en conjunto, se trata de un análisis que no requiere conocimientos informáticos avanzados ni una financiación cuantiosa para contratar programadores, pues se fundamenta en el uso de herramientas y lenguajes computacionales sencillos y de acceso gratuito. Descripción del corpus El corpus se compone de 25 fábulas mitológicas escritas en español por 14 poetas del Siglo de Oro. Se trata, por tanto, de un corpus monolingüe de 150.746 palabras que cubre un período temporal comprendido entre 1553 y 1664. Los textos fueron escritos en verso para ser leídos (en oposición al discurso oral), son de autoría única y segura (a excepción del Orfeo en lengua castellana atribuido a Lope de Vega), tienen una naturaleza ficticia, mitológica o legendaria, y desempeñan, por lo común, una función lúdica y, en menor medida, didáctica o metapoética. Coordenadas temporales El corpus tiene un arco temporal que va desde 1553 hasta 1664 (véase tabla 1 en los Anexos). Durante la Edad Media la mitología estuvo presente en la poesía española como ejemplo moral o adorno retórico —en forma de referencia, alusión o perífrasis—. Los primeros ejemplos de poemas épicos breves, que toman la mitología grecolatina como argumento, fueron cultivados por poetas renacentistas como Diego Hurtado de Mendoza o Gutierre de Cetina; estos poetas tradujeron el modelo clásico al castellano, pero el apogeo del género debe situarse tras la difusión de la Fábula de Polifemo y Galatea de Luis de Góngora (Matas Caballero 2005a; Blanco 2010). A partir de entonces los poetas, tanto los que se identificaron con la estética culta como los que se alinearon a favor de la claridad y la moderación de las novedades, cultivaron el género para homenajear los logros de la nueva poesía (Villamediana, Soto de Rojas), para proponer una alternativa culta (Jáuregui, Lope, Montalbán, Bocángel), o bien para parodiar una fórmula en ascenso asociada con el lenguaje culto (Polo de Medina). A la hora de fechar los textos, sin embargo, surgen varios problemas porque hay que distinguir entre fecha de composición, difusión y publicación impresa. Así, por ejemplo, la Fábula de Acisy Galatea de Carrillo y Sotomayor se imprimió póstumamente, en 1613, pero debió de escribirse antes de 1610. También sabemos que la Fábula de Polifemo y Galatea de Luis de Góngora se difundió en 1613, pero fue escrita un año antes, tal y como prueban algunos documentos de la época. Algo parecido pasa con la Fábula de Faetón de Villamediana; aunque se publicó impresa en 1629, Góngora le dedicó dos elogios, un soneto y una décima fechados por el manuscrito Chacón en 1617. Por último, Pedro Soto de Rojas escribió los Fragmentos de Adonis durante su juventud, hacia 1619 según de Cossío (1998: 113), pero no se imprimieron hasta mucho más tarde, en 1652. Contenido, metro y tamaño Los textos que componen el corpus declaran su adscripción genérica a través del título mediante una referencia al héroe o heroína mitológicos. El término «fábula», que a menudo acompaña al personaje, debe entenderse como «historia» o «leyenda» (Cristóbal López 2010); es decir, estos poemas fueron concebidos y leídos como narraciones opuestas a la verdad representada en el poema épico cristiano (Kluge 2014).
En los últimos años, algunos investigadores como Jesús Ponce Cárdenas (2004) y Mercedes Blanco (2010) han introducido el término «epilio» para referirse a este tipo de composiciones mitológicas. Pese a que no hay consenso sobre si el epilio existió como género literario en la Antigüedad, la propuesta ha ganado adeptos porque tiene la ventaja de oponer, de manera implícita, la fábula mitológica a la epopeya homérica y, asimismo, de emparentarla con el poema épico en miniatura, de extensión breve, cultivado por Calímaco (Kluge 2014).[8] El modelo de la mayoría de las fábulas son las Metamorfosis de Ovidio; en esta obra, el poeta sulmonés acumuló narraciones breves en un poema sin argumento unitario. En cambio, los poetas españoles llevaron a cabo un ejercicio de amplificatio y exploraron las posibilidades pictóricas y descriptivas de la fábula mitológica (Matas Caballero 2005a: 204). Con todo, tal y como se observa en la tabla 2 (véase en los Anexos), el poema ovidiano no es la única fuente de la fábula mitológica española. En efecto, Gutierre de Cetina se basó en una traducción al italiano de un cuento de Apuleyo para escribir La Psique y Bocángel tomó la Fábula de Leandro y Hero de Museo; Góngora imitó tanto a Ovidio como a otros poetas italianos de la época (Stigliani, Marino); Lope se inspiró en el poema de Ovidio, pero también en la Odisea de Homero; y Montalbán tuvo presente las Metamorfosis y las Geórgicas de Virgilio[9]. Otros poetas, como Espinosa y Lope de Vega, inventaron temas nuevos tomando como ejemplo la mitología para explicar el origen de un río o de la rosa blanca. En cualquier caso, si los poetas renacentistas tradujeron o parafrasearon el modelo italiano o latino, a partir del Polifemo de Góngora, los ingenios de la época se distanciaron del modelo clásico, interpretaron el mito a su manera y transformaron la materia en un poema heroico (Blanco 2010: 37). El número de versos varía de manera considerable (véase la tabla 2). La Fábula de Apolo y Dafne de Francisco de Quevedo consta solo de 110 versos mientras que La Circe de Lope de Vega llega a los 3.312 versos, siendo el promedio de 1.022 versos. Al parecer, Góngora prefiere la brevedad —el Polifemo consta de 504 versos y la Fábula de Píramoy Tisbe, de 508— mientras que sus imitadores y rivales tienden a agrandar el poema hasta el punto que llega a confundirse con la epopeya. Esto se consigue mediante la inserción de pequeñas historias mitológicas en el marco de la fábula como hace Villamediana en El Faetón y Pedro Soto de Rojas en los Fragmentos del Adonis, o bien extendiendo los discursos de los personajes y los pasajes con carácter simbólico —el descenso a los Infiernos, por ejemplo— como lleva a cabo Jáuregui en el Orfeo, Montalbán en el Orfeo en lengua castellana o Lope de Vega en La primera parte de la Filomena y en La Circe. Es por este motivo que estas composiciones de mayor extensión —salvando las fábulas de Villamediana— se dividen en cantos, fragmentos o partes. Gracias a R, un lenguaje de programación utilizado para llevar a cabo cálculos estadísticos, se ha podido averiguar que el corpus se compone de 150 746 palabras o tokens. En cuanto al número de tokens por texto, en general, se confirman los resultados ya expuestos: la Fábula de Apolo y Dafne de Quevedo es el texto más breve, mientras que La Circe es el texto de mayor extensión (véanse la tabla 3 y la figura 1); por lo demás, el promedio es de 6030 tokens. En cuanto al metro, sin duda, predomina la octava real (véanse la tabla 2 y la figura 2); en concreto, 15 de los 25 textos están escritos en este molde. Esta estrofa procedía de la ottava rima italiana, era el cauce estrófico culto y había sido utilizada tradicionalmente para la poesía épica. Además, cada octava tiene la ventaja de funcionar de manera independiente, es decir, goza de cierta unidad temática (Matas Caballero 2005b: 166). Con todo, no es la única estrofa presente en el corpus: Barahona de Soto utilizó la décima, Francisco de Quevedo escogió la quintilla, Góngora y Polo de Medina prefirieron el romance para sus fábulas burlescas y, a partir de la difusión de las Soledades, la silva también fue cultivada por Soto de Rojas, Villamediana y Polo de Medina. Por último, hay que señalar que Lope escribió la Segunda parte de la Filomena en octava y en silva. Ratio Type-Token La ratio Type-Token es una medida utilizada para calcular la variedad léxica de un texto; por lo general, se entiende que una ratio baja significa que el texto repite muchas palabras y, por tanto, es poco variado o rico desde un punto de vista léxico. Para calcular la ratio entre palabras únicas y palabras en total, se obtiene el número de palabras únicas (types) de cada texto y este se divide por el número de palabras en total (tokens); a continuación, se multiplica por 100 para obtener un porcentaje. Por lo común los textos cortos son los más variados; es decir, a medida que la extensión crece, la repetición incrementa. En este sentido, es lógico que el texto más breve —la Fábula de Apolo y Dafne de Quevedo— sea el que tenga un léxico más variado (52,885%). Ahora bien, tras el poema de Quevedo, no sigue el segundo texto más breve, la Fábula del Genil de Espinosa, como sería espera-ble, sino la Fábula de Píramo y Tisbe con una ratio de 49,8%. Esta fábula —la tercera más breve si tenemos en cuenta los tokens— es un texto híbrido, serio y a la vez burlesco, de estilo culto y a la vez bajo, que pone en relación campos semánticos muy dispares. Por esta razón, no es extraño que supere al texto de Espinosa en cuanto a riqueza léxica. Clasificación de los textos La fábula mitológica española ya ha sido objeto de periodización y clasificación por parte de historiadores y críticos literarios. Las propuestas se suelen centrar en la cronología o bien en la semejanza o desemejanza entre los textos. Para empezar, se puede adoptar el clásico esquema tripartito correspondiente al origen, a la plenitud y a la decadencia del género (López Cristóbal 2010). Así, los poetas medievales y renacentistas pondrían las bases, traduciendo, parafraseando o imitando el modelo clásico; a ellos sucederían los poetas barrocos que, con Góngora a la cabeza, interpretarían el mito de manera personal para engendrar poemas de estilo elevado; por último, los poetas neoclásicos volverían a la sobriedad renacentista y representarían el declive del género. Ahora bien, tal y como los formalistas rusos señalaron a inicios del siglo pasado, dentro de la diacronía se pueden distinguir sistemas estables, es decir, porciones de sincronía[10]. Tal es la perspectiva de los trabajos dedicados a investigar la fábula mitológica del Siglo de Oro en el contexto de la polémica gongorina. Tras la difusión de la Fábula de Polifemo y Galatea, y de las Soledades de Luis de Góngora en 1613, se produjeron una serie de reacciones por escrito que emanan de Lope de Vega y sus seguidores —desde pequeños poemas satíricos, pasando por cartas más o menos privadas dirigidas a Góngora, panfletos que oscilan entre la sátira y la crítica literaria, hasta tratados que, sin duda, fueron escritos en contra de la «poesía nueva»—. En este laberinto de documentos, la figura de Juan de Jáuregui brilla con especial intensidad debido al Antídoto contra la pestilente poesía de las «Soledades» (Jáuregui 2002). Con esta obra el poeta sevillano se posicionó en el campo literario del siglo xvii como enemigo incontestable de la poesía culta debido la abundancia de novedades y a la falta de adecuación entre tema y estilo. Diez años más tarde, Jáuregui volvió a intervenir en la polémica por partida doble, con un Discurso poético (Jáuregui 2016), una obra de índole crítica y menos satírica que la anterior, y con una fábula mitológica, el Orfeo (1624). A través del Discurso, Jáuregui pretendía situarse en un lugar intermedio entre los poetas «oscuros» y los «claros» (Matas Caballero 2005a), y promover como ideal la «dificultad perspicua», esto es, la dificultad que surge, no de las palabras extrañas, cultas o nuevas, sino de los pensamientos profundos y graves[11]. Por su parte, el Orfeo debía encarnar las ideas defendidas en el Antídoto y en el Discurso poético; la fábula tenía un argumento y un héroe reconocible, y el estilo era elevado y homogéneo (sin bromas ni chistes). Ahora bien, el poeta sevillano también usó términos plebeyos y algunos cultismos poco frecuentes; en consecuencia, los lectores de la época vieron en la fábula una contradicción con lo que había manifestado en el plano teórico. A partir de entonces, Jáuregui pasó de ser considerado un «enemigo» de la poesía de Góngora a un «converso» y, por este motivo, se convirtió en la diana de los ataques de los poetas «claros». El ejemplo más evidente de estos ataques es el Orfeo en lengua castellana, que replica —y corrige— desde el título el Orfeo del poeta sevillano. Esta obra, como se ha dicho, fue publicada por Juan Pérez de Montalbán, aunque los lectores de la época la atribuyeron a Lope. Tras este breve repaso sobre la polémica gongorina es posible afirmar que los historiadores y críticos literarios han distinguido tres modelos de la fábula mitológica del Siglo de Oro: en primer lugar, Góngora y sus imitadores —los poetas «oscuros»—; en segundo lugar y en el polo opuesto, Lope y sus seguidores —los poetas «claros»—; por último, en una posición intermedia, Jáuregui y su Orfeo —poeta de la «dificultad perspicua»—. Para comprobar la validez de esta clasificación se ha llevado a cabo una clasificación con el paquete Stylo escrito en lenguaje de programación R.[12] La herramienta Stylo (Eder et al. 2017) proporciona los principales métodos en el campo de la estilística computacional a través de una interfaz gráfica de usuario (GUI, por sus siglas en inglés); en consecuencia, no es necesario escribir código para realizar las operaciones. Aunque existen una amplia variedad de modelos estadísticos para clasificar textos, como la distancia euclidiana, desde los inicios de la década pasada, se considera más apropiado el árbol de consenso (Consensus Tree) cuando el objetivo no es confirmar la autoría de un texto sino realizar un análisis estilométrico. El árbol de consenso se diferencia del dendrograma en que no representa un solo resultado, sino que combina la información derivada de múltiples dendrogramas en uno solo (Eder 2015). Con Stylo se crea una lista de todas las palabras utilizadas en el corpus y se obtiene la frecuencia normalizada con z-scores[13] de cada uno de los textos. A continuación, Stylo compara los resultados de cada texto por separado y lleva a cabo distintos análisis en función del método estadístico seleccionado; por último, presenta las distancias obtenidas en forma de diagrama. Para obtener el árbol de consenso basado en el corpus de fábulas mitológicas, se seleccionó «texto plano» (TXT) como input, y un rango de palabras más frecuentes que va desde 100 hasta 1000 con un incremento de 100 palabras, sin eliminar pronombres —lo que se conoce como culling en el argot de la estilometría—, y tomando en consideración los textos de manera íntegra. Es decir, la herramienta crea un dendrograma para las palabras más frecuentes situadas en el rango 1-100, luego otro dendrograma para las palabras más frecuentes en el rango 101-200, y así sucesivamente hasta llegar a 1.000. Los dendrogramas obtenidos, finalmente, se combinan y el resultado es un árbol de consenso. Es decir, un diagrama con los valores «consensuados». En cuanto al método estadístico, tras probar Classic Delta con resultados insatisfactorios, se seleccionó la adaptación llamada Eder’s Delta. En ambos casos, se normalizan las frecuencias de palabras con z-scores, pero Classic Delta (Burrows 2002) está pensado para utilizarse con textos ingleses mientras que Eder’s Delta es más adecuado para las lenguas aglutinantes (Eder et al. 2013). Como se puede ver en la figura 3, el árbol de consenso obtenido clasifica los textos no en tres grupos, como era esperable si tenemos en cuenta la historiografía literaria, sino en cuatro[14]. Es fácil darse cuenta de que esta metodología nos ofrece una clasificación más compleja y rica, pues nos ayuda a superar categorías dicotómicas. Para empezar, la oposición entre poetas «claros» y «oscuros» no es tan nítida como se presume. En primer lugar, encontramos un grupo de textos que pueden identificarse como renacentistas (Cetina, Hurtado de Mendoza, Barahona de Soto); sin embargo, en este grupo aparecen también las fábulas de Espinosa, Quevedo y Polo de Medina, que son posteriores cronológicamente, y utilizan un lenguaje más poético. En segundo lugar, las fábulas de Lope de Vega y de Pérez de Montalbán forman un grupo independiente respecto a las fábulas de Cetina y Hurtado de Mendoza. Es decir, por un lado, se confirma la relación entre Lope y Montalbán, pero, por el otro, es posible ver la singularidad de este grupo de textos respecto a las fábulas renacentistas consideradas ejemplo de «claridad». En tercer lugar, se manifiesta la similitud de las fábulas cultas escritas por Góngora, Carrillo, Soto de Rojas, Jáuregui y Bocángel. Hay que destacar que el Orfeo de Jáuregui aparece en el grupo de Góngora, lo que vendría a probar la opinión de sus detractores y críticos que veían en la fábula una especie de conversión al bando de la «poesía nueva». Por último, quizás lo más sorprendente sea descubrir que las fábulas de Villamediana no aparecen en el grupo en donde se encuentran las de Góngora, sino en otro distinto, independiente, autónomo. Esto es especialmente interesante, porque tradicionalmente se ha considerado a Villamediana como un mero imitador de la poesía del cordobés. En resumen, el árbol de consenso nos permite superar la división dicotó-mica entre poesía «clara» y poesía «oscura», y poner en duda la originalidad de Jáuregui, que, como se va visto, quiso cultivar un modelo alternativo al de Góngora, pero acabó sucumbiendo al influjo de la lengua poética del cordobés. Por el contrario, las fábulas de Villamediana parecen más originales de lo que a menudo creemos. Asimismo, nos permite confirmar una serie de relaciones de semejanza, que se conoce desde hace tiempo, entre la Fábula de Leandro y Hero de Bocángel y del Orfeo de Jáuregui, y el parentesco entre los textos de Lope de Vega y del Orfeo en lengua castellana de Pérez de Montalbán. Análisis léxico Gracias al paquete Stylo es posible clasificar un corpus de textos en grupos, y, por tanto, defender el parentesco y la similitud entre varias fábulas mitológicas. Ahora bien, los árboles de consenso no nos ayudan a entender en qué se diferencian los cuatro grupos ni a estudiar la huella gongorina en el corpus de fábulas. Para profundizar más en esta cuestión, se ha dividido la colección de textos en cuatro sub-corpus correspondientes a los cuatro grupos formados con el método Eder’s Delta; la distribución de textos es la siguiente: — Sub-corpus A (21 383 tokens): Fábula de Adonis, Hipómenesy Atalanta, La Psique, Fábula de Vertumno y Pomona, Fábula de Acteón, Fabula del Genil, las dos fábulas de Apolo y Dafne (Quevedo y Polo de Medina), y Fábula de Pan y Siringa. — Sub-corpus B (59 362 tokens): Primera parte de la Filomena, Segunda parte de la Filomena, La Andrómeda, La Circe, La rosa blanca, y Orfeo en lengua castellana. — Sub-corpus C (46 155 tokens): Fábula de Acis y Galatea, Fábula de Polifemo y Galatea, Rayos de Faetonte, Fábula de Píramo y Tisbe, Fragmentos de Adonis, Orfeo, y Fábula de Leandro y Hero. — Sub-corpus D (23 847 tokens): Fábula de Faetón, Fábula de la Fénix, Fábula de Europa y Fábula de Apolo y Dafne. Teniendo en cuenta esta distribución, se ha explorado el léxico de los cuatro sub-corpus desde dos perspectivas complementarias: por un lado, se ha utilizado la herramienta AntConc para obtener una lista de palabras clave utilizando el test Log likelihood; por el otro, se ha obtenido la frecuencia relativa de los cultismos léxicos con R. Palabras clave Sabemos que las fábulas son idilios amorosos con episodios de metamorfosis, pero ¿es posible averiguar qué palabras caracterizan cada uno de los textos? Las palabras clave, es decir, aquellas palabras estadísticamente significativas en tanto que aparecen más de lo esperado, teniendo en cuenta únicamente el azar como factor, en comparación con otro corpus (McEnery y Wilson 2004: 8485) sirven precisamente para encontrar la singularidad de cada texto o grupo de textos en términos cuantitativos. Por ejemplo, en el sub-corpus A la palabra que tiene una frecuencia relativa de un 4,15%; imaginemos que, en el corpus de referencia formado por los sub-corpus B, C y D, la misma palabra tuviera una frecuencia relativa de un 5%. En tal caso, como es obvio, la palabra que no sería una palabra clave del sub-corpus A. Para obtener las palabras clave, pues, se necesita un corpus de referencia y un método estadístico, como el test Log likelihood o Chi-square, que determine si existe una diferencia significativa entre la frecuencia esperada y la frecuencia observada[15]. En la herramienta AntConc, tras cargar los archivos que se quieren analizar y los archivos que servirán como corpus de referencia, es posible generar una lista de palabras más frecuentes y elegir el método con el que se desea obtener la lista de palabras que estadísticamente son inesperadas. En el caso de las fábulas mitológicas se realizó esta operación cuatro veces con el test Log likelihood: en primer lugar, se comparó A con los sub-corpus B, C y D; en segundo lugar, B con los sub-corpus A, C y D; en tercer lugar, C con los sub-corpus A, B y D; y, finalmente, D con los sub-corpus A, B y C. En cada caso, la lista de palabras clave generada puede guardarse en un archivo de texto plano. Las tablas 4 y 5 muestran las 25 palabras clave más significativas en los sub-corpus A, B, C y D. Sub-corpus A: la fábula mitológica y el petrarquismo Al margen de la conjunción copulativa y, lo que caracteriza al sub-corpus A es un fuerte componente del yo poético como se puede inferir de los pronombres personales yo y me. Si se inspeccionan las concordancias en AntConc es fácil observar que ambos términos aparecen en los fragmentos de discurso citado y, a menudo, remiten a la poesía petrarquista asociados a metáforas típicas del discurso amoroso, la milita amoris y la belleza femenina. Asimismo, sobresalen el sustantivo Señora, muy connotado de petrarquismo, los verbos de movimiento como correr e ir, pero también otros como vido y querer. Más previsible es la aparición de los nombres propios de los héroes y heroínas (Psique, Pan, Siringa, Hipómenes y Acteón) que protagonizan las fábulas. Los términos Apolo y Dafne aparecen en los puestos 622 y 3.159, respectivamente; esto puede deberse a que en el corpus de referencia hay otras fábulas sobre este mito y, por tanto, no son estadísticamente relevantes. Sub-corpus B: la fábula mitológica y lo heroico En este sub-corpus son importantes los nombres propios de los héroes y heroínas; Circe, Ulises, Filomena, Progne aparecen en lo más alto de la lista, mientras que el resto de personajes —Orfeo, Eurídice, Andrómeda, Perseo, Tereo— se sitúan un poco más abajo. Asimismo, se observa el predominio del pronombre relativo que, por lo que se deduce un uso abundante de frases subordinadas, y del adverbio como utilizado en construcciones comparativas. Como en el sub-corpus A, destacan los pronombres personales yo y me, también muy presentes en los discursos citados; no obstante, consultando las concordancias de AntConc, es posible averiguar que, si bien el pronombre me se asocia al vocabulario de las pasiones, el término yo es usado en situaciones narrativas en las que los personajes relatan acciones pasadas o bien sus intenciones futuras. Vuelven a aparecer aquí varios términos asociados con la tradición petrarquista y con el tema amoroso como amor, hermosura o mujer. Desde mi punto de vista, lo más sorprendente es el sustantivo tordo; esta ave es relevante estadísticamente porque no acostumbra a aparecer en la fábula mitológica. Sin embargo, en La segunda parte de la Filomena cumple un rol muy importante ya que se escenifica un torneo de cantos entre Filomena y un tordo, identificado con Torres Rámila, el autor de la Spongia. Por último, hay que señalar la ocurrencia de una serie de términos —mar, nave y Troya— que remiten a la epopeya homérica. Sub-corpus C: la fábula mitológica y el orfismo Lo más característico de estos textos es el uso del pronombre personal se, del adjetivo posesivo su y del artículo determinante el. Los tres términos aparecen en fragmentos en que la voz poética narra la acción llevada a cabo por los héroes y heroínas, por algunos agentes naturales o incluso conceptos. Es decir, en este sub-corpus la acción no es narrada, por lo general, por un personaje a diferencia de los sub-corpus A y B, aunque también haya discursos citados. Asimismo, destacan el adjetivo veloz, los sustantivos pasos, acción, discurso —aunque este último puede remitir tanto al fluir del agua como a un parlamento— y los verbos llega y halla; todos estos términos denotan movimiento y dinamismo. Puesto que los personajes se mueven en una dirección precisa, para alcanzar otro lugar, el espacio también cobra relevancia a través de los términos do y sitio. Con los términos amante, apetito y Cupido se hace referencia, por lo general, a situaciones eróticas o amorosas; el hijo de Venus personifica un concepto abstracto para que intervenga en la fábula como un agente con voluntad propia. También debo señalar la ocurrencia del sustantivo labio; este término es usado de manera ambivalente, según parece consultando las concordancias de AntConc, pues el contexto en que aparece remite, por un lado, a la belleza femenina, y, por el otro, a situaciones en que los instrumentos musicales cobran relieve. Por último, en este sub-corpus aparecen en los primeros puestos los nombres propios de los protagonistas (Adonis, Leandro y Hero) de las fábulas de Soto de Rojas y de Bocángel. Por el contrario, Píramo se sitúa en el puesto 53, Tisbe en el 152, y Galatea en el 170; y no aparecen ni Orfeo ni Polifemo. Este fenómeno se explica porque el sub-corpus B contiene una fábula sobre el mito órfico y porque Góngora casi nunca nombra de manera directa a sus personajes. Así, en la Fábula de Polifemo y Galatea, el término Galatea aparece 10 veces y Polifemo solo 4; y en la Fábula de Píramo y Tisbe, el término Píramo tiene 9 ocurrencias y Tisbe solo 6. Sub-corpus D: la fábula mitológica y lo sagrado Las palabras clave de los textos de Villamediana contrastan con las de los tres sub-corpus previos porque en las posiciones superiores no encontramos pronombres personales ni verbos. En general, predominan términos de una longitud mayor de lo habitual. Son sustantivos y adjetivos y, en menor medida, adjetivos relativos posesivos (cuya). De entre ellos, destacan los nombres asociados con la luminosidad como luz y rayos, así como los sustantivos y adjetivos con los que se describe el aspecto de objetos, materiales y astros como ardiente, forma, elemento, materia, y blando. También se puede distinguir el campo semántico de lo elevado como sublime y tributo, y de lo sagrado a partir de los términos inmortal, eterna, eterno, deidad y sacro. Como ya se ha dicho, los adjetivos en este sub-corpus son muy importantes. En primer lugar, el adjetivo feliz resulta peculiar porque el contexto en que aparece revela que no suele determinar a personas sino a ideas como el alma, la constancia, la propagación, el vuelo, la fatiga, la patria, o el origen. En segundo lugar, el adjetivo alado suele calificar a deidades como el Euro y Júpiter o formar parte de una perífrasis como ciego alado o dios alado —mientras que la forma femenina, alada, se emplea con distintas entidades, no solo mitológicas—. En tercer lugar, el adjetivo undoso es utilizado de una manera similar a la de Góngo-ra en las Soledades: para aludir el agua o el mar. Por último, el adjetivo volante se utiliza para caracterizar dos aves mitológicas —el Fénix y el águila de Júpiter—, pero también el arpón de Cupido. En cuanto a los nombres propios, Tetis es el único que aparece entre las primeras 25 palabras clave; esto es significativo porque el corpus de fábulas mitológicas reunido aquí no contiene ninguna fábula sobre este personaje mitológico. El contexto en que aparece, como es lógico, es siempre el océano, aunque también se utiliza para aludir a alguna de sus hijas, según se deduce de las concordancias generadas con AntConc. En contra de lo esperable, los nombres propios de los héroes de las fábulas de Villamediana solo aparecen en posiciones muy bajas —Dafne en la 61, Europa en la 303, Fénix en la 529, Faetón en la 272 y Apolo en la 1066—. Por último, es importante la ausencia de términos amorosos; las fábulas de Villamediana —a excepción de la de Apolo y Dafne— no son idilios amorosos, centrados en dos amantes, sino poemas sobre acciones extraordinarias. Frecuencia relativa de cultismos léxicos La lista de palabras más frecuentes de cada sub-corpus, a priori, debería darnos una buena idea sobre el léxico predominante. Ahora bien, puesto que la proporción de cada sub-corpus es distinta, no basta con obtener la frecuencia absoluta de las palabras, esto es, el número total de tokens. La razón es que cuando hay disparidad de tamaño, la frecuencia absoluta de una palabra en un texto, aunque sea mayor que en otro texto, puede tener, en realidad, una ratio menor. Por tanto, un simple recuento aritmético no es válido si se quiere realizar comparaciones (McEnery y Wilson 2004: 83). Para calcular la frecuencia relativa es necesario dividir el número de ocurrencias de una palabra por el número de palabras en total y, si se quiere facilitar la lectura, multiplicar por 100 para obtener un porcentaje. Con el programa R esta operación es muy sencilla. Tras definir la ruta en donde se halla el archivo que se quiere analizar, las mayúsculas se transforman en minúscula y se eliminan los espacios y la puntuación; a continuación, se ponen los datos en una tabla y se ordenan los valores, por ejemplo, de mayor a menor; por último, se divide las frecuencias absolutas por el total y se multiplica por 100. La tabla 6 muestra la frecuencia relativa de las primeras 25 palabras más utilizadas. Un examen superficial del contenido de la tabla sugiere que las palabras más frecuentes en los cuatro sub-corpus son de tipo gramatical —y, que, de, la, con, no, por, a, etc.—. Observando la frecuencia relativa de estas palabras (function words, en inglés) es posible inferir algunas preferencias sintácticas como el uso de frases subordinadas relativas, copulativas, adversativas, etc., pero siempre conviene distinguir entre ocurrencia y uso; en otras palabras, la vuelta al texto, a la lectura en detalle, a través de unas concordancias, es obligatoria para saber en qué contexto aparece un término en concreto y validar nuestra hipótesis. En cambio, las palabras con carga semántica se sitúan en la parte inferior de la tabla. Así, en el sub-corpus A las palabras me —con un poco más de peso semántico que las palabras gramaticales— aparece en la posición 23; en el sub-corpus B, las palabras amor y mi se sitúan en el puesto 20 y 25; en el sub-corpus C las únicas palabras relevantes que destacan son es, en la posición 23, y voz, en la posición 24. Por último, en el sub-corpus D, la primera palabra con carga semántica —luz— aparece en el puesto 18. La frecuencia relativa de las palabras más utilizadas solo puede darnos una idea muy abstracta y aproximada del tipo de textos que pretendemos analizar. Por el contrario, puede ser útil cuando queremos descubrir la ocurrencia de una palabra en concreto; tal es el caso de los cultismos, es decir, préstamos de una lengua culta como el latín, el griego o el italiano utilizados por los poetas para llamar la atención sobre la forma. Como es sabido, Pedro de Valencia (2000) y Francisco Fernández de Córdoba (2015) censuraron la frecuencia de palabras «peregrinas» o «forasteras» en la Fábula de Polifemo y Galatea y, sobre todo, en las Soledades[16]. El uso de palabras procedentes del latín en textos españoles es característico de la poesía de los siglos xvi y xvii; en este sentido, como Dámaso Alonso (1972: 137-139) defendió, el papel de Góngora se reduce a recoger y difundir muchas palabras cultas introducidas en la lengua poética anterior por parte de autores medievales (Alfonso el Sabio, Juan de Mena), renacentistas (Boscán, Garcilaso de la Vega) y manieristas (Fray Luis de León, Herrera, Medrano). Para identificar los cultismos, los estudiosos han recurrido a las traducciones renacentistas de obras como la de El cortesano de Boscán, a la primera documentación literaria o lexicográfica, a la frecuencia de uso y, por último, a las censuras (Herrero Ingelmo 1994). El principal problema a la hora de estudiar el cultismo en la poesía de Góngora es que estas palabras, «peregrinas» o «forasteras», se volvieron corrientes con el paso del tiempo y a nosotros, como lectores del siglo xxi, nos cuesta mucho reconocerlas como extrañas al repertorio lingüístico del Siglo de Oro. De ahí que se deba acudir a los testimonios condenatorios y a algunos textos paródicos de la época para estudiar el cultismo. Para nuestra fortuna, Alonso (1972: 136) recogió 50 cultismos léxicos pertenecientes a la Soledad primera; además, añadió otras palabras consideradas cultismos realzados por el hiato como ingenioso, viola, violencia e inquieta. Al manejar la lista hay que ser muy prudentes porque muchos de los cultismos están documentados en el siglo xvi —a menudo aparecen en la poesía de Garcilaso de la Vega— y porque no incluye ni los cultismos léxicos, identificados posteriormente por Robert Jammes (Góngora 1994), ni los cultismos semánticos conocidos hasta la fecha. Sin embargo, creo que puede ser un buen punto de partida para estudios más exhaustivos que contemplen otro tipo de fuentes (diccionarios históricos) y géneros literarios (novela y teatro). A fin de estudiar la huella de Góngora —o, mejor dicho, de las Soledades— en el corpus de fábulas mitológicas del siglo xvii se ha obtenido la frecuencia relativa de los 56 cultismos[17]. La tabla 7 muestra los valores obtenidos en los sub-corpus A, B, C y D. Ahora bien, puesto que estos valores no cobran significancia si no es en comparación con las Soledades, se ha añadido una columna con la frecuencia relativa de los lemas en el poema que generó las censuras y que, hipotéticamente, los poetas imitaron. El promedio de cultismo léxicos en este caso es de 0,027% y la desviación típica es de 0,025%. En primer lugar, los textos del sub-corpus A —Fábula de Adonis, Hipómenes y Atalanta, La Psique, Fábula de Vertumnoy Pomona, Fábula de Acteón, Fabula del Genil, Fábula de Apolo y Dafne, Fábula de Pan y Siringa— son los que tienen una frecuencia relativa de cultismos léxicos más baja: un promedio de 0,001% y una desviación típica de 0,004%. De hecho, únicamente se han encontrado 10 de los 53 lemas: fugitivo, cerúleo, ilustre, líquido, aura, cándido, cítara, culto, esfera y aplauso. Por tanto, es posible afirmar que en este sub-corpus los cultismos léxicos son poco significativos. En segundo lugar, se observa un ligero incremento en sub-corpus B —Primera parte de la Filomena, Segunda parte de la Filomena, La Andrómeda, La Circe, La rosa blanca, Orfeo en lengua castellana— con un promedio de 0,07% y una desviación típica de 0,013%. En este caso se han encontrado 29 de los 53 lemas. Los 10 más frecuentes son: cándido, esfera, ilustre, trémulo, fugitivo, coturno, purpúreo, céfiro, aplauso y líquido. El incremento de cultismos léxicos es significativo, pero está muy lejos de alcanzar las Soledades. En tercer lugar, en el sub-corpus C —Fábula de Acis y Galatea, Fábula de Polifemo y Galatea, Rayos de Faetonte, Fábula de Píramo y Tisbe, Fragmentos de Adonis, Orfeo, Fábula de Leandro y Hero— se observa un incremento considerable: el promedio es de 0,013% y la desviación típica es de 0,016%; es decir, el uso de cultismos léxicos es casi el doble que en el sub-corpus B. En este caso se encuentran 48 de los 53 lemas. Los 10 cultismos léxicos más frecuentes son: cándido, esfera, culto, ostentar, coturno, fugitivo, esplendor, ministrar, líquido, y céfiro. Por último, el sub-corpus D —Fábula de Faetón, Fábula de la Fénix, Fábula de Europa y Fábula de Apolo y Dafne— es el que tiene un promedio (0,023%) y una desviación típica mayor (0,025%); en otras palabras, las fábulas de Villa-mediana contienen una proporción muy semejante a la de las Soledades de Gón-gora. Por lo demás, en este sub-corpus se encuentran 47 de los 53 lemas. Los 10 cultismos léxicos más frecuentes son: líquido, cándido, culto, esfera, fugitivo, alterno, esplendor, aplauso, émulo y meta. Los datos obtenidos confirman un uso mayor de cultismos por parte de los poetas considerados «cultos» u «oscuros» —sub-corpus C y D—. Sin embargo, aunque la huella de Góngora se percibe en todos los textos posteriores a la Fábula de Polifemo y Galatea —un ejemplo de ello son los cultismos léxicos del sub-corpus B con textos de Lope de Vega—, destaca la frecuencia relativa de cultismos léxicos del sub-corpus D. Se puede afirmar, pues, que, al menos en lo que respecta al uso del cultismo léxico y en contra de lo esperado, las fábulas de Villamediana se parecen más a las Soledades que las fábulas contenidas en el sub-corpus C, aunque incluya dos fábulas de Góngora. En este sentido, los textos de Villamediana son innovadores porque se apartan del modelo del Poli-femo, que en el fondo es un idilio amoroso, y transfieren las novedades del otro gran poema gongorino al género de la fábula mitológica. Esta transferencia, por último, también podría explicar por qué en el árbol de consenso las fábulas de Villamediana no se agruparon con el Polifemo y la Tisbe de Góngora. Conclusiones Con este artículo se ha pretendido estudiar el estilo de Luis de Góngora y su influencia en el género de la fábula mitológica. Se ha creado un corpus de 25 poemas escritos por 14 poetas de los siglos xvi y xvii. La selección de los textos se ha fundamentado en la tradición crítica previa y en el acceso a ediciones modernizadas; también se ha buscado un equilibrio entre la variedad y la uniformidad. La obtención de los textos ha seguido dos caminos: por un lado, las fuentes impresas han sido escaneadas y procesadas con el programa FineReader para obtener archivos digitales en formato TXT; por el otro, las fuentes digitales publicadas en HTML o bien XML/TEI se han transformado en archivos TXT usando hojas XSLT. No hace falta decir que la tarea hubiera sido mucho menos laboriosa si las ediciones de nuestros clásicos se publicaran en abierto y en formato estándar. El resultado de este proceso ha sido un corpus monolingüe de 150 746 tokens. La colección de textos tiene especial importancia porque contiene una muestra representativa de las fábulas mitológicas compuestas durante la polémica gongorina. Por lo general, estas pueden caracterizarse como poemas épicos, más o menos breves, que dialogan con las Metamorfosis de Ovidio. Para clasificar los textos se ha utilizado el algoritmo Eder’s Delta a fin de crear un árbol de consenso. Este diagrama combina múltiples dendrogramas por lo que el resultado se presume más fiable, pero también más complejo y difícil de interpretar. Lo más llamativo de esta clasificación es que no es dicotómica porque el modelo estadístico utilizado es capaz de identificar cuatro grupos de textos. Además, nos ha permitido descubrir que las fábulas de Villamediana forman un grupo autónomo e independiente respecto a las fábulas de Góngora, y confirmar, por un lado, las relaciones de semejanza entre el Orfeo de Jáuregui, las fábulas del poeta cordobés, y la Fábula de Leandro y Hero; y, por el otro lado, el parentesco entre los textos de Lope de Vega y el Orfeo en lengua castellana de Pérez de Montalbán. A continuación, se han llevado a cabo dos análisis complementarios del léxico a fin de profundizar en la singularidad de los poemas. Las palabras clave nos han ayudado a caracterizar los cuatro grupos identificados previamente con el árbol de consenso. Se ha observado, en primer lugar, que en las fábulas mitológicas renacentistas predominan formas en primera persona del singular, verbos de acción y varios términos de tradición petrarquista; en segundo lugar, que en las fábulas escritas por Lope de Vega son relevantes, desde un punto de vista estadístico, los nombres propios de los personajes, algunos términos con función metapoética como tordo, y las palabras que remiten a la epopeya homérica; en tercer lugar, que en los textos asociados con Góngora son significativos los pronombres, los posesivos y los artículos en tercera persona del singular, así como varias palabras relacionadas con el movimiento y la música. También se ha descubierto que en este sub-corpus los nombres propios de los personajes mitológicos son menos relevantes. Por último, que la tendencia gongorina se extrema en las fábulas de Villamediana: por un lado, los nombres propios de los héroes solo aparecen en posiciones muy bajas, hasta el punto que podrían considerarse como poemas épicos sin héroes. Por el otro, no encontramos pronombres personales ni verbos en posiciones significativas sino adjetivos y sustantivos abstractos. En este sentido, pese a que sus creaciones son menos logradas, puede afirmarse que Villamediana fue el poeta que mejor entendió la novedad del estilo gongorino y la transgresión de la fábula que supuso el anónimo protagonista de las Soledades. Las frecuencias relativas de los cultismos léxicos nos ha proporcionado una serie de porcentajes que ponen de manifiesto la influencia de las Soledades de Gón-gora, sobre todo, en las fábulas del conde de Villamediana. A mi juicio, la originalidad del conde radica en una ingeniosa transferencia del lenguaje poético de las Soledades hacia textos que hasta entonces habían tratado sobre el amor y episodios de metamorfosis con un estilo culto, sí, pero menos elevado. No hace falta decir que el cultismo para Góngora tenía una función poética: no era solamente una muestra de erudición, sino una forma de evitar la palabra gastada; de ahí que en Villamediana los cultismos léxicos tomados en préstamo de Góngora resulten menos sorprendentes. Pero los primeros lectores de la Fábula de Polifemo y Galatea y de las Soledades estaban en lo cierto cuando censuraron estos poemas. Como ya defendió Alonso (1972), la reacción negativa, en realidad, no se debía tanto al uso de cultismos en sí —prueba de ello es que los sub-corpus A y B contienen cultismos léxicos— sino a la frecuencia mayor de lo habitual, a un uso repetitivo de palabras que sonaban extranjeras y que sobrepasaba el adorno de la expresión, tal y como recomendaba la poética clasicista (Aristóteles 2007: 118). En este artículo, pues, se ha pretendido estudiar con métodos informáticos la influencia de Góngora en el devenir de la fábula mitológica del Siglo de Oro a partir del léxico. Pero el estilo gongorino no se puede reducir a un vocabulario, al uso de ciertas palabras, sean cultismos o no. Muchas de las marcas elocutivas más interesantes tienen naturaleza sintáctica como, por ejemplo, el hipérbaton o las fórmulas si A, no B. Para estudiar estos fenómenos se requieren métodos informáticos más complejos, en los que interviene la lematización de textos, el etiquetado de las partes del discurso y el procesamiento del lenguaje natural con técnicas de machine learning; en lugar de analizar las frecuencias de palabras, habría que tener en cuenta los patrones gramaticales y realizar clasificaciones más avanzadas. La principal ventaja de los métodos empleados aquí radica en la sencillez del uso de herramientas genéricas como Stylo y AntConc, y de las operaciones realizadas con R necesarias para obtener frecuencias relativas. Con una curva de aprendizaje muy pronunciada, la metodología expuesta en este artículo es fácil de aprender en poco tiempo, permite confirmar hipótesis, estudiar los textos de manera cuantitativa, y obtener datos que nos permitan hacer comparaciones con otros géneros literarios del Siglo de Oro. Bibliografía Anthony, Laurence, «AntConc [Manual]», 2016. 20-02-2017. <http://www. laurenceanthony.net/software/antconc/releases/AntConc344/help.pdf>. Alonso, Dámaso, «Características del estilo de Góngora», Obras Completas, Madrid, Gredos, 1972. Aristóteles, Poética, Madrid, Editorial Biblioteca Nueva, 2007. Arcaz Pozo, Juan Luis, «Los textos de Virgilio y Ovidio en el Orfeo en lengua castellana (1624) de Juan Pérez de Montalbán, Cuadernos de Filología Clásica. Estudios Latinos, 23, 1 (2003), 211-226. Burrows, John, «Delta: A Measure of Stylistic Difference and a Guide to likely Authorship», Literary and Linguistic Computing, 17, 3 (2002), 267-287. Bustos, Eugenio, «Cultismos en el léxico de Garcilaso de la Vega», Garcilaso: actas de la IV Academia Literaria Renacentista, ed. Víctor García de la Concha, Universidad de Salamanca, 1993. <http://www.cervantesvirtual.com/ bib/historia/CarlosV/8_3_bustos.shtml>. Biber, Douglas, «Representativeness in Corpus Design», Literary and Linguistic Computing, 8, 4 (1993), 243-257. Blanco, Mercedes, «La estela del Polifemo o el florecimiento de la fábula barroca (1613-1624)», Lectura y signo, 5 (2010), 31-68. —, Góngora o la invención de una lengua, Universidad de León, 2a edición revisada, 2016. Calvo Tello, José, «Entendiendo Delta desde las Humanidades», Caracteres, 5, 1 (2016), 140-176. <http://revistacaracteres.net/revista/vol5n1mayo2016/ entendiendo-delta/>. Cossío, José María de, Fábulas mitológicas en España, Madrid, Istmo, 1998. Cristóbal López, Vicente, «La fábula mitológica en España: valoración y perspectivas», Lectura y signo, 5 (2010), 9-30. Eder, Maciej, «Visualization in Stylometry: Cluster Analyses Using Networks», Digital Scholarship in the Humanities, 3 (2015), 1-15. Eder, Maciej, Rybicki, Jan y Kestemont, Mike, «‘Stylo’: a package for stylome-tric analyses». Computational Stylistic Group, 2017, 20-02-2017. <https:// sites.google.com/site/computationalstylistics/stylo>. Fernández De Córdoba, Francisco, «Parecer de don Francisco de Córdoba acerca de las Soledades, a instancia de su autor», Polémique gongorine, ed. Muriel Elvira, París, OBVIL, 2015. 20-20-2017. <http://obvil.paris-sorbonne.fr/corpus/gongora/1614_parecer/>. Fialho, Olivia y Zyngier, Sonia, «Quantitative Methodological Approaches to Stylistics», The Routledge Handbook ofStylistics, ed. Michael Burke, Londres, Routledge, 2014. Fradejas Rueda, José Manuel, «El análisis estilométrico aplicado a la literatura española: las novelas policíacas e históricas», Caracteres, 5, 2 (2016), 196-264. < http://revistacaracteres.net/revista/vol5n2noviembre2016/analisis-estilometrico/ >. Froehlich, Heather, «Corpus Analysis with AntConc», Programming Historian, 2015. 20-02-2017. <http://programminghistorian.org/lessons/ corpus-analysis-with-antconc>. Góngora, Luis de, Soledades, ed. Robert Jammes, Madrid, Castalia, 1994. Herrero Ingelmo, José Luis, «Cultismos renacentistas (cultismos léxicos y semánticos en la poesía del siglo xvi), Boletín de la Real Academia Española, 74, 261 (1994), 13-192. Irizarry, Estelle, Informática y literatura. Análisis de textos hispánicos, Barcelona, Proyecto A Ediciones, 1997. Jáuregui, Juan de, Antídoto contra la pestilente poesía de las «Soledades», ed. José Manuel Rico García, Universidad de Sevilla, 2002. —, «Discurso poético», Polémique gongorine, ed. Mercedes Blanco, París, OBVIL, 2016. 15-02-2017. <http://obvil.paris-sorbonne.fr/corpus/ gongora/1624_discurso-poetico/>. Jockers, Matthew L., Text Analysis with R for Students of Literature, New York, Springer, 2014. Kluge, Sofie, Diglossia. The Early Modern Reinvention of Mythological Discourse, Kassel, Edition Reichenberger, 2014. Marcos Marín, Francisco, Informática y Humanidades, Madrid, Gredos, 1994. Matas Caballero, Juan, «La mitología, campo de tiro en la batalla de los estilos poéticos: Jáuregui y Pérez de Montalbán», Espada del Olvido. Poesía del Siglo de Oro a la sombra del canon, Universidad de León, 2005a. —, «Lope de Vega tras la estela de Góngora: unos versos de La Filomena», Espada del Olvido. Poesía del Siglo de Oro a la sombra del canon, Universidad de León, 2005b. Mcenery, Tony y Wilson, Andrew, Corpus Linguistics. An Introduction, Edinburgh University Press, 2004. Ponce Cárdenas, Jesús, «La poesía de Miguel Colodrero de Villalobos: consideraciones en torno al epilio y los motivos del retiro en la naturaleza», Góngora hoy, ed. Joaquín Roses, Diputación de Córdoba, 2004. Tinianov, Yuri, «Sobre la evolución literaria», Teoría de la literatura de los formalistas rusos, ed. Tvetan Todorov, Madrid, Editorial Biblioteca Nueva, 2012. Valencia, Pedro de, «Carta de Pedro de Valencia escrita a don Luis de Góngora en censura de sus poesías», Obras completas de Luis de Góngora, ed. Antonio Carreira, Madrid, Fundación Castro, 2000. VV. AA., Fábulas mitológicas del Siglo de Oro, ed. Antonio Rojas Castro, Barcelona, 2016. 20-02-2017. <https://github.com/arojascastro/fabulasmitologicas>. Anexos Anexo 1. Tablas Tabla 1. Descripción del corpus. Fecha, título y autor
Tabla 2. Descripción del corpus. Fuentes principales, números de versos y metro
Tabla 3. Types, Tokens y TTR
Tabla 4. Palabras clave en sub-corpus A y B
Tabla 6. Frecuencia relativa de las 25 palabras más utilizadas
Anexo 2. Figuras
Notas: [1] El estudio más completo y actualizado sobre el conceptismo es, sin duda, Góngora o la invención de una lengua de Mercedes Blanco (2016). En este libro la autora defiende que las Soledades es un poema sublime preñado de conceptos; sin embargo, mientras que en los poemas breves los conceptos se perciben con facilidad, en las Soledades pasan desapercibidos debido a que están desperdigados formando «paradigmas», es decir, constelaciones de sentido, asociaciones léxico-semánticas que se repiten a lo largo del texto (Blanco 2016: 59). [2] Según McEnery y Wilson, un corpus es «a finite-sized body of machine-readable text, sampled in order to be maximally representative of the Language variety under consideration» (2004: 32). [3] Cito por la edición de 1998. [4] En la lingüística de corpus, la «representatividad» es el principal criterio que rige el diseño del corpus: «Representativeness refers to the extent to which a sample includes the full range of vari-ability in a population. In corpus design, variability can be considered from situational and from linguistic perspectives, and both of these are important to determining representativeness. Thus a corpus design can be evaluated for the extent to which it includes: (1) the range of text types in a language, and (2) the range of linguistic distributions in a language. [...] linguistic representativeness depends on issues such as the number of words per text sample, the number of samples per ‘text’ and the number of texts per text type» (Biber 1993: 1). [5] <http://obvil.paris-sorbonne.fr/>. [6] <https://github.com/arojascastro/fabulasmitologicas>. [7] Por lo general, se suelen distinguir dos clases de cultismos: léxicos y semánticos. Los cultismos léxicos son los «términos del léxico español que no han experimentado los cambios fonéticos propios de la evolución de nuestra lengua» (Bustos 1993). En cambio, los cultismos semánticos o de acepción son aquellos términos utilizados con un significado diferente al habitual, es decir, que recobran una acepción que poseía el étimo de la voz española y que ésta no había conservado (Bustos 1993). [8] Si bien la mayoría de investigadores definen el epilio como un poema épico más breve que la epopeya, hay quien también destaca su componente temático y en su función pragmática: «[...] frente a los asuntos de interés comunitario o nacional propios de la epopeya, la fábula mitológica —como su nombre indica— saca sus temas del mito y la leyenda clásica, con especial incidencia no en las grandes empresas bélicas o viajeras, sino en episodios de amor y metamorfosis, con grandes dosis del ingrediente sentimental y presencia, mayor que en la epopeya, de personajes femeninos. Podemos decir también que, mientras que a la epopeya la caracteriza, habitualmente, el compromiso nacionalista y comunitario, puesto que sus argumentos se enraízan en la historia patria o en las creencias e ideales de la comunidad, la fábula mitológica, en cambio, se nos aparece como género notoriamente descomprometido, que busca y se afana por la expresión artística en sí misma o ars gratia artis» (Cristóbal López 2010: 10). [9] Sobre las fuentes del Orfeo en lengua castellana véase Arcaz Pozo (2003). [10] Véase, por ejemplo, Tinianov (2012). [11] «En suma, los rivales de Góngora se proponen un nuevo tratamiento de la fábula, tan monumental y tan libre como el del Polifemo, pero del que broten sentencias morales y filosóficas. Jáuregui parece querer mostrar en su Orfeo que la vehemencia sublime de la escritura, de la que abusa según él Góngora para informar conceptos vacuos o superficiales, debe justificarse por la seriedad del pensamiento» (Blanco 2010: 56). [12] <https://sites.google.com/site/computationalstylistics/stylo>. [13] La normalización con z-scores se obtiene restando la media de una palabra en un corpus de su frecuencia y dividiendo el resultado por la desviación típica. [14] Para una explicación en detalle dirigida a humanistas del funcionamiento de Delta, véase Calvo Tello (2016). [15] Más sobre las palabras claves en Lexical Analysis Software en: <http://www.lexically.net/ downloads/version6/HTML/index.html?keyness_definition.htm>. [16] Las palabras de Pedro de Valencia son las siguientes: «También, siguiendo esta novedad, usa vocablos peregrinos italianos y otros del todo latinos, que los antiguos llamaban glosas, lenguas, y ahora llamamos así a las interpretaciones de los tales y de todo lo oscuro. Estos conviene moderar y usar pocas veces: y no muchas tampoco unos de que, con particular significación, y parece afición, como peinar, purpúreo, la partícula si, o si bien, para excepción, y otros tales» (Valencia 2000: 464). Por su parte, la opinión del abad de Rute se resume con la siguiente cita: «Vuestra merced, por amor de Dios, se temple en esta parte, que como su servidor y amigo se lo suplico. [...] Lo mismo deseo haga en el uso de palabras peregrinas, digo derivadas de latín y toscano; y no tanto en la muchedumbre de ellas, pues todas son muy buenas, y a la verdad eso es enriquecer nuestra lengua y muy conforme a los preceptos del arte (según Aristóteles, Horacio, Vida, Tasso y otros); pero en el frecuentarlas y repetirlas muy a menudo, pues, como a forasteras, se ha de ir poco a poco y con recato, dándoles entrada y lugar señalado si queremos que sean bien recibidas y estimadas en algo [...]» (Fernández de Córdoba 2015). Finalmente, aunque el Discurso poético de Jáuregui es diez años posterior, en él se puede encontrar una crítica muy parecida. De hecho, ocupa toda una sección titulada «La molesta frecuencia de las novedades», en donde se leen juicios como el siguiente: «Y no sólo siendo unas mismas las locuciones, ofenden repetidas. Mas aun siendo varias, si son peregrinas y nuevas, basta el frecuentar novedades para que causen molestia, embarazando y afeando la obra donde se acumulan» (Jáuregui 2016). [17] En la tabla 7, doy únicamente el lema, aunque las frecuencias relativas contemplan la ocurrencia del lema y de algunas formas derivadas. En términos generales, en los lemas que corresponden a sustantivos y adjetivos he buscado la forma masculina-singular, femenina-singular, masculina-plural y femenina-plural. Es decir, en la tabla aparece el lema purpúreo, pero se han buscado las formas purpúreo, purpúrea, purpúreos y purpúreas. Por su parte, en los verbos he buscado el lema, las formas correspondientes a la primera y tercera persona del singular y del plural, en presente, en pretérito imperfecto y en pretérito perfecto, así como el participio y el gerundio. En la tabla, pues, aparece el lema argentar, pero la frecuencia relativa corresponde a las formas argenta, argentando y argentados. |
Antonio Rojas Castro
rojas.castro.antonio@gmail.com
Studia Aurea, 11, 2017 - ISSN 2462-6813 (papel), ISSN 1988-1088 (en línea) https://doi.org/10.5565/rev/studiaaurea.260
Studia Aurea. Revista de Literatura Española y Teoría Literaria del Renacimiento y Siglo de Oro
Universitat Autònoma de Barcelona y Universitat de Girona
Editado por el editor de Letras Uruguay
Email: echinope@gmail.com
Twitter: https://twitter.com/echinope
facebook: https://www.facebook.com/carlos.echinopearce
Linkedin: https://www.linkedin.com/in/carlos-echinope-arce-1a628a35/
Métodos para apoyar la labor cultural de Letras-Uruguay
Ir a índice de ensayo |
Ir a índice de Antonio Rojas Castro |
Ir a página inicio |
Ir a índice de autores |