EstilometríaTSO surge del interés del catedrático de la Universidad de Valladolid Germán Vega García-Luengos y del graduado Álvaro Cuéllar González en aplicar las nuevas herramientas informáticas a los numerosos problemas autoriales que presenta el teatro del Siglo de Oro español. Este portal trata, por tanto, de ofrecer análisis que puedan aportar luz sobre la autoría de las comedias que componen la vasta producción teatral del periodo aurisecular.

La estilometría es la disciplina que trata de comparar textos por la frecuencia de sus palabras y, entre sus muchas aplicaciones, puede resultar de gran utilidad para la atribución de autoría. Se parte de una hipótesis sencilla, pero muy poderosa, que está siendo probada con éxito en recientes estudios: cada escritor utiliza unas palabras con más frecuencia que otras; esto conforma su ‘estilo particular’ y podemos utilizarlo para establecer relaciones de proximidad entre los distintos textos.

Hasta el momento, el programa más eficaz para realizar los análisis y el que está siendo utilizado para todos los resultados que se ofrecen aquí es Stylo. Se trata de un paquete de R desarrollado por Computational Stylistics Group, equipo formado por miembros de las universidades de Cracovia y Amberes, a cuya cabeza se sitúan los investigadores Maciej Eder, Jan Rybicki y Mike Kestemont.

Gracias a la estilometría podemos averiguar, en una de sus más útiles funcionalidades, qué textos están más cercanos al nuestro de entre los del corpus que queramos. Aquí, por ejemplo, hemos buscado qué obras son las más cercanas a La vida es sueño, de Calderón de la Barca, en un corpus de más de 600 comedias correspondientes a más de 30 autores.

Como podemos comprobar, la estilometría, tras procesar más de 8 millones de palabras, establece que las 19 obras más próximas (con la distancia más baja) a La vida es sueño de entre las más de 600 son de Calderón de la Barca. El resultado, por lo tanto, respalda la atribución a este dramaturgo.

Imaginemos el potencial que tiene esta herramienta con obras de las que no conocemos con seguridad su autoría. Podemos estudiar un sinnúmero de casos problemáticos, pero necesitaremos siempre un amplio corpus con el que comparar nuestro texto tras preparlo adecuadamente, esto es, con ortografía modernizada, iguales variantes léxicas, sin acotaciones y sin los nombres de los personajes. Además, debemos contar con la pericia y los protocolos adecuados para que los resultados que obtengamos sean lo más rigurosos posible.

Ahí radica el valor de EstilometríaTSO, del que puedes beneficiarte y con el que puedes colaborar. Si nos escribes a alvaro@estilometriatso.com podemos analizar estilométricamente con nuestro corpus la autoría de alguna obra en cuestión o de alguna de sus jornadas utilizando todos los enfoques que conocemos. No hay por qué considerar los resultados como concluyentes, pero sí como indicios, a veces muy elocuentes, de la proximidad o lejanía que mantienen los textos.

Poco a poco, el corpus va creciendo gracias a obras procedentes de muchas fuentes. No podemos publicar los textos íntegros de las obras porque no son de nuestra propiedad, pertenecen a distintos proyectos y algunos van a ser publicados próximamente en ediciones impresas. Lo que sí podemos hacer es utilizar las frecuencias de sus palabras para nuestras investigaciones. Si cuentas con alguna obra del Siglo de Oro con ortografía modernizada o sabes cómo acceder a ella, por favor, escríbenos, agradeceremos mucho la colaboración. Cuanto más grande sea el corpus, mejores y más fiables resultados obtendremos.