S
OBRE LA LONGITUD Y LA COMPOSICIÓN DE ORACIONES
ESPAÑOLAS Y HOLANDESAS
Estudio desde un punto de vista lingüístico-traductológico
H.A. Müller, s10209431
Tutora: S.I. Linn
Universidad de Groningen
Departamento de Filología Románica
Sumario
1 INTRODUCCIÓN...4
1.1 INTRODUCCIÓN...4
1.2 PLANTEAMIENTO...5
1.2.1 Dos presuposiciones sobre el español con respecto al holandés...6
1.2.2 Consideraciones en torno al método...6
1.2.3 La primera hipótesis ...8 1.2.4 La segunda hipótesis...13 1.3 RESUMEN...15 2 EL CORPUS ...17 2.1 INTRODUCCIÓN...17 2.2 PROBLEMAS METODOLÓGICOS...19 2.2.1 Sinopsis ...19
2.2.2 Los córpora electrónicos...22
2.2.3 Recursos electrónicos ...24
2.3 PRESENTACIÓN DEL CORPUS USADO EN EL ANÁLISIS...26
2.4 RESUMEN...32
3 ANÁLISIS ...34
3.1 INTRODUCCIÓN...34
3.2 LONGITUD DE LAS ORACIONES...35
3.3 ANÁLISIS DE LOS CONSTITUYENTES DE LA ORACIÓN...43
3.3.1 Introducción...43
3.3.2 Los problemas de análisis más frecuentes ...44
3.3.3 Los números de oraciones en el corpus de análisis ...48
3.3.4 Los números de oraciones en el corpus de control ...50
3.4 LAS ORACIONES MÁS LARGAS...52
3.5 RESUMEN...55
4 CONCLUSIÓN ...56
BIBLIOGRAFÍA ...58
BIBLIOGRAFÍA DEL CORPUS USADO...58
BIBLIOGRAFÍA GENERAL...58
BIBLIOGRAFÍA DEL CORPUS DE TEXTOS PERIÓDICOS...61
Periódicos holandeses...61
Periódicos españoles ...62
ENLACES USADOS:...63
APÉNDICE 1: LAS ABREVIATURAS USADAS EN EL ANÁLISIS GRAMATICAL...65
APÉNDICE A: TEXTOS DEL CORPUS DE ANÁLISIS ...66
1 Introducción
1.1 Introducción
Esta tesina investiga las diferencias entre el español y el holandés desde una perspectiva doble:
la del español como lengua extranjera (para holandeses) y la de la traducción. El estudio se
limita a dos aspectos de las diferencias entre el español y el holandés: las diferencias entre la
longitud de las oraciones y las diferencias en la construcción de oraciones compuestas. Se trata
de un estudio preliminar, es decir, se tratará de averiguar si los resultados merecen un estudio
más extensivo mediante la línea de investigación que describimos más adelante.
El área de interés principal lo formarán las semejanzas y diferencias con respecto a oraciones
compuestas entre textos españoles originales y sus traducciones al holandés. El primer punto de
partida será la comparación del número de palabras por oración, para ver si hay divergencias
generales. La longitud de las oraciones puede dar una idea más clara de la materia en que
indagamos y de las tendencias que esperamos descubrir. Luego, nos dirigimos a la gramática
para la segunda parte del análisis. El enfoque de la segunda parte estará en el número y la clase
de los constituyentes de las oraciones compuestas. Partimos de una perspectiva contrastiva, es
decir, comparamos las características de las oraciones sin juzgar la calidad de la traducción
para evitar perdernos en la crítica de traducción.
La meta del trabajo será alcanzar un mejor entendimiento de cómo se construyen oraciones
complejas en español y sus respectivas traducciones en holandés. Aunque no es nuestro intento
meternos en el estilo individual para este análisis, es inevitable rociarlo: es indiscutible que
todos los traductores – y si se quiere considerarlo, también todos los autores – tienen un estilo
propio. Sin embargo, una investigación de estilo contrastivo, como propuesto por Baker
(Baker:2000) requiere mucho más tiempo y una cantidad de material más grande. En este
análisis, por lo tanto, la atención principal no se dirigirá al estilo, sino que se lo discute
solamente cuando se considera necesario.
El material del corpus constará de textos literarios por razones de accesibilidad y
representatividad (véase 2.3).
El aspecto de la viabilidad del análisis predetermina que el corpus ha de ser relativamente
pequeño y nos la limita a señalar tendencias. No obstante, cuando se utiliza un corpus pequeño
es poco favorable para la representatividad tomar textos de varias áreas, porque es más difícil
generalizar los resultados de un corpus muy fragmentado.
Los resultados obtendremos mediante un análisis que consta de dos métodos: uno manual y
otro asistido por un programa de análisis. El número de palabras por oración puede
establecerse fácilmente de manera electrónica, el análisis de los constituyentes gramaticales se
hará manualmente. Hacer un análisis manual trae consigo una gran desventaja: consume
mucho tiempo. Desde el comienzo de las posibilidades de hacer análisis de corpus grandes por
medios electrónicos parece que los estudios individuales que consumen mucho tiempo son
evitados por no ser económicos. Puede ser que por eso haya resultados que hasta ahora se les
han escapado a los investigadores. En lo que atañe al análisis manual, es obvio que, salvo con
un pequeño corpus o en una colaboración de grupo, no es posible realizar un estudio profundo
en un tiempo limitado. Por eso la meta de este estudio se limita a obtener resultados
preliminares para un estudio más profundo y determinar si merece la pena llevar a cabo tal
estudio.
En el siguiente capítulo (1.2) presentamos el planteamiento para esta tesina. Luego, en el
capítulo 2 discutimos las aportaciones de la lingüística del corpus al marco de la traductología
y sus posibles beneficios para nuestra investigación. En el capítulo 3 llevamos a cabo el
análisis y discutimos los resultados. Por fin, daremos la conclusión en el capítulo 4.
1.2 Planteamiento
siempre está claro si la percepción de estas congruencias o diferencias es correcta. Es posible
que las presuposiciones sobre la lengua que nos formamos cuando estudiamos, sean inexactas o
incluso engañosas. En este trabajo nos fijamos principalmente en dos de estas presuposiciones:
la longitud de las oraciones y su composición gramatical. Para una mejor comprensión,
presentamos las presuposiciones que queremos investigar en el siguiente párrafo (1.2.1), y nos
formulamos las preguntas que plantearemos en el análisis (capítulo 3) de nuestra investigación.
Las preguntas las discutimos en los párrafos 1.2.3 y 1.2.4, después de comentar algunas
consideraciones sobre el método en 1.2.2. Presentamos las preguntas que investigamos en el
capítulo de análisis en 1.3.
1.2.1 Dos presuposiciones sobre el español con respecto al holandés
Como acabamos de decir en el párrafo anterior, el origen de las preguntas que proponemos está
en el proceso de aprender el español como lengua extranjera (L2), un proceso en el que,
además de aprender la gramática y el vocabulario, contrastamos la lengua base (L1) sobre la
que aprendemos, la L2, sea consciente o inconscientemente. Las diferencias que establecemos
de esta manera son variadas, y probablemente tan abundantes como difíciles de categorizar
1. Si
hacemos un intento de categorizar las dos cuestiones que queremos investigar, diríamos que se
trata de una mezcla de sintaxis y uso de la lengua. Las dos concepciones que queremos
investigar se concentran en la oración: la primera se fija en la longitud de las oraciones, y la
segunda en su composición. Primero discutimos algunas consideraciones en torno al método
con el que hacemos nuestra investigación. En los párrafos que siguen a continuación
discutimos nuestras preguntas.
1.2.2 Consideraciones en torno al método
Para llevar a cabo nuestra investigación, hacemos uso de un pequeño corpus. Este corpus
consta de textos literarios españoles y holandeses y sus respectivas traducciones. En lo que
atañe a la selección de textos literarios, hay dos objeciones que se pueden hacer: por un lado
hay un grupo de textos que es igualmente o incluso mejor accesible y representativo, como el
de los artículos periodísticos. Eso es verdad, pero los textos periodísticos apenas se traducen.
Por otro lado, se puede insistir en que el lenguaje literario no es representativo para el habla
general, pero tampoco lo es, por ejemplo, el lenguaje especializado de una u otra área técnica.
1 No indagamos más en este asunto más apto para una investigación de aprendizaje de la lengua
Además, el uso de textos de lenguaje especializado o técnico lleva consigo el riesgo de
interferencia del inglés, especialmente en la parte holandesa. La decisión de usar textos
literarios sin embargo proviene de varias consideraciones, de las que discutimos las dos más
importantes.
La primera consideración es el grado de especialización: los textos litererarios son poco
especializados en cuanto al uso de terminologías (García Yebra 1983: 40-43). Si no hay
lenguaje especializado, tampoco hay los riesgos de una estandardización e internacionalización
del vocabulario y con eso quizás también de la sintaxis (íbid). Así se previene la inclusión
inadvertida de interferencias de otras lenguas, como el inglés, en el corpus.
La segunda consideración es la de la accesibilidad (véase también cap. 2.2.2). Los textos
literarios – y en grado sumo sus traducciones – son más fáciles de conseguir que textos de otros
géneros, como textos científicos o comerciales. La buena accesibilidad de textos también se
aplica a textos periodísticos, pero es más difícil encontrar artículos que se han traducido. Como
la segunda parte de nuestro análisis se concentrará en las diferencias en la composición de
oraciones originales y traducidas es menester tener en cuenta también la accesibilidad de las
traducciones para garantizar un volumen de producción aceptable. Además, la fácil
identificación del traductor de un texto literario permite una distribución más equilibrada,
evitando que el corpus contenga, por ejemplo, un número demasiado alto de textos traducidos
por el mismo traductor. Así se previene una preferencia inadvertida del corpus para un cierto
estilo de traducir.
Sin embargo, el uso de textos literarios también lleva consigo unas desventajas que no se
pueden descartar. El autor literario tiene la libertad de desviarse de las convenciones
de la lengua origen que le permita interpretar los aspectos específicos del texto (García
Yebra 1983:127 y 132).
La recepción de una obra literaria traducida depende también del estilo del autor transmitido
por el traductor: es el estilo que hace que se reconozca al autor, y que por eso no se debe
ignorar al traducir. Este estilo lo hallamos entre otras cosas en la longitud y composición de las
oraciones, como queda manifiesto en p.ej. el estilo destacado de Pío Barroja. En un manual
para la documentación de la traducción, P.E. García sugiere que el primer paso en la
interpretación es el análisis del texto origen con respecto a la longitud de las oraciones y su
composición (P.E. García 2005:130). Son los aspectos de este análisis que nos interesan; nos
preguntamos ¿las oraciones españolas son igual de largas que las holandesas? y, ¿las oraciones
se componen diferentemente? Esta última cuestión la discutimos en el párrafo 1.2.4; en el
párrafo 1.2.3 nos dedicamos a la primera pregunta.
1.2.3 La primera hipótesis
La primera idea que queremos investigar es la supuesta diferencia en longitud media de las
oraciones españolas con relación a las holandesas. El origen de la concepción de que las
oraciones españolas serían más largas que las holandeses se halla en las clases de español como
lengua extranjera, en la que el estudiante libra la misma batalla con la tarea de entender las
oraciones largas y la cuestión de cómo formular sus propias oraciones lo mejor posible. Y, más
tarde, en las clases de traducción se refuerza esta hipotesis de que las oraciones españolas son
más largas. Pero, ¿es verdad? Hasta ahora hemos podido encontrar ninguna respuesta. Para
conocer el terreno en que indagamos conducimos primero una investigación de lo que se dice
en los manuales de traducción de y de redacción. Luego trataremos de averiguar mediante una
pequeña comparación con un corpus de textos no literarios si los textos literarios se desvían
mucho de los consejos de los manuales.
propone en una sola ocasión la importancia de dividir una oración larga en dos (Sequeros
1990:35). Un manual de traducción del español al holandés menciona en escasas ocasiones que
es mejor dividir una oración en dos (véase Slager 1990:110). Otro manual, que acaba de
publicarse, señala que en el proceso de la traducción del español al holandés muchas veces
conviene cortar las oraciones. Hasta parece como si fuera un procedimiento normal y necesario
para que el texto siga siendo legible (Linn y Slager 2007:214 y 219-221).
Estos consejos, no obstante, se limitan a los textos no literarios. En los textos literarios vale
más el estilo del autor, algo que es mucho más difícil conservar. En el Manual de
interpretación y traducción
de Manuel León (2000) se incluye un artículo en el que un escritor
se queja de que en algunas traducciones a varias lenguas, entre ellas el francés, de una de sus
obras se han cortado y cambiado sus oraciones cuidadosamente formuladas.
El conflicto básico está en escoger entre la fidelidad y la adecuación. El adagio de que una
traducción debe ser tan literal como posible y tan libre como necesario no se opone a la
exigencia de que el texto meta (TM) debe ser adecuado y que se debe adaptar al uso de la
lengua de los receptores. El conflicto entre la fidelidad del traductor al texto origen (TO) y la
adecuación al texto meta se extiende, especialmente con respecto a la literatura, también a otro
campo: el del estilo. Cortar oraciones sirve la legibilidad, o ¿no sirve más que a arruinar el
estilo del autor?
En los manuales de redacción, la actitud frente a la práctica de cortar oraciones largas no es
muy diferente. Aunque en los manuales de ambas lenguas gran parte de la atención recae sobre
el uso correcto de la lengua, hay ciertas diferencias en lo que atañe a oraciones largas. Los
manuales para escritores españoles no se concentran tanto en la longitud de la oración, sino
más en la estructura de la oración. Ésta debe ser clara e inteligible para el lector. Sarmiento
(1997:293) recomienda “cercar lo inútil” y Sabino (1987:190) enfatiza en la importancia del
uso correcto de los signos de puntuación en oraciones largas y complejas para evitar problemas
de comprensión.
un conocido manual de redacción holandés se exhorta al lector: “Help de lezer met een punt”
2(Renkema 2002:78) y se recomienda no usar constantemente oraciones extensas o compuestas
con múltiples subordinadas (2002:80). En oposición a esta idea se critica el consejo dado a
(estudiantes) holandeses de evitar oraciones que contengan más de treinta palabras porque
serían demasiado largas e incomprensibles, especialmente para gente menos culta (Renkema
2002:78), y el mismo autor demuestra con unos ejemplos que la comprensibilidad de una
oración compleja depende de la estructura (2002:79). Además, en otro manual, en la sección de
los problemas de redacción más frecuentes, se pregunta al lector “Is de zin waaraan je schrijft
niet te lang
?”
3(Reinsma 2003:202) y añade que una oración demasiado larga requiere un
esfuerzo desproporcional del lector para recordar de lo que trata la oración. Estos consejos
indican que las oraciones holandesas pueden ser más cortas que las españolas, aunque también
hay un caso en el que se advierte que un exceso de oraciones cortas tampoco beneficia la
recepción del texto porque el estilo se parece al habla infantil (Onrust et al., 1999: 159). Los
holandeses refieren a tal estilo con el término “Jip-en-Janneke-taal”, aludiendo a los famosos
libros para niños de Annie M.G. Schmidt, publicados entre 1960 y 1965.
4De los manuales que hemos revisado notamos que importa más a los holandeses que las
oraciones no sean demasiadas largas y complejas que a los españoles. Mientras que en los
manuales de redacción holandeses se dan direcciones claras de no formular oraciones
demasiado largas, en los españoles se enfatiza que las oraciones redactadas deben ser correctas
gramatical y sintácticamente. A pesar de todos los consejos salta a la vista que ninguno de los
manuales da una definición de lo que es una oración demasiado larga. Lo que los manuales de
ambas lenguas tienen en común es la insistencia en la variación entre oraciones cortas y largas.
No encontramos, sin embargo, recomendaciones para la redacción de textos literarios.
Para pasar a otro medio de comunicación hacemos también una búsqueda en la red. Internet,
que es para muchos un medio de búsqueda de información rápida sobre cualquier asunto, nos
podría dar algunas pistas. Recordemos que esta torrente de información al azar tan fácilmente
accesible a cada hora no siempre es la más objetiva o fidedigna; las múltiples páginas de
información reflejan, sin embargo, la actitud de la gente en cuanto a muchos asuntos. Es por lo
tanto obvio que también hay un sinfín de sitios que dan consejos sobre cómo escribir. Si
2 “Ayude a sus lectores: ¡use el punto!” [traducción mía]
3 “¿No es demasiado larga la oración que está construyendo?” [traducción mía]
4 Los libros han sido traducidos por Laurence Schröder y fueron publicados en España bajo el nombre
echamos un vistazo a estos sitios veremos igualmente que existen enormes diferencias al
respecto. Entre los sitios dirigidos a hispanohablantes, hay menos sitios en los que se dan
normas sobre el número de palabras por oración, e incluso parece otra vez que, aunque se
recomienda no usar oraciones demasiado largas y complejas
5, no importa tanto el número de
palabras como en los sitios holandeses. Los consejos que sí se pueden encontrar son, no
obstante, muy divergentes. Mientras que en un sitio en castellano se comenta que “Deben
utilizarse oraciones de 20 palabras por oración, como máximo.”
6, en otro se recomienda: “Use
un promedio de 30 ó 35 palabras por oración”
7. Entre una longitud media entre veinte y treinta
palabras, todo parece aceptable.
En cuanto a los sitios holandeses no es muy difícil tampoco encontrar instrucciones sobre la
longitud de oraciones. La información que se encuentra en los sitios españoles otra vez es
abundante e igualmente variada, si no es aún más variada. En la mayoría de los sitios se
aconseja mantener un promedio de doce o de quince a dieciocho palabras por oración. Las
recomendaciones sobre el número máximo, sin embargo, varían mucho, y mientras que en dos
sitios se aconseja al escritor no usar más de 25 o 30 palabras
8hay también sitios en que se
opina que no es aconsejable usar más de 15 palabras por oración
9. Además de esto, se exhorta
al escritor no usar oraciones complejas sino repartir el contenido sobre dos oraciones: “Schrijf
geen lange zinnen met ingewikkelde bijzinnen. Maak er dan liever twee zinnen van.
”.
10Si comparamos los consejos que se dan en los manuales imprimidos con los de Internet, salta a
la vista que en los primeros no se menciona cuántas palabras una oración debe promediar,
mientras que en las páginas web se dan números que son concretos, pero que al mismo tiempo
varían mucho. Así parece, después del examen de las páginas web, que el ideal del promedio
de palabras por oración oscila alrededor de unos 15 palabras para los holandeses. El ideal de
los españoles por otro lado no es fácil de determinar: muchas veces no se dan números
5 Véase p.ej. el consejo en la web de esta universidad colombiana:
http://ayura.udea.edu.co/~fisica/ARCHIVOS%20GENERALES/ELABORACIONTEXTO.pdf: “No escriba oraciones muy largas y complejas”.
6 Véase: www.fonaiap.gov.ve/publica/divulga/fd59/instruc.html 7 Véase: http://www.slideshare.net/maocandamil/taller-de-escritura-web 8 Véase: http://www.leesbaarnederlands.nl/taal.htm y
http://www.kwaliteitscholen.nl/kwaliteitsite/kwaliteitscholen/html/general.asp?PID=95
9 Véase: http://www.rooskleurig.nl/tekst.html
10 Tomado de un manual para gerentes en:
concretos y los pocos números que se dan varían mucho. Si tomamos un medio de los números
disponibles, vemos que éste varía entre veinte a veinticinco palabras por oración.
De esta primera investigación de los medios escritos sobre la longitud media de las oraciones
pasamos a una investigación algo más práctica: hacemos una pequeña comparación de textos
periódicos españoles y holandeses para determinar cuál es el promedio de palabras por oración
general. Los textos provienen de cinco periódicos en ambas lenguas que se publican en la red.
11Los textos también han sido elegidos al azar, con la única restricción de que los artículos no
sean muy cortas para que no consuma demasiado tiempo recoger un corpus de tamaño
aceptable. El corpus de textos periodísticos consta, de dos partes de unas cinco mil palabras
para cada una de las lenguas. Para el análisis de los textos recogidos usamos el programa
Corpus Presenter Lite
de Raymond Hickey (para una descripción más precisa del programa
véase capítulo 4.2).
A base de los números dados en los diversos sitios web ya se podía estimar prudentemente que
la longitud de las oraciones holandesas debía de promediar acerca de unos quince palabras por
oración. Hacer un cálculo estimativo para la longitud de las oraciones españolas, sin embargo,
no fue tan fácil. Los escasos números que se daban eran demasiado divergentes para que fuera
posible determinar una longitud media realista. Esperamos que en el análisis de nuestro corpus
periodístico resultará que las oraciones holandesas promedian unas quince palabras y por eso
son mucho más cortas que las españolas, para las que estimamos un número medio de entre
veinte y veinticinco palabras por oración.
Periódicos neerlandeses Periódicos españoles
Número de palabras 5196 5180
Número de oraciones 339 163
Longitud media 15.3 31.8
Cuadro 1: Datos estadísticos para un corpus de textos periodísticos
11 Los periódicos españoles son: El País, El Mundo, La Vanguardia, El Periódico y ABC; y los
En el cuadro 1 podemos ver que la longitud media de los textos holandeses se difiere
considerablemente de los españoles: según nuestro análisis hay una diferencia de la longitud
media de un casi 50%; mientras que en los textos holandeses ésta es 15.3, en los textos
españoles alcanza un número de más de treinta palabras. Los veinte a veinticinco palabras que
estimamos más arriba se sobrepasan con más de cinco palabras. No obstante, hay que tener en
cuenta una consideración: los textos periodísticos no son representativos para todos los géneros
de textos, aunque representan gran parte de la lectura cotidiana. Si consideramos el estatus
especial que tiene el texto literario (véase más arriba) con respecto a la libertad creativa, sería
de interés saber si los textos literarios españoles también tienen un número de promedio más
alto que los holandeses. En el capítulo 3.2 conducimos un análisis usando un corpus algo más
amplio de textos literarios para ver si las oraciones son más largas o menos largas que los
textos no literarios.
La pregunta por la diferencia entre la longitud media de oraciones españolas y holandesas
entonces se amplía con dos preguntas más: ¿las oraciones traducidas son igualmente largas o
difieren de longitud? y, ¿se suelen cortar oraciones en la traducción literaria?
1.2.4 La segunda hipótesis
La segunda pregunta que nos hacemos está relacionada con las diferencias entre los
constituyentes de las oraciones compuestas. Las diferencias entre el español y el holandés son
obvias; las lenguas incluso pertenecen a diferentes familias lingüísticas. Pero también hay
semejanzas que se aplican a todas las lenguas; las oraciones siempre se componen de los
mismos constituyentes básicos de sujeto y predicado. El hecho de que el análisis gramatical es
un método uniforme para denominar los constituyentes de una oración lo hace un medio muy
apto para la comparación de ciertos aspectos sintácticos: mientras que en ambas lenguas se
dispone de los mismos elementos para describir oraciones, en ambas lenguas estos elementos
se usan diferentemente en la construcción gramatical de las oraciones.
discrepancias en varios niveles, como p.ej. en el uso de las preposiciones o de los verbos
auxiliares. Pero parece también que se concentran mucho más en el nivel de la palabra que en
el de la oración. Además las obras contrastan el español con el alemán (Cartagena y Gauger) o
el español con el inglés, el francés y el alemán; no incluyen al holandés. Se puede obtener un
entendimiento de las diferencias entre el castellano y el holandés de los manuales de gramática
española holandeses, en los que se describen también unas particularidades de la lengua
holandesa, del manual de gramática holandesa para españoles de Van Dam y Oostendorp
(1965
12), y, por fin, se puede encontrarlas en la red, donde hay una multitud de recursos.
13No es nuestro objeto hacer una comparación exhaustiva de los idiomas, sino que queremos
confirmar (o refutar) unas impresiones que han surgido en las clases de español. No es nuestro
objeto hacer una comparación exhaustiva de los idiomas, sino que queremos confirmar (o
refutar) unas impresiones que han surgido en las clases de español. En éstas, hay un sinnúmero
de momentos en los que el estudiante busca la manera más adecuada de expresarse y al buscar
se forma hipótesis sobre el uso de la lengua. Un ejemplo de esto es la búsqueda de alternativas
para ciertas conjunciones holandeses durante las tareas de redacción, cuando parece que en el
español se usara mucho más la conjunción ‘que’. Se da la impresión de que en español hay más
oraciones relativas que en holandés. Al mismo tiempo se observa que ciertas construcciones
típicamente españolas apenas se usan en neerlandés, como p.ej. la cláusula absoluta, que
muchas veces tiene la función de complemento circunstancial. Otro ejemplo de eso es el uso
relativamente frecuente del gerundio en español, que en el holandés se usa mucho menos y que
por eso hay que traducir diferentemente (Slager 1990:110). Las construcciones con gerundio
también tienen la función de un complemento circunstancial en la mayoría de sus ocurrencias.
En cuanto a los cambios de la estructura de oraciones durante la traducción, los teóricos tienen
puntos de vista diferentes. Para dar unos ejemplos, Baker observa que hay cambios de la
estructura de la oración que son necesarios por razones semánticas, la información se reparte
diferentemente para que el texto alcance mejor a sus receptores (1992:124-125). En el análisis
(cap. 3.3) comparamos por eso el número de varios tipos de oraciones subordinadas para saber
si hay diferencias en la frecuencia con la que se usan p.ej. oraciones subordinadas adverbiales
en los textos españoles o holandeses.
En el caso presente, seguimos siendo curiosos de saber si las oraciones compuestas se
construyen de manera diferente. Nos preguntamos particularmente si las oraciones tienen una
estructura diferente en cuanto a la manera de coordinar oraciones y en cuanto al número y los
tipos de oraciones subordinadas. Además, la revisión de los medios descritos más arriba nos
lleva a la pregunta si los traductores se atienen a la estructura del texto origen o que si hacen
cambios para aproximarse más al uso de la lengua meta. Esperamos llegar a un entendimiento
más profundo de esta materia en el análisis (cap. 3).
Por eso en la segunda parte del análisis (capítulo 3) compararemos los resultados del análisis
sintáctico de las dos partes del corpus literario que elegimos para esta investigación. En esta
comparación incluimos tanto el número de oraciones principales como los números y tipos de
las subordinadas. Con ayuda de los resultados del análisis esperamos llegar a un entendimiento
más profundo de las diferencias y semejanzas entre ambas lenguas con respecto a la manera en
que se construyen las oraciones compuestas. Como ya indicábamos en la introducción,
deseamos también establecer si el estudio de estas diferencias puede resultar en un marco de
investigación fructífera para la formación de teorías en torno a la traducción.
1.3 Resumen
La segunda hipótesis que hemos discutido es la supuesta diferencia de construcción gramatical
que el estudiante llega a creer durante la búsqueda de formulaciones apropiadas. Hay ciertas
construcciones que se usan diferentemente en español. En la literatura sobre el tema no
encontramos mucho sobre las diferencias de construcción gramatical: si hay varias
comparaciones entre el español y otras lenguas, hay pocas entre el español y el holandés.
Muchas de estas obras se concentran en el nivel de la palabra, pero también hay aportaciones
de la lingüística del texto. Esperamos hacer una modesta aportación a la clarificación de la
cuestión si hay diferencias en la frecuencia del uso de las subordinadas mediante nuestro
análisis, aunque la validez de los resultados permanezca limitada.
Resumiendo, las preguntas que investigaremos en el capítulo del análisis y que constituyen el
punto de partida para esta tesina son las siguientes:
1 ¿Los autores literarios holandeses prefieren escribir oraciones más cortas que los
españoles?
a) ¿Esa preferencia se refleja en los textos traducidos del español al holandés y viceversa? y
b) ¿Los traductores literarios suelen cortar oraciones en la traducción literaria del español al
holandés?
2 ¿Hay diferencias gramaticales entre las oraciones compuestas entre el holandés y el
español?
a) Si las hay, ¿cuáles son?
b) ¿Estas diferencias en la construcción las vemos también en la traducción español–
holandés?
2 El corpus
2.1 Introducción
En el capítulo anterior formulamos el planteamiento de esta tesina. Hemos presentado las dos
preguntas que queremos investigar, a saber si hay diferencias en la longitud de las oraciones y
en la composición gramatical de las oraciones compuestas. Las preguntas parciales que estas
preguntas llevan consigo se refieren en primer lugar a la pregunta si estas diferencias también
se manifiestan en textos traducidos. Para la investigación optamos por un análisis de un
pequeño corpus de textos literarios. En el presente capítulo damos una breve discusión del uso
de córpora. Empezamos con una introducción a la lingüística del corpus general. En el
siguiente subcapítulo (2.2) discutimos los problemas metodológicos del marco teórico.
Después de la exposición teórica, procedemos en el capítulo 2.3 a la descripción del proceso de
selección y construcción que recorrimos y presentamos el corpus que usamos en el análisis
(cap. 3).
Hoy día, toda ciencia se define en criterios de objetividad, representatividad, repetibilidad,
transparencia y precisión. Toda disciplina científica que reclame un lugar en el mundo
científico moderno debe cumplir con estas exigencias. Pero, mientras en las ciencias naturales
el objeto de estudio es más o menos invariable, es variable en otras, entre ellas la traductología.
Esto pone una serie de problemas de índole filosófica y teórica en cuya discusión no
indagamos en este estudio; si se quiere saber más sobre el fondo de estos problemas, referimos
a los libros sobre la filosofía de ciencia.
por un lado en los topoi, los ‘lugares comunes’ que para todos tienen el mismo significado, y
por otro lado, en una serie de valoraciones individuales. La otra parte de la que depende una
traducción es la expresión, la reformulación de lo interpretado a la lengua meta (LM). En este
punto hay que tener en cuenta la pluralidad de la lengua, que en ciertos casos nos abastece con
una multitud de locuciones, sinónimos etc. que en combinación con las decisiones individuales
del traductor pueden dar resultados diferentes. La ausencia de constancia del objeto de
investigación compromete la repetibilidad de las investigaciones para reconfirmar los datos
obtenidos y limita las posibilidades de generalización. La variabilidad de los datos dificulta la
posibilidad de efectuar estudios trasparentes y precisos con una cantidad de material de
investigación comparable.
En la historia de la traductología, se ha luchado mucho con estos criterios. Ya en los enfoques
normativos (como p.ej. el de Benjamin o el de Newmark, descritos en: Stolze 1997:34-35 y
80-83) se han hecho esfuerzos para cumplir con criterios de objetividad, a pesar de las pocas
posibilidades de una traductología que todavía dependía de datos obtenidos por introspección.
Aunque eran muchos los esfuerzos de captar la intuición en un modelo general aplicable, eran
poco exitosos. Por otro lado, los enfoques descriptivos echaban de menos las posibilidades de
obtener resultados basados en un número de ocurrencias representativo; había que limitarse a la
comparación sistemática de dos o más textos (Stolze 1997:168ss y 173). Y según Schmitt, la
traductología no era un marco de investigación claramente abarcado hasta en 1993, sino que
era un marco que investigaba las competencias individuales de los traductores (1993:41-43).
2.2 Problemas metodológicos
2.2.1 Sinopsis
La introducción de la lingüística del corpus electrónico a la traductología ofreció nuevas
perspectivas, y un camino hacia la aceptación científica porque se permiten generalizaciones
controlables y resultados confirmados a base de la mayor trasparencia de los estudios y la
accesibilidad al material estudiado por diversos investigadores. Un corpus electrónico, en la
definición de Atkins et al. (1992:1) es una subsección de una colección (librería) de textos en
forma electrónica (ETL; ídem) más voluminosa, compilada según criterios de diseño
específicos, de los que un investigador hace una selección para su corpus. Compilar una
librería grande, sin embargo, apenas es factible para un investigador desde el punto de vista del
tiempo que puede invertir y de la cantidad de material que hay que compilar (Van
Doorslaer 1995:246).
Por consecuencia, muchos córpora no parten de una librería de textos en forma electrónica,
sino que se construyen directamente, según criterios de diseño formulados específicamente
para el tipo de investigación que se quiere hacer (Baker 1995:224). Estos criterios de selección
se basan en criterios externos, no lingüísticos, e internos, lingüísticos (Atkins et al.: 1992:5).
Los últimos se concentran en la descripción y clasificación de los textos en el corpus, el tipo de
lenguaje (formal o informal) etc., mientras los externos se ocupan de datos sobre la naturaleza
de los textos (hablados, escritos o ambos, qué tipo de medio de comunicación), los autores y
los traductores etc (Baker 1995:229-239 y Atkins et al.: 1992:6-10). Aunque muchos de los
textos de los córpora se basan en criterios específicos y raras veces son seleccionados al azar,
p.ej. por razones de la accesibilidad (véase más abajo), en la presentación del corpus en los
artículos muchas veces no se describen los criterios de selección, como nota Van Doorslaer
(1995:246). Además, apenas hay criterios para evaluar la calidad de los textos (Van
Doorslaer: 1995:250) a pesar de las generalizaciones frecuentes sobre la cantidad y la calidad
de los textos.
1998, n
o4). Pero también saltan a la vista las diferentes descripciones de los córpora: en
muchos artículos éstas se adhieren a diferentes maneras de describir el corpus; en estudios de
córpora grandes muchas veces se menciona el número de palabras que contienen, pero con los
más pequeños, las descripciones a veces se limitan a referir el número de oraciones o textos.
No hay una sola manera de describir el tamaño de los córpora, como p.ej. una referencia al
número de unidades del idioma, porque todavía no hay una definición clara de lo que
constituye tal unidad (Atkins et al. 1992:4). Mientras tanto, parece como si la mayoría de los
investigadores ha aceptado los criterios que propone Baker (Olohan 2004:43s).
Ya en 1992, Atkins et al. (Atkins et al.: 12) proponen el establecimiento de un marco común
para la estandardización y valoración de córpora mediante criterios descriptivos. En su cuadro
de definición, el modo del corpus designa si se trata de un corpus de textos escritos o de
materiales hablados y el medio alude al medio de comunicación o diseminación usado para
publicar el texto, como p.ej. en forma de libro, texto html, etc (Atkins et al. 1992:5). Los
autores proponen también una descripción tipológica muy extensa, que incluye no sólo la
descripción del tipo de texto, sino también la información bibliográfica (como p.ej. el tema o
grado de especialización del texto etc.), e información sobre el autor (como p.ej. su
nacionalidad y sexo etc). Estos criterios descriptivos del corpus fueron ampliados por Sara
Laviosa en 1997 (Target 9/2) para desarrollar y consolidar el marco metodológico de la
lingüística del corpus.
En un artículo en Target (vol. 7/2, 1995), Baker exhorta al establecimiento de criterios para una
metodología coherente para las investigaciones del corpus. La autora observa que la definición
de los córpora depende de la meta de la investigación (1995:225). Por eso, según Baker, es útil
diferenciar entre tres tipos de córpora básicos:
•
el corpus paralelo, que consiste de un texto origen (TO) y varias traducciones en una o
varias lenguas meta (LM) para fines descriptivos (1995:230);
•
el corpus multilingual, que reúne dos o más córpora en diferentes lenguas pero
compuesto según criterios de diseño similares y que sirven para la comparación de rasgos
lingüísticos (1995:232);
“tercer código” (1995:234-235), que es un tipo de cruce de la lengua meta con rasgos de la
lengua de origen.
No obstante, aparte de estos desarrollos muy positivos, también hay unas áreas que siguen
siendo problemáticas. Primero, hasta incluso el presente, no se ha llegado a un consenso en la
tipología de textos y parece que será difícil conseguir tal consenso: cada investigador que
propone una tipología tiene una perspectiva diferente de la de los otros, con la consecuencia de
que de los investigadores posteriores, unos siguen la definición de cierta autoridad, mientras
que otros prefieren la categorización de otra. En segundo lugar, la descriptividad de los córpora
que contienen una parte de textos traducidos también depende de la relación entre la lengua
origen (LO) y la lengua meta (LM) (Van Doorslaer 1995:247).
Otra área problemática en la descripción de los córpora es su representatividad. Según la teoría
de estadística, la representatividad del corpus dependería de la populación investigada, y debe
determinarse ésta exactamente antes de hacer una selección (Atkins et al. 1992:2). Pero en el
campo de la lingüística del corpus, esto lleva consigo unos problemas propios: no es posible
examinar toda la producción ni determinarla (ibíd.), sobre todo cuando se considera que el acto
de escribir es en esencia poco natural y que hablamos significativamente más de lo que
escribimos. A pesar de que hay varios córpora de lengua hablada, éstos todavía recogen un
mero fragmento de lo que diariamente se habla. Un factor adicional que hay que tener en
cuenta es la variabilidad del habla individual, por lo que se recomienda usar un corpus de
autores diferentes, cuando no se investigan las peculiaridades de un cierto autor, para que el
lenguaje bajo investigación pueda ser lo suficientemente variado (ibíd.) y por eso no
representativo. Además, una selección que parte de criterios de diseño específicos no puede
escapar a cierta predisposición del investigador (Atkins et al.: 2) ya que no sería lógico
seleccionar textos que no sean aptos para el análisis que se quiere hacer, sobre todo si se trata
de una investigación prospectiva, en la que se quiere determinar si vale la pena el tipo de
análisis. En tales casos muchas veces se usan córpora de extensión limitada, especialmente si
no hay un corpus adecuado o accesible. Por limitaciones de tiempo y del enfoque es necesario
concentrarse en los textos que más probablemente producirán los resultados requeridos. Atkins
et al. (1992:4 y 15) proponen un tipo de solución provisional para el problema de la
sido recogidos con un procedimiento estadísticamente correcto.
14Aunque queda problemático
el abarcamiento y la definición de la populación total, también se proponen soluciones: con los
desarrollos de la informática, se facilita la concepción de programas con los que se puede
determinar la representatividad de un corpus después de su construcción mediante un algoritmo
(Corpas Pastor y Seghiri: accurrapid.com, 2007).
Independientemente de estos aspectos problemáticos, la lingüística del corpus ha hecho una
aportación imprescindible al desarrollo de la traductología como ciencia empírica autónoma
(Laviosa 2003:46). Se han desarrollado muchas nuevas perspectivas y una metodología para
investigaciones, como por ejemplo los diversos tipos de análisis asistidos por ordenador. La
comparabilidad de los planteamientos y de la ejecución de los programas de investigación
garantiza también la comparabilidad de los resultados. Y, además, se permite la esperanza a
una estandardización de la terminología del marco científico del corpus, que ahora todavía está
muy dividida.
2.2.2 Los córpora electrónicos
En general, los proyectos de establecimiento de córpora electrónicos tienen un planteamiento
muy amplio: por un lado son una fuente común para diversos investigadores que pueden
usarlos tanto para análisis lingüísticos y lexicográficos como para enfoques traductológicos,
como la terminología, fraseología, teoría de traducción etc., y por otro lado los mismos córpora
apoyan al desarrollo empírico de la ciencia de la lingüística y de la traductología facilitando la
reproducibilidad y controlabilidad de los resultados (Laviosa 2003:52). Otra ventaja es que los
grandes córpora les ofrecen una flexibilidad a los investigadores porque éstos no se ven
limitados a un solo grupo de textos sino que pueden hacer una selección entre los textos así
accesibles que guardan relación con el propósito del estudio. Esto permite ahorrar tiempo y
costos que normalmente se gastaría en la inventarización y selección de textos y en asuntos de
copyright.
No obstante, también hay desventajas. Como ya se ha mencionado, la composición de córpora
extensos por un solo investigador es problemática, si no imposible (Van Doorslaer 1995:246).
Los córpora se componen a base de unos criterios de selección externos como el tiempo que
14 Publicación de Woods, Fletcher y Hughes (1986) Statistics in Language Studies, cita bibliográfica en
dura el procesamiento de los textos, la accesibilidad, el copyright etc. El aspecto central en esto
sería la accesibilidad de los textos, porque reúne tres criterios externos de selección: primero
está la accesibilidad de los textos, ya que no todo lo que se traduce también se publica; luego
está el problema de los derechos de autor y de copia, por lo que no es posible elegir cualquier
texto para el corpus, y tercero, aunque hoy día es posible captar cualquier texto en formato
electrónico mediante técnicas de escáner, la selección todavía depende mucho de la forma
publicada por el tiempo que dure. Después del establecimiento del corpus, no es cierto que
también sea accesible para cualquier investigador, por las mencionadas limitaciones del
copyright.
El problema de la accesibilidad, junto con el tablón científico, lleva a la consecuencia de que
los grandes córpora mono o bilingües muchas veces se limitan a ciertos grupos de lenguas
como las lenguas (europeas) con un mayor número de hablantes o a las que tienen una
tradición de traducción bien establecida, pero no necesariamente bidireccional, como p.ej. el
corpus finlandés–inglés (Granger 2003:23). Se investiga mucho, pero a veces la escasez de
materiales accesibles puede limitar las posibilidades de investigación. Esto sería especialmente
el caso en los grupos de lenguas pequeñas o, mejor dicho, para lenguas entre las que no se
traduce mucho (¿cómo se haría p.ej. con una investigación entre, diríamos, el japonés y el
holandés?). Hay una multitud de córpora de traducción de tamaños variados que han sido
compuestos para investigaciones; muchos de estos córpora, sin embargo, se han construido
solamente para fines de investigación específicos.
En las tres décadas pasadas se han realizado unos proyectos para construir córpora mono y
bilingües como p.ej. el English Comparable Corpus (ECC)
15, el Corpus de Referencia del
Español Actual
(CREA) o el Corpus Diacrónico del Español (CORDE)
16(Pérez
Hernández:2002) y el Corpus van de Nederlandse taal (D-coi) o el Corpus Geschreven
Nederlands
17etc. para fines de investigación lingüística o traductológica. Un ejemplo de un
extensivo corpus de traducción es el RicoTerm2, un corpus de textos en inglés, español y
catalán
18. Algunos de los córpora que hemos mencionado son accesibles por la red; otros han
sido publicados en cd-rom o ya no son accesibles, como p.ej. el corpus bilingüe de Nimega
(Hallebeek:2000)
19. Otra parte de los córpora compuestos para fines de investigación científica
nunca han sido accesibles o sólo para un grupo limitado de investigadores por razones diversas,
como los derechos de autor.
2.2.3 Recursos electrónicos
Hay una multitud de recursos que apoyan los análisis por ordenador. Para los escáneres hay
programas de reconocimiento de caracteres ópticos (OCR), que por un lado aportan
considerablemente a la aceleración del proceso de escaneamiento, pero que todavía necesitan
desarrollarse mucho, porque la corrección de todos los errores de reconocimiento del programa
sigue siendo es muy alto (Olohan 2004:50). Además, existen programas de análisis que tienen
una índole estadística y que son más populares entre los investigadores porque facilitan la
producción de resúmenes del corpus o de la selección investigada. Estos resúmenes incluyen
listas de los cien palabras usadas más frecuentemente, la longitud media de las oraciones y la
type-token-ratio, que da una indicación de la repetitividad del texto. Estos tipos de análisis no
dan informaciones absolutas sobre el corpus, pero son una ayuda imprescindible para poner en
perspectiva tanto la complejidad de los textos usados como las relaciones entre el corpus
investigado y otros corpus (Pérez Hernández, 6.1.1).
Entre los recursos más usados también encontramos los programas para hacer concordancias
KWIC (Key-Word-In-Context), con los que se pueden encontrar resultados muy interesantes
15 Véase http://www.llc.manchester.ac.uk/ctis/postgraduate/research/phd-theses/Laviosa/ 16 Véase http://corpus.rae.es/creanet.html y http://corpus.rae.es/cordenet.html
17 Véase http://www.languagemagazine.be/artikellm02502.html
18 Véase http://ricoterm.iula.upf.edu/index.htm; en los proyectos actuales se aumentará el corpus por
textos en gallego y vasco. El corpus no está accesible por Internet.
en el campo del uso de la lengua o de la terminología. Además hay programas de alineación
que facilitan la comparación de textos de una lengua origen con los textos de la lengua meta.
Una gran ventaja de estos programas es la gran accesibilidad por la red, por lo que los análisis
de concordancia se llevan a cabo más fácilmente que los otros, más complicados.
Cuando se quiere realizar una investigación de enfoque diferente, muchas veces faltan
programas de análisis efectivos o eficaces. Hay pocos recursos para el análisis gramatical que a
veces tampoco permiten acceso por la red. Los análisis gramaticales son difíciles de llevar a
cabo por el tiempo y la capacidad que requieren (Hallebeek 1992), y aunque el desarrollo de
analizadores sintácticos ciertamente ha avanzado mucho, queda el problema de la naturaleza de
la sintaxis. Mientras que el español tiene una morfología relativamente rigurosa que en la
mayoría de los casos permita una clara distinción entre los verbos y adverbios y las otras
categorías porque hay menos desinencias ambiguas, el holandés es más complejo desde esta
perspectiva por la ausencia de un componente morfológico claro que permite ciertas
distinciones básicas. Si se toma en consideración los datos de Hallebeek de 1990 (Hallebeek
1992), los problemas centrales del proceso de análisis automático son la capacidad limitada del
análisis de oraciones con un número de palabras elevado y la ambigüedad de los resultados,
que a veces pueden subir a unos seis diferentes análisis posibles (1992:325).
El área del análisis automático sigue desarrollándose, no obstante, con rapidez: en las pasadas
décadas, la rapidez de los sistemas operativos y la densidad se han doblado varias veces. Estos
y otros desarrollos en la informática promocionan el perfeccionamiento de los lenguajes
formales que a su vez permiten un análisis sintáctico automático más rápido y eficaz. Así se
facilita la extracción de datos de córpora también mediante la gramática (Subirats-Rüggeberg y
Ortega Gil 2001:155-159). Los córpora electrónicos pues sirven bien (y cada vez mejor) para
análisis hechos con asistencia del ordenador. Se pueden usar para llevar a cabo simples análisis
para caracterizar el corpus usado y establecer concordancias para conseguir un entendimiento
más profundo del uso de la lengua. Hoy en día incluso existen programas de análisis sintáctico
accesibles por la red
20que permiten el análisis de oraciones en varias lenguas que son
claramente estructuradas en cuanto a la morfosintáxis, pero para las lenguas que no tienen una
20 Véase p.ej. la interesantísima página de aprendizaje sintáctico visual e interactivo de la Syddansk
estructura tan regular, como p.ej. el holandés, todavía es difícil tal análisis
21. Las dos páginas
que hemos encontrado para conducir un análisis sintáctico de oraciones holandesas, tuvieron
problemas con el servidor, por lo que no ha habido sido posible evaluarlas.
222.3 Presentación del corpus usado en el análisis
El propósito de este trabajo es investigar las diferencias entre oraciones españolas originales y
sus traducciones al holandés. Para realizarlo, necesitamos datos. Estos datos los encontramos
en varios sitios, entre ellos los libros de gramática. En éstos se describen todas las
construcciones posibles que se permiten en una lengua, pero no se da mucha información sobre
el uso actual de estas construcciones ni sobre la frecuencia con la que aparecen. Por eso, la
recogida de datos para un estudio no puede depender solamente de los libros de gramática, ni
de la mera intuición del investigador, porque tales datos son poco controlables y además
subjetivos, lo que significa que a veces no son correctos, como señala Gloria Corpas Pastor
(2003:86).
La solución del problema viene de la aportación de la lingüística del corpus a la traductología:
un corpus pequeño, independiente, compuesto especialmente para el análisis que queremos
llevar a cabo aquí, nos suministrará los datos indispensables. Por razones de carácter práctico y
de accesibilidad usaremos un corpus reducido. La realización del análisis, como lo describimos
en el capítulo 4, consume demasiado tiempo para llevarse a cabo en un corpus más extenso.
Por eso vale la pena componer un corpus pequeño según criterios de selección específicos; una
selección al azar solamente se puede llevar a cabo si ya hay una visión de conjunto establecida
de la populación entre la que se quiere seleccionar. Pero muchas veces se da el problema de
que el campo no es fácil de abarcar. La vasta producción de material lingüístico es
indeterminable, y, además tiene un papel importante en esto la accesibilidad de estos
materiales, por lo que parece mejor factible el camino medio de abarcar un submarco en el
campo entero y seleccionar entre los textos de este submarco.
21 Para el español p.ej. es posible hacer un análisis automático de cualquier oración que se quiere en el
mismo sitio de la Universidad sud-danesa, incluso se puede elegir entre varias maneras de
representación, pero para el holandés solamente es posible hacer análisis de oraciones preformuladas.
22 Los enlaces para estos sitios son: http://www.cnts.ua.ac.be/cgi-bin/nlsp y
El primer paso consiste en la exclusión de uno de dos modos posibles propuestos por Atkins et
al. (1992:5). Excluimos el modo hablado, es decir, cualquier material hablado, y estipulamos
que el medio (íbid.) debe ser libros publicados. Como en ambas lenguas cada año se publican
una multitud de obras originales y traducidos, es lógico partir de los números más bajos de
libros traducidos del holandés al español o del español al holandés. Presuponemos, por el
número relativamente pequeño de hablantes del holandés frente al número de
hispanohablantes, que se traduce más del español al holandés que viceversa. Nuestro
razonamiento supone que el holandés como lengua con menos hablantes probablemente es una
lengua menos importante de aprender en los países hispanohablantes – en contraste con el
español, que es una lengua que en Holanda se enseña en gran número de bachilleratos – y que,
por consecuencia, hay menos traductores que traducen del holandés al español.
Los datos de libros que se han traducido del holandés al español se recogieron hace años en la
sección “Bibliografie van het Nederlandse boek in vertaling” de la revista Ons Erfdeel
23y
también se publican en el sitio web del Fondo de Procucción y Traducción Literaria
Neerlandés. Por razones económicas y de tiempo, se han limitado los términos de la búsqueda
a los años entre 1995 y 2005 para evitar posibles diferencias diacrónicas.
24Advertimos al
lector que no es posible determinar el grado de todos los parámetros con seguridad, ya que
algunas obras se escriben o traducen en un cierto año y se publican a veces más tarde.
En la década de 1995 a 2005 se publicaron unas 170 obras traducidas del holandés al español
25,
de los que 76 eran novelas, 55 de literatura para niños, y 69 de áreas tan diversas como la
ciencia, el ocio, el teatro, la poesía, lo espiritual (que comprende tanto las obras sobre la
religión como la esotérica), o unos compendios. Algunas obras fueron traducidas a través de
otra lengua, como el inglés, francés o alemán. De las 167 traducciones, un total de 67 obras fue
publicado más de cinco años después de la publicación del original holandés, y entre ellos 28
más de diez años más tarde. Las obras que han sido traducidas a través de otro idioma se han
dejado fuera de consideración. Y también las obras del área mixta han sido dejadas fuera de
23 Desde el tercer número de 2005 de Ons Erfdeel se cesó esta recogida de datos después de la 150a
parte. Los datos también se pueden encontrar en la red, en el sitio del Nederlands Literair Productie- en Vertalingenfonds: nlpfv.nl/translations.
24 Un ejemplo para una obra antigua traducida aún a través del alemán al español es la obra de Johan
Huizinga, El otoño de la Edad Media, publicada en 1919 y traducida a través del alemán al español y publicada en 1931 y 2001. Ejemplos de autores españoles antiguos que se traducen al holandés son Cervantes, Pérez Galdós y García Lorca.
25 En estos números no se han incluido reediciones aparecidas en la misma década. Sin embargo,
consideración porque se trataba de compendios o antologías sin fechas específicas de
publicación de la versión holandesa. Así quedan 143 obras traducidas, y, si también limitamos
el año de publicación de la obra original a la misma década, quedan unas 33 novelas, veinte
libros para niños y 16 obras de áreas diversas. Podemos decir, pues, que entre la producción
total de traducciones compilada por la Biblioteca Real de Holanda, la traducción literaria es la
más prolífica, por lo que es el marco que invita más a la selección de textos para un corpus.
Con referencia al holandés, es evidente la preferencia por la traducción de novelas; por eso es
sencillo excluir de antemano todas las obras traducidas del español al holandés que no sean
novelas. De esta manera, resulta un número de 222 obras traducidas entre 1995 y 2005, sin
contar reediciones.
26Ahora sí hay que tener en cuenta que el dominio de la lengua española se
extiende sobre dos continentes, el europeo y el sudamericano. Por eso también se puede dividir
la producción de traducciones en dos áreas: novelas de España y novelas de Latinoamérica. Del
total de 222 novelas traducidas, 111 son de autores latinoamericanos, y 111 de autores
españoles
27. Si se excluyen, tan como en la selección de novelas holandesas, las obras cuya
versión original se publicó antes de la década de selección, quedan 67 obras latinoamericanas y
70 españolas. Con respecto al número de hablantes de cada lengua, podemos decir que el
número de traducciones del castellano es mucho más alto, incluso más alto que el número de
traducción de novelas latinoamericanas, lo que resulta algo sorprendente por la supuesta
popularidad más alta de los autores hispanoamericanos.
En el punto de la extensión del dominio de la lengua española, se adelanta también el problema
del aspecto diatópico, es decir el de las diferencias geográficas de la lengua, en la construcción
del corpus, porque, aunque es evidente que incluso en un mismo país se emplean regionalismos
y se habla de maneras diferentes, con veinte países de habla hispana estas diferencias pueden
ser más extensas. Para excluir la posibilidad de que los resultados de nuestro análisis se
distorsionen por las diferencias sintácticas en el uso del castellano de Latinoamérica o de
España, el corpus seleccionado para este estudio consta de una sola área de la lengua. Así, los
resultados se pueden usar como materia de contraste en otro estudio sobre las diferencias entre
26 Los resultados se han obtenido mediante dos búsquedas en la buscadora de la KB, www.kb.nl. Las
reediciones fueron quitadas a mano. La lista de autores españoles se puede encontrar en el apéndice.
27 Repasando los datos, en general, se da la impresión de que a los autores latinoamericanos se traducen
la sintaxis española y latinoamericana. Por eso hemos decidido limitar el corpus a un solo
continente, el europeo, para evitar tales influencias diatópicas posibles.
Entonces, quedan dos preselecciones de 33 obras holandesas traducidas al castellano y 70
títulos españoles traducidos al holandés. Partiendo de estos números, hicimos dos selecciones
de 5 obras en cada lengua, una para el análisis, y otra para contrastar los resultados. Pero, con
todo eso, la selección de los textos todavía no se lleva a cabo totalmente al azar; si comparamos
la repartición de los autores, vemos que hay más autores masculinos que femeninos: las obras
españolas fueron escritas por 51 autores, entre ellos 36 son varones y 15 mujeres, y las obras
holandesas por 23 autores, de los que 16 son varones y 7 mujeres.
Para el corpus de análisis escogimos cinco obras de cinco autores españoles y cinco
holandeses. Para minimizar cualquier aparición de predisposición para la investigación y para
reducir la influencia de idiosincrasias por parte de los autores, cada autor aparece solamente
una vez entre las obras seleccionadas para el corpus. Como el número de autoras es más bajo
que el de los autores masculinos, opinamos que la selección del corpus también tiene que
reflejar esta diferencia y decidimos seleccionar para cada corpus textos de tres escritores y dos
escritoras. La edad de los escritores seleccionados es variada, por dos razones: primero es
imposible reunir un corpus que incluya exclusivamente textos recién publicados de autores de
la misma generación. Hay pocas publicaciones entre las que seleccionar y el grupo de
traductores es muy pequeño, por lo que no se puede garantizar que todas las obras
seleccionadas sean traducidas por diferentes personas (véase más abajo). Segundo, partiendo
de la presuposición de que entre las generaciones hay diferencias en el uso de la lengua,
seleccionar un corpus solamente de escritores de la misma edad significaría negar la variación
del uso de la lengua entre las generaciones y con eso limitar la validez de los resultados aún
más. Las mismas consideraciones valen para el origen de los autores: aparte del abarcamiento
que ya hemos realizado es imposible seleccionar solamente autores de la misma área
geográfica, tanto por la producción como por la representatividad del uso de la lengua con sus
diferencias regionales mínimas.
traductoras es más o menos al revés: en la traducción de las obras españolas al holandés
colaboran un total de treinta traductores, entre los que siete son varones y 19 mujeres, y en la
traducción del holandés al español colaboraban diez traductores, entre ellos cuatro varones y
seis mujeres. De estos datos podemos deducir que la relación entre los traductores y las
traductoras es de 1:3 y 1:2 respectivamente.
Otra consideración es la del estilo: si cada autor tiene su propio estilo, también lo tendrá el
traductor. Es difícil determinar si el traductor se atiene al estilo del autor o si usa un estilo
propio
28. El fondo del problema es la interferencia: no hay modo de determinar si el traductor
(o, si se para uno a considerarlo, además el mismo autor) se encuentra bajo de la influencia de
otro autor. Cada estudiante del bachillerato recordará un ejemplo en el que un libro recién leído
influencia el estilo propio. Una investigación en esta materia seguramente es interesante, pero
no es el objeto de esta tesina. La materia se hace aún más compleja cuando se considera las
posibilidades de interferencias de otras lenguas etc. Por eso es menester hacer unas
simplificaciones; hemos decidido que las obras seleccionadas para el corpus deben ser
traducidos por diferentes traductores, y, para dar un reflejo de la relación entre los números de
traductores masculinos y femeninos, que el grupo de traductores debe consistir de por lo menos
por dos hombres y tres mujeres. De esta manera se limitan no sólo las influencias de
idiosincrasia de cada autor, sino también las del traductor. En cuanto a los aspectos de edad y
origen que hemos definido para los autores, para la mayoría de los traductores no ha sido
posible establecer ni su origen ni su edad.
Ahora, con cinco obras de cinco escritores para cada lengua, tenemos todavía un corpus bien
grande, que comprende varios centenares de páginas. El material seleccionado de cinco obras
constituye un corpus limitado, pero todavía es demasiado grande para conducir un análisis que
no consuma demasiado tiempo para un solo investigador. Por limitaciones de tiempo, hemos
decidido reducir aún más el tamaño del corpus; no usamos el libro entero de las cinco obras
seleccionadas, sino solamente un extracto de las primeras mil palabras. Un corpus tan pequeño
es relativamente fácil de componer, se evita la pérdida de tiempo en el proceso del
escaneamiento. Se hace posible una investigación preliminar en la que además se pueden variar
los textos que se analizan, lo que permite que varios investigadores se ocupen de las mismas
cuestiones y después se comunican en una colaboración. La cantidad de datos es fácil de
28 Un buen ejemplo de la investigación al estilo del traductor es el artículo de Mona Baker (1998) en