S OBRE LA LONGITUD Y LA COMPOSICIÓN DE ORACIONES ESPAÑOLAS Y HOLANDESAS

(1)

S

OBRE LA LONGITUD Y LA COMPOSICIÓN DE ORACIONES

ESPAÑOLAS Y HOLANDESAS

Estudio desde un punto de vista lingüístico-traductológico

H.A. Müller, s10209431

Tutora: S.I. Linn

Universidad de Groningen

Departamento de Filología Románica

(2)

(3)

Sumario

1 INTRODUCCIÓN...4

1.1 INTRODUCCIÓN...4

1.2 PLANTEAMIENTO...5

1.2.1 Dos presuposiciones sobre el español con respecto al holandés...6

1.2.2 Consideraciones en torno al método...6

1.2.3 La primera hipótesis ...8 1.2.4 La segunda hipótesis...13 1.3 RESUMEN...15 2 EL CORPUS ...17 2.1 INTRODUCCIÓN...17 2.2 PROBLEMAS METODOLÓGICOS...19 2.2.1 Sinopsis ...19

2.2.2 Los córpora electrónicos...22

2.2.3 Recursos electrónicos ...24

2.3 PRESENTACIÓN DEL CORPUS USADO EN EL ANÁLISIS...26

2.4 RESUMEN...32

3 ANÁLISIS ...34

3.1 INTRODUCCIÓN...34

3.2 LONGITUD DE LAS ORACIONES...35

3.3 ANÁLISIS DE LOS CONSTITUYENTES DE LA ORACIÓN...43

3.3.1 Introducción...43

3.3.2 Los problemas de análisis más frecuentes ...44

3.3.3 Los números de oraciones en el corpus de análisis ...48

3.3.4 Los números de oraciones en el corpus de control ...50

3.4 LAS ORACIONES MÁS LARGAS...52

3.5 RESUMEN...55

4 CONCLUSIÓN ...56

BIBLIOGRAFÍA ...58

BIBLIOGRAFÍA DEL CORPUS USADO...58

BIBLIOGRAFÍA GENERAL...58

BIBLIOGRAFÍA DEL CORPUS DE TEXTOS PERIÓDICOS...61

Periódicos holandeses...61

Periódicos españoles ...62

ENLACES USADOS:...63

APÉNDICE 1: LAS ABREVIATURAS USADAS EN EL ANÁLISIS GRAMATICAL...65

APÉNDICE A: TEXTOS DEL CORPUS DE ANÁLISIS ...66

(4)

1 Introducción

1.1 Introducción

Esta tesina investiga las diferencias entre el español y el holandés desde una perspectiva doble:

la del español como lengua extranjera (para holandeses) y la de la traducción. El estudio se

limita a dos aspectos de las diferencias entre el español y el holandés: las diferencias entre la

longitud de las oraciones y las diferencias en la construcción de oraciones compuestas. Se trata

de un estudio preliminar, es decir, se tratará de averiguar si los resultados merecen un estudio

más extensivo mediante la línea de investigación que describimos más adelante.

El área de interés principal lo formarán las semejanzas y diferencias con respecto a oraciones

compuestas entre textos españoles originales y sus traducciones al holandés. El primer punto de

partida será la comparación del número de palabras por oración, para ver si hay divergencias

generales. La longitud de las oraciones puede dar una idea más clara de la materia en que

indagamos y de las tendencias que esperamos descubrir. Luego, nos dirigimos a la gramática

para la segunda parte del análisis. El enfoque de la segunda parte estará en el número y la clase

de los constituyentes de las oraciones compuestas. Partimos de una perspectiva contrastiva, es

decir, comparamos las características de las oraciones sin juzgar la calidad de la traducción

para evitar perdernos en la crítica de traducción.

La meta del trabajo será alcanzar un mejor entendimiento de cómo se construyen oraciones

complejas en español y sus respectivas traducciones en holandés. Aunque no es nuestro intento

meternos en el estilo individual para este análisis, es inevitable rociarlo: es indiscutible que

todos los traductores – y si se quiere considerarlo, también todos los autores – tienen un estilo

propio. Sin embargo, una investigación de estilo contrastivo, como propuesto por Baker

(Baker:2000) requiere mucho más tiempo y una cantidad de material más grande. En este

análisis, por lo tanto, la atención principal no se dirigirá al estilo, sino que se lo discute

solamente cuando se considera necesario.

(5)

El material del corpus constará de textos literarios por razones de accesibilidad y

representatividad (véase 2.3).

El aspecto de la viabilidad del análisis predetermina que el corpus ha de ser relativamente

pequeño y nos la limita a señalar tendencias. No obstante, cuando se utiliza un corpus pequeño

es poco favorable para la representatividad tomar textos de varias áreas, porque es más difícil

generalizar los resultados de un corpus muy fragmentado.

Los resultados obtendremos mediante un análisis que consta de dos métodos: uno manual y

otro asistido por un programa de análisis. El número de palabras por oración puede

establecerse fácilmente de manera electrónica, el análisis de los constituyentes gramaticales se

hará manualmente. Hacer un análisis manual trae consigo una gran desventaja: consume

mucho tiempo. Desde el comienzo de las posibilidades de hacer análisis de corpus grandes por

medios electrónicos parece que los estudios individuales que consumen mucho tiempo son

evitados por no ser económicos. Puede ser que por eso haya resultados que hasta ahora se les

han escapado a los investigadores. En lo que atañe al análisis manual, es obvio que, salvo con

un pequeño corpus o en una colaboración de grupo, no es posible realizar un estudio profundo

en un tiempo limitado. Por eso la meta de este estudio se limita a obtener resultados

preliminares para un estudio más profundo y determinar si merece la pena llevar a cabo tal

estudio.

En el siguiente capítulo (1.2) presentamos el planteamiento para esta tesina. Luego, en el

capítulo 2 discutimos las aportaciones de la lingüística del corpus al marco de la traductología

y sus posibles beneficios para nuestra investigación. En el capítulo 3 llevamos a cabo el

análisis y discutimos los resultados. Por fin, daremos la conclusión en el capítulo 4.

1.2 Planteamiento

(6)

siempre está claro si la percepción de estas congruencias o diferencias es correcta. Es posible

que las presuposiciones sobre la lengua que nos formamos cuando estudiamos, sean inexactas o

incluso engañosas. En este trabajo nos fijamos principalmente en dos de estas presuposiciones:

la longitud de las oraciones y su composición gramatical. Para una mejor comprensión,

presentamos las presuposiciones que queremos investigar en el siguiente párrafo (1.2.1), y nos

formulamos las preguntas que plantearemos en el análisis (capítulo 3) de nuestra investigación.

Las preguntas las discutimos en los párrafos 1.2.3 y 1.2.4, después de comentar algunas

consideraciones sobre el método en 1.2.2. Presentamos las preguntas que investigamos en el

capítulo de análisis en 1.3.

1.2.1 Dos presuposiciones sobre el español con respecto al holandés

Como acabamos de decir en el párrafo anterior, el origen de las preguntas que proponemos está

en el proceso de aprender el español como lengua extranjera (L2), un proceso en el que,

además de aprender la gramática y el vocabulario, contrastamos la lengua base (L1) sobre la

que aprendemos, la L2, sea consciente o inconscientemente. Las diferencias que establecemos

de esta manera son variadas, y probablemente tan abundantes como difíciles de categorizar

1

_{. Si}

hacemos un intento de categorizar las dos cuestiones que queremos investigar, diríamos que se

trata de una mezcla de sintaxis y uso de la lengua. Las dos concepciones que queremos

investigar se concentran en la oración: la primera se fija en la longitud de las oraciones, y la

segunda en su composición. Primero discutimos algunas consideraciones en torno al método

con el que hacemos nuestra investigación. En los párrafos que siguen a continuación

discutimos nuestras preguntas.

1.2.2 Consideraciones en torno al método

Para llevar a cabo nuestra investigación, hacemos uso de un pequeño corpus. Este corpus

consta de textos literarios españoles y holandeses y sus respectivas traducciones. En lo que

atañe a la selección de textos literarios, hay dos objeciones que se pueden hacer: por un lado

hay un grupo de textos que es igualmente o incluso mejor accesible y representativo, como el

de los artículos periodísticos. Eso es verdad, pero los textos periodísticos apenas se traducen.

Por otro lado, se puede insistir en que el lenguaje literario no es representativo para el habla

general, pero tampoco lo es, por ejemplo, el lenguaje especializado de una u otra área técnica.

1_{No indagamos más en este asunto más apto para una investigación de aprendizaje de la lengua}

(7)

Además, el uso de textos de lenguaje especializado o técnico lleva consigo el riesgo de

interferencia del inglés, especialmente en la parte holandesa. La decisión de usar textos

literarios sin embargo proviene de varias consideraciones, de las que discutimos las dos más

importantes.

La primera consideración es el grado de especialización: los textos litererarios son poco

especializados en cuanto al uso de terminologías (García Yebra 1983: 40-43). Si no hay

lenguaje especializado, tampoco hay los riesgos de una estandardización e internacionalización

del vocabulario y con eso quizás también de la sintaxis (íbid). Así se previene la inclusión

inadvertida de interferencias de otras lenguas, como el inglés, en el corpus.

La segunda consideración es la de la accesibilidad (véase también cap. 2.2.2). Los textos

literarios – y en grado sumo sus traducciones – son más fáciles de conseguir que textos de otros

géneros, como textos científicos o comerciales. La buena accesibilidad de textos también se

aplica a textos periodísticos, pero es más difícil encontrar artículos que se han traducido. Como

la segunda parte de nuestro análisis se concentrará en las diferencias en la composición de

oraciones originales y traducidas es menester tener en cuenta también la accesibilidad de las

traducciones para garantizar un volumen de producción aceptable. Además, la fácil

identificación del traductor de un texto literario permite una distribución más equilibrada,

evitando que el corpus contenga, por ejemplo, un número demasiado alto de textos traducidos

por el mismo traductor. Así se previene una preferencia inadvertida del corpus para un cierto

estilo de traducir.

Sin embargo, el uso de textos literarios también lleva consigo unas desventajas que no se

pueden descartar. El autor literario tiene la libertad de desviarse de las convenciones

(8)

de la lengua origen que le permita interpretar los aspectos específicos del texto (García

Yebra 1983:127 y 132).

La recepción de una obra literaria traducida depende también del estilo del autor transmitido

por el traductor: es el estilo que hace que se reconozca al autor, y que por eso no se debe

ignorar al traducir. Este estilo lo hallamos entre otras cosas en la longitud y composición de las

oraciones, como queda manifiesto en p.ej. el estilo destacado de Pío Barroja. En un manual

para la documentación de la traducción, P.E. García sugiere que el primer paso en la

interpretación es el análisis del texto origen con respecto a la longitud de las oraciones y su

composición (P.E. García 2005:130). Son los aspectos de este análisis que nos interesan; nos

preguntamos ¿las oraciones españolas son igual de largas que las holandesas? y, ¿las oraciones

se componen diferentemente? Esta última cuestión la discutimos en el párrafo 1.2.4; en el

párrafo 1.2.3 nos dedicamos a la primera pregunta.

1.2.3 La primera hipótesis

La primera idea que queremos investigar es la supuesta diferencia en longitud media de las

oraciones españolas con relación a las holandesas. El origen de la concepción de que las

oraciones españolas serían más largas que las holandeses se halla en las clases de español como

lengua extranjera, en la que el estudiante libra la misma batalla con la tarea de entender las

oraciones largas y la cuestión de cómo formular sus propias oraciones lo mejor posible. Y, más

tarde, en las clases de traducción se refuerza esta hipotesis de que las oraciones españolas son

más largas. Pero, ¿es verdad? Hasta ahora hemos podido encontrar ninguna respuesta. Para

conocer el terreno en que indagamos conducimos primero una investigación de lo que se dice

en los manuales de traducción de y de redacción. Luego trataremos de averiguar mediante una

pequeña comparación con un corpus de textos no literarios si los textos literarios se desvían

mucho de los consejos de los manuales.

(9)

propone en una sola ocasión la importancia de dividir una oración larga en dos (Sequeros

1990:35). Un manual de traducción del español al holandés menciona en escasas ocasiones que

es mejor dividir una oración en dos (véase Slager 1990:110). Otro manual, que acaba de

publicarse, señala que en el proceso de la traducción del español al holandés muchas veces

conviene cortar las oraciones. Hasta parece como si fuera un procedimiento normal y necesario

para que el texto siga siendo legible (Linn y Slager 2007:214 y 219-221).

Estos consejos, no obstante, se limitan a los textos no literarios. En los textos literarios vale

más el estilo del autor, algo que es mucho más difícil conservar. En el Manual de

interpretación y traducción

de Manuel León (2000) se incluye un artículo en el que un escritor

se queja de que en algunas traducciones a varias lenguas, entre ellas el francés, de una de sus

obras se han cortado y cambiado sus oraciones cuidadosamente formuladas.

El conflicto básico está en escoger entre la fidelidad y la adecuación. El adagio de que una

traducción debe ser tan literal como posible y tan libre como necesario no se opone a la

exigencia de que el texto meta (TM) debe ser adecuado y que se debe adaptar al uso de la

lengua de los receptores. El conflicto entre la fidelidad del traductor al texto origen (TO) y la

adecuación al texto meta se extiende, especialmente con respecto a la literatura, también a otro

campo: el del estilo. Cortar oraciones sirve la legibilidad, o ¿no sirve más que a arruinar el

estilo del autor?

En los manuales de redacción, la actitud frente a la práctica de cortar oraciones largas no es

muy diferente. Aunque en los manuales de ambas lenguas gran parte de la atención recae sobre

el uso correcto de la lengua, hay ciertas diferencias en lo que atañe a oraciones largas. Los

manuales para escritores españoles no se concentran tanto en la longitud de la oración, sino

más en la estructura de la oración. Ésta debe ser clara e inteligible para el lector. Sarmiento

(1997:293) recomienda “cercar lo inútil” y Sabino (1987:190) enfatiza en la importancia del

uso correcto de los signos de puntuación en oraciones largas y complejas para evitar problemas

de comprensión.

(10)

un conocido manual de redacción holandés se exhorta al lector: “Help de lezer met een punt”

2

(Renkema 2002:78) y se recomienda no usar constantemente oraciones extensas o compuestas

con múltiples subordinadas (2002:80). En oposición a esta idea se critica el consejo dado a

(estudiantes) holandeses de evitar oraciones que contengan más de treinta palabras porque

serían demasiado largas e incomprensibles, especialmente para gente menos culta (Renkema

2002:78), y el mismo autor demuestra con unos ejemplos que la comprensibilidad de una

oración compleja depende de la estructura (2002:79). Además, en otro manual, en la sección de

los problemas de redacción más frecuentes, se pregunta al lector “Is de zin waaraan je schrijft

niet te lang

?”

3

_{(Reinsma 2003:202) y añade que una oración demasiado larga requiere un}

esfuerzo desproporcional del lector para recordar de lo que trata la oración. Estos consejos

indican que las oraciones holandesas pueden ser más cortas que las españolas, aunque también

hay un caso en el que se advierte que un exceso de oraciones cortas tampoco beneficia la

recepción del texto porque el estilo se parece al habla infantil (Onrust et al., 1999: 159). Los

holandeses refieren a tal estilo con el término “Jip-en-Janneke-taal”, aludiendo a los famosos

libros para niños de Annie M.G. Schmidt, publicados entre 1960 y 1965.

4

De los manuales que hemos revisado notamos que importa más a los holandeses que las

oraciones no sean demasiadas largas y complejas que a los españoles. Mientras que en los

manuales de redacción holandeses se dan direcciones claras de no formular oraciones

demasiado largas, en los españoles se enfatiza que las oraciones redactadas deben ser correctas

gramatical y sintácticamente. A pesar de todos los consejos salta a la vista que ninguno de los

manuales da una definición de lo que es una oración demasiado larga. Lo que los manuales de

ambas lenguas tienen en común es la insistencia en la variación entre oraciones cortas y largas.

No encontramos, sin embargo, recomendaciones para la redacción de textos literarios.

Para pasar a otro medio de comunicación hacemos también una búsqueda en la red. Internet,

que es para muchos un medio de búsqueda de información rápida sobre cualquier asunto, nos

podría dar algunas pistas. Recordemos que esta torrente de información al azar tan fácilmente

accesible a cada hora no siempre es la más objetiva o fidedigna; las múltiples páginas de

información reflejan, sin embargo, la actitud de la gente en cuanto a muchos asuntos. Es por lo

tanto obvio que también hay un sinfín de sitios que dan consejos sobre cómo escribir. Si

2_{“Ayude a sus lectores: ¡use el punto!” [traducción mía]}

3_{“¿No es demasiado larga la oración que está construyendo?” [traducción mía]}

4_{Los libros han sido traducidos por Laurence Schröder y fueron publicados en España bajo el nombre}

(11)

echamos un vistazo a estos sitios veremos igualmente que existen enormes diferencias al

respecto. Entre los sitios dirigidos a hispanohablantes, hay menos sitios en los que se dan

normas sobre el número de palabras por oración, e incluso parece otra vez que, aunque se

recomienda no usar oraciones demasiado largas y complejas

5

, no importa tanto el número de

palabras como en los sitios holandeses. Los consejos que sí se pueden encontrar son, no

obstante, muy divergentes. Mientras que en un sitio en castellano se comenta que “Deben

utilizarse oraciones de 20 palabras por oración, como máximo.”

6

_{, en otro se recomienda: “Use}

un promedio de 30 ó 35 palabras por oración”

7

. Entre una longitud media entre veinte y treinta

palabras, todo parece aceptable.

En cuanto a los sitios holandeses no es muy difícil tampoco encontrar instrucciones sobre la

longitud de oraciones. La información que se encuentra en los sitios españoles otra vez es

abundante e igualmente variada, si no es aún más variada. En la mayoría de los sitios se

aconseja mantener un promedio de doce o de quince a dieciocho palabras por oración. Las

recomendaciones sobre el número máximo, sin embargo, varían mucho, y mientras que en dos

sitios se aconseja al escritor no usar más de 25 o 30 palabras

8

hay también sitios en que se

opina que no es aconsejable usar más de 15 palabras por oración

9

. Además de esto, se exhorta

al escritor no usar oraciones complejas sino repartir el contenido sobre dos oraciones: “Schrijf

geen lange zinnen met ingewikkelde bijzinnen. Maak er dan liever twee zinnen van.

”.

10

Si comparamos los consejos que se dan en los manuales imprimidos con los de Internet, salta a

la vista que en los primeros no se menciona cuántas palabras una oración debe promediar,

mientras que en las páginas web se dan números que son concretos, pero que al mismo tiempo

varían mucho. Así parece, después del examen de las páginas web, que el ideal del promedio

de palabras por oración oscila alrededor de unos 15 palabras para los holandeses. El ideal de

los españoles por otro lado no es fácil de determinar: muchas veces no se dan números

5_{Véase p.ej. el consejo en la web de esta universidad colombiana:}

http://ayura.udea.edu.co/~fisica/ARCHIVOS%20GENERALES/ELABORACIONTEXTO.pdf: “No escriba oraciones muy largas y complejas”.

6_{Véase: www.fonaiap.gov.ve/publica/divulga/fd59/instruc.html} 7_{Véase: http://www.slideshare.net/maocandamil/taller-de-escritura-web} 8_{Véase: http://www.leesbaarnederlands.nl/taal.htm y}

http://www.kwaliteitscholen.nl/kwaliteitsite/kwaliteitscholen/html/general.asp?PID=95

9_{Véase: http://www.rooskleurig.nl/tekst.html}

10_{Tomado de un manual para gerentes en:}

(12)

concretos y los pocos números que se dan varían mucho. Si tomamos un medio de los números

disponibles, vemos que éste varía entre veinte a veinticinco palabras por oración.

De esta primera investigación de los medios escritos sobre la longitud media de las oraciones

pasamos a una investigación algo más práctica: hacemos una pequeña comparación de textos

periódicos españoles y holandeses para determinar cuál es el promedio de palabras por oración

general. Los textos provienen de cinco periódicos en ambas lenguas que se publican en la red.

11

Los textos también han sido elegidos al azar, con la única restricción de que los artículos no

sean muy cortas para que no consuma demasiado tiempo recoger un corpus de tamaño

aceptable. El corpus de textos periodísticos consta, de dos partes de unas cinco mil palabras

para cada una de las lenguas. Para el análisis de los textos recogidos usamos el programa

Corpus Presenter Lite

de Raymond Hickey (para una descripción más precisa del programa

véase capítulo 4.2).

A base de los números dados en los diversos sitios web ya se podía estimar prudentemente que

la longitud de las oraciones holandesas debía de promediar acerca de unos quince palabras por

oración. Hacer un cálculo estimativo para la longitud de las oraciones españolas, sin embargo,

no fue tan fácil. Los escasos números que se daban eran demasiado divergentes para que fuera

posible determinar una longitud media realista. Esperamos que en el análisis de nuestro corpus

periodístico resultará que las oraciones holandesas promedian unas quince palabras y por eso

son mucho más cortas que las españolas, para las que estimamos un número medio de entre

veinte y veinticinco palabras por oración.

Periódicos neerlandeses Periódicos españoles

Número de palabras 5196 5180

Número de oraciones 339 163

Longitud media 15.3 31.8

Cuadro 1: Datos estadísticos para un corpus de textos periodísticos

11_{Los periódicos españoles son: El País, El Mundo, La Vanguardia, El Periódico y ABC; y los}

(13)

En el cuadro 1 podemos ver que la longitud media de los textos holandeses se difiere

considerablemente de los españoles: según nuestro análisis hay una diferencia de la longitud

media de un casi 50%; mientras que en los textos holandeses ésta es 15.3, en los textos

españoles alcanza un número de más de treinta palabras. Los veinte a veinticinco palabras que

estimamos más arriba se sobrepasan con más de cinco palabras. No obstante, hay que tener en

cuenta una consideración: los textos periodísticos no son representativos para todos los géneros

de textos, aunque representan gran parte de la lectura cotidiana. Si consideramos el estatus

especial que tiene el texto literario (véase más arriba) con respecto a la libertad creativa, sería

de interés saber si los textos literarios españoles también tienen un número de promedio más

alto que los holandeses. En el capítulo 3.2 conducimos un análisis usando un corpus algo más

amplio de textos literarios para ver si las oraciones son más largas o menos largas que los

textos no literarios.

La pregunta por la diferencia entre la longitud media de oraciones españolas y holandesas

entonces se amplía con dos preguntas más: ¿las oraciones traducidas son igualmente largas o

difieren de longitud? y, ¿se suelen cortar oraciones en la traducción literaria?

1.2.4 La segunda hipótesis

La segunda pregunta que nos hacemos está relacionada con las diferencias entre los

constituyentes de las oraciones compuestas. Las diferencias entre el español y el holandés son

obvias; las lenguas incluso pertenecen a diferentes familias lingüísticas. Pero también hay

semejanzas que se aplican a todas las lenguas; las oraciones siempre se componen de los

mismos constituyentes básicos de sujeto y predicado. El hecho de que el análisis gramatical es

un método uniforme para denominar los constituyentes de una oración lo hace un medio muy

apto para la comparación de ciertos aspectos sintácticos: mientras que en ambas lenguas se

dispone de los mismos elementos para describir oraciones, en ambas lenguas estos elementos

se usan diferentemente en la construcción gramatical de las oraciones.

(14)

discrepancias en varios niveles, como p.ej. en el uso de las preposiciones o de los verbos

auxiliares. Pero parece también que se concentran mucho más en el nivel de la palabra que en

el de la oración. Además las obras contrastan el español con el alemán (Cartagena y Gauger) o

el español con el inglés, el francés y el alemán; no incluyen al holandés. Se puede obtener un

entendimiento de las diferencias entre el castellano y el holandés de los manuales de gramática

española holandeses, en los que se describen también unas particularidades de la lengua

holandesa, del manual de gramática holandesa para españoles de Van Dam y Oostendorp

(1965

12

), y, por fin, se puede encontrarlas en la red, donde hay una multitud de recursos.

13

No es nuestro objeto hacer una comparación exhaustiva de los idiomas, sino que queremos

confirmar (o refutar) unas impresiones que han surgido en las clases de español. No es nuestro

objeto hacer una comparación exhaustiva de los idiomas, sino que queremos confirmar (o

refutar) unas impresiones que han surgido en las clases de español. En éstas, hay un sinnúmero

de momentos en los que el estudiante busca la manera más adecuada de expresarse y al buscar

se forma hipótesis sobre el uso de la lengua. Un ejemplo de esto es la búsqueda de alternativas

para ciertas conjunciones holandeses durante las tareas de redacción, cuando parece que en el

español se usara mucho más la conjunción ‘que’. Se da la impresión de que en español hay más

oraciones relativas que en holandés. Al mismo tiempo se observa que ciertas construcciones

típicamente españolas apenas se usan en neerlandés, como p.ej. la cláusula absoluta, que

muchas veces tiene la función de complemento circunstancial. Otro ejemplo de eso es el uso

relativamente frecuente del gerundio en español, que en el holandés se usa mucho menos y que

por eso hay que traducir diferentemente (Slager 1990:110). Las construcciones con gerundio

también tienen la función de un complemento circunstancial en la mayoría de sus ocurrencias.

En cuanto a los cambios de la estructura de oraciones durante la traducción, los teóricos tienen

puntos de vista diferentes. Para dar unos ejemplos, Baker observa que hay cambios de la

estructura de la oración que son necesarios por razones semánticas, la información se reparte

diferentemente para que el texto alcance mejor a sus receptores (1992:124-125). En el análisis

(cap. 3.3) comparamos por eso el número de varios tipos de oraciones subordinadas para saber

si hay diferencias en la frecuencia con la que se usan p.ej. oraciones subordinadas adverbiales

en los textos españoles o holandeses.

(15)

En el caso presente, seguimos siendo curiosos de saber si las oraciones compuestas se

construyen de manera diferente. Nos preguntamos particularmente si las oraciones tienen una

estructura diferente en cuanto a la manera de coordinar oraciones y en cuanto al número y los

tipos de oraciones subordinadas. Además, la revisión de los medios descritos más arriba nos

lleva a la pregunta si los traductores se atienen a la estructura del texto origen o que si hacen

cambios para aproximarse más al uso de la lengua meta. Esperamos llegar a un entendimiento

más profundo de esta materia en el análisis (cap. 3).

Por eso en la segunda parte del análisis (capítulo 3) compararemos los resultados del análisis

sintáctico de las dos partes del corpus literario que elegimos para esta investigación. En esta

comparación incluimos tanto el número de oraciones principales como los números y tipos de

las subordinadas. Con ayuda de los resultados del análisis esperamos llegar a un entendimiento

más profundo de las diferencias y semejanzas entre ambas lenguas con respecto a la manera en

que se construyen las oraciones compuestas. Como ya indicábamos en la introducción,

deseamos también establecer si el estudio de estas diferencias puede resultar en un marco de

investigación fructífera para la formación de teorías en torno a la traducción.

1.3 Resumen

(16)

La segunda hipótesis que hemos discutido es la supuesta diferencia de construcción gramatical

que el estudiante llega a creer durante la búsqueda de formulaciones apropiadas. Hay ciertas

construcciones que se usan diferentemente en español. En la literatura sobre el tema no

encontramos mucho sobre las diferencias de construcción gramatical: si hay varias

comparaciones entre el español y otras lenguas, hay pocas entre el español y el holandés.

Muchas de estas obras se concentran en el nivel de la palabra, pero también hay aportaciones

de la lingüística del texto. Esperamos hacer una modesta aportación a la clarificación de la

cuestión si hay diferencias en la frecuencia del uso de las subordinadas mediante nuestro

análisis, aunque la validez de los resultados permanezca limitada.

Resumiendo, las preguntas que investigaremos en el capítulo del análisis y que constituyen el

punto de partida para esta tesina son las siguientes:

1 ¿Los autores literarios holandeses prefieren escribir oraciones más cortas que los

españoles?

a) ¿Esa preferencia se refleja en los textos traducidos del español al holandés y viceversa? y

b) ¿Los traductores literarios suelen cortar oraciones en la traducción literaria del español al

holandés?

2 ¿Hay diferencias gramaticales entre las oraciones compuestas entre el holandés y el

español?

a) Si las hay, ¿cuáles son?

b) ¿Estas diferencias en la construcción las vemos también en la traducción español–

holandés?

(17)

2 El corpus

2.1 Introducción

En el capítulo anterior formulamos el planteamiento de esta tesina. Hemos presentado las dos

preguntas que queremos investigar, a saber si hay diferencias en la longitud de las oraciones y

en la composición gramatical de las oraciones compuestas. Las preguntas parciales que estas

preguntas llevan consigo se refieren en primer lugar a la pregunta si estas diferencias también

se manifiestan en textos traducidos. Para la investigación optamos por un análisis de un

pequeño corpus de textos literarios. En el presente capítulo damos una breve discusión del uso

de córpora. Empezamos con una introducción a la lingüística del corpus general. En el

siguiente subcapítulo (2.2) discutimos los problemas metodológicos del marco teórico.

Después de la exposición teórica, procedemos en el capítulo 2.3 a la descripción del proceso de

selección y construcción que recorrimos y presentamos el corpus que usamos en el análisis

(cap. 3).

Hoy día, toda ciencia se define en criterios de objetividad, representatividad, repetibilidad,

transparencia y precisión. Toda disciplina científica que reclame un lugar en el mundo

científico moderno debe cumplir con estas exigencias. Pero, mientras en las ciencias naturales

el objeto de estudio es más o menos invariable, es variable en otras, entre ellas la traductología.

Esto pone una serie de problemas de índole filosófica y teórica en cuya discusión no

indagamos en este estudio; si se quiere saber más sobre el fondo de estos problemas, referimos

a los libros sobre la filosofía de ciencia.

(18)

por un lado en los topoi, los ‘lugares comunes’ que para todos tienen el mismo significado, y

por otro lado, en una serie de valoraciones individuales. La otra parte de la que depende una

traducción es la expresión, la reformulación de lo interpretado a la lengua meta (LM). En este

punto hay que tener en cuenta la pluralidad de la lengua, que en ciertos casos nos abastece con

una multitud de locuciones, sinónimos etc. que en combinación con las decisiones individuales

del traductor pueden dar resultados diferentes. La ausencia de constancia del objeto de

investigación compromete la repetibilidad de las investigaciones para reconfirmar los datos

obtenidos y limita las posibilidades de generalización. La variabilidad de los datos dificulta la

posibilidad de efectuar estudios trasparentes y precisos con una cantidad de material de

investigación comparable.

En la historia de la traductología, se ha luchado mucho con estos criterios. Ya en los enfoques

normativos (como p.ej. el de Benjamin o el de Newmark, descritos en: Stolze 1997:34-35 y

80-83) se han hecho esfuerzos para cumplir con criterios de objetividad, a pesar de las pocas

posibilidades de una traductología que todavía dependía de datos obtenidos por introspección.

Aunque eran muchos los esfuerzos de captar la intuición en un modelo general aplicable, eran

poco exitosos. Por otro lado, los enfoques descriptivos echaban de menos las posibilidades de

obtener resultados basados en un número de ocurrencias representativo; había que limitarse a la

comparación sistemática de dos o más textos (Stolze 1997:168ss y 173). Y según Schmitt, la

traductología no era un marco de investigación claramente abarcado hasta en 1993, sino que

era un marco que investigaba las competencias individuales de los traductores (1993:41-43).

(19)

2.2 Problemas metodológicos

2.2.1 Sinopsis

La introducción de la lingüística del corpus electrónico a la traductología ofreció nuevas

perspectivas, y un camino hacia la aceptación científica porque se permiten generalizaciones

controlables y resultados confirmados a base de la mayor trasparencia de los estudios y la

accesibilidad al material estudiado por diversos investigadores. Un corpus electrónico, en la

definición de Atkins et al. (1992:1) es una subsección de una colección (librería) de textos en

forma electrónica (ETL; ídem) más voluminosa, compilada según criterios de diseño

específicos, de los que un investigador hace una selección para su corpus. Compilar una

librería grande, sin embargo, apenas es factible para un investigador desde el punto de vista del

tiempo que puede invertir y de la cantidad de material que hay que compilar (Van

Doorslaer 1995:246).

Por consecuencia, muchos córpora no parten de una librería de textos en forma electrónica,

sino que se construyen directamente, según criterios de diseño formulados específicamente

para el tipo de investigación que se quiere hacer (Baker 1995:224). Estos criterios de selección

se basan en criterios externos, no lingüísticos, e internos, lingüísticos (Atkins et al.: 1992:5).

Los últimos se concentran en la descripción y clasificación de los textos en el corpus, el tipo de

lenguaje (formal o informal) etc., mientras los externos se ocupan de datos sobre la naturaleza

de los textos (hablados, escritos o ambos, qué tipo de medio de comunicación), los autores y

los traductores etc (Baker 1995:229-239 y Atkins et al.: 1992:6-10). Aunque muchos de los

textos de los córpora se basan en criterios específicos y raras veces son seleccionados al azar,

p.ej. por razones de la accesibilidad (véase más abajo), en la presentación del corpus en los

artículos muchas veces no se describen los criterios de selección, como nota Van Doorslaer

(1995:246). Además, apenas hay criterios para evaluar la calidad de los textos (Van

Doorslaer: 1995:250) a pesar de las generalizaciones frecuentes sobre la cantidad y la calidad

de los textos.

(20)

1998, n

o

4). Pero también saltan a la vista las diferentes descripciones de los córpora: en

muchos artículos éstas se adhieren a diferentes maneras de describir el corpus; en estudios de

córpora grandes muchas veces se menciona el número de palabras que contienen, pero con los

más pequeños, las descripciones a veces se limitan a referir el número de oraciones o textos.

No hay una sola manera de describir el tamaño de los córpora, como p.ej. una referencia al

número de unidades del idioma, porque todavía no hay una definición clara de lo que

constituye tal unidad (Atkins et al. 1992:4). Mientras tanto, parece como si la mayoría de los

investigadores ha aceptado los criterios que propone Baker (Olohan 2004:43s).

Ya en 1992, Atkins et al. (Atkins et al.: 12) proponen el establecimiento de un marco común

para la estandardización y valoración de córpora mediante criterios descriptivos. En su cuadro

de definición, el modo del corpus designa si se trata de un corpus de textos escritos o de

materiales hablados y el medio alude al medio de comunicación o diseminación usado para

publicar el texto, como p.ej. en forma de libro, texto html, etc (Atkins et al. 1992:5). Los

autores proponen también una descripción tipológica muy extensa, que incluye no sólo la

descripción del tipo de texto, sino también la información bibliográfica (como p.ej. el tema o

grado de especialización del texto etc.), e información sobre el autor (como p.ej. su

nacionalidad y sexo etc). Estos criterios descriptivos del corpus fueron ampliados por Sara

Laviosa en 1997 (Target 9/2) para desarrollar y consolidar el marco metodológico de la

lingüística del corpus.

En un artículo en Target (vol. 7/2, 1995), Baker exhorta al establecimiento de criterios para una

metodología coherente para las investigaciones del corpus. La autora observa que la definición

de los córpora depende de la meta de la investigación (1995:225). Por eso, según Baker, es útil

diferenciar entre tres tipos de córpora básicos:

• el corpus paralelo, que consiste de un texto origen (TO) y varias traducciones en una o

varias lenguas meta (LM) para fines descriptivos (1995:230);

• el corpus multilingual, que reúne dos o más córpora en diferentes lenguas pero

compuesto según criterios de diseño similares y que sirven para la comparación de rasgos

lingüísticos (1995:232);

(21)

“tercer código” (1995:234-235), que es un tipo de cruce de la lengua meta con rasgos de la

lengua de origen.

No obstante, aparte de estos desarrollos muy positivos, también hay unas áreas que siguen

siendo problemáticas. Primero, hasta incluso el presente, no se ha llegado a un consenso en la

tipología de textos y parece que será difícil conseguir tal consenso: cada investigador que

propone una tipología tiene una perspectiva diferente de la de los otros, con la consecuencia de

que de los investigadores posteriores, unos siguen la definición de cierta autoridad, mientras

que otros prefieren la categorización de otra. En segundo lugar, la descriptividad de los córpora

que contienen una parte de textos traducidos también depende de la relación entre la lengua

origen (LO) y la lengua meta (LM) (Van Doorslaer 1995:247).

Otra área problemática en la descripción de los córpora es su representatividad. Según la teoría

de estadística, la representatividad del corpus dependería de la populación investigada, y debe

determinarse ésta exactamente antes de hacer una selección (Atkins et al. 1992:2). Pero en el

campo de la lingüística del corpus, esto lleva consigo unos problemas propios: no es posible

examinar toda la producción ni determinarla (ibíd.), sobre todo cuando se considera que el acto

de escribir es en esencia poco natural y que hablamos significativamente más de lo que

escribimos. A pesar de que hay varios córpora de lengua hablada, éstos todavía recogen un

mero fragmento de lo que diariamente se habla. Un factor adicional que hay que tener en

cuenta es la variabilidad del habla individual, por lo que se recomienda usar un corpus de

autores diferentes, cuando no se investigan las peculiaridades de un cierto autor, para que el

lenguaje bajo investigación pueda ser lo suficientemente variado (ibíd.) y por eso no

representativo. Además, una selección que parte de criterios de diseño específicos no puede

escapar a cierta predisposición del investigador (Atkins et al.: 2) ya que no sería lógico

seleccionar textos que no sean aptos para el análisis que se quiere hacer, sobre todo si se trata

de una investigación prospectiva, en la que se quiere determinar si vale la pena el tipo de

análisis. En tales casos muchas veces se usan córpora de extensión limitada, especialmente si

no hay un corpus adecuado o accesible. Por limitaciones de tiempo y del enfoque es necesario

concentrarse en los textos que más probablemente producirán los resultados requeridos. Atkins

et al. (1992:4 y 15) proponen un tipo de solución provisional para el problema de la

(22)

sido recogidos con un procedimiento estadísticamente correcto.

14

Aunque queda problemático

el abarcamiento y la definición de la populación total, también se proponen soluciones: con los

desarrollos de la informática, se facilita la concepción de programas con los que se puede

determinar la representatividad de un corpus después de su construcción mediante un algoritmo

(Corpas Pastor y Seghiri: accurrapid.com, 2007).

Independientemente de estos aspectos problemáticos, la lingüística del corpus ha hecho una

aportación imprescindible al desarrollo de la traductología como ciencia empírica autónoma

(Laviosa 2003:46). Se han desarrollado muchas nuevas perspectivas y una metodología para

investigaciones, como por ejemplo los diversos tipos de análisis asistidos por ordenador. La

comparabilidad de los planteamientos y de la ejecución de los programas de investigación

garantiza también la comparabilidad de los resultados. Y, además, se permite la esperanza a

una estandardización de la terminología del marco científico del corpus, que ahora todavía está

muy dividida.

2.2.2 Los córpora electrónicos

En general, los proyectos de establecimiento de córpora electrónicos tienen un planteamiento

muy amplio: por un lado son una fuente común para diversos investigadores que pueden

usarlos tanto para análisis lingüísticos y lexicográficos como para enfoques traductológicos,

como la terminología, fraseología, teoría de traducción etc., y por otro lado los mismos córpora

apoyan al desarrollo empírico de la ciencia de la lingüística y de la traductología facilitando la

reproducibilidad y controlabilidad de los resultados (Laviosa 2003:52). Otra ventaja es que los

grandes córpora les ofrecen una flexibilidad a los investigadores porque éstos no se ven

limitados a un solo grupo de textos sino que pueden hacer una selección entre los textos así

accesibles que guardan relación con el propósito del estudio. Esto permite ahorrar tiempo y

costos que normalmente se gastaría en la inventarización y selección de textos y en asuntos de

copyright.

No obstante, también hay desventajas. Como ya se ha mencionado, la composición de córpora

extensos por un solo investigador es problemática, si no imposible (Van Doorslaer 1995:246).

Los córpora se componen a base de unos criterios de selección externos como el tiempo que

14_{Publicación de Woods, Fletcher y Hughes (1986) Statistics in Language Studies, cita bibliográfica en}

(23)

dura el procesamiento de los textos, la accesibilidad, el copyright etc. El aspecto central en esto

sería la accesibilidad de los textos, porque reúne tres criterios externos de selección: primero

está la accesibilidad de los textos, ya que no todo lo que se traduce también se publica; luego

está el problema de los derechos de autor y de copia, por lo que no es posible elegir cualquier

texto para el corpus, y tercero, aunque hoy día es posible captar cualquier texto en formato

electrónico mediante técnicas de escáner, la selección todavía depende mucho de la forma

publicada por el tiempo que dure. Después del establecimiento del corpus, no es cierto que

también sea accesible para cualquier investigador, por las mencionadas limitaciones del

copyright.

El problema de la accesibilidad, junto con el tablón científico, lleva a la consecuencia de que

los grandes córpora mono o bilingües muchas veces se limitan a ciertos grupos de lenguas

como las lenguas (europeas) con un mayor número de hablantes o a las que tienen una

tradición de traducción bien establecida, pero no necesariamente bidireccional, como p.ej. el

corpus finlandés–inglés (Granger 2003:23). Se investiga mucho, pero a veces la escasez de

materiales accesibles puede limitar las posibilidades de investigación. Esto sería especialmente

el caso en los grupos de lenguas pequeñas o, mejor dicho, para lenguas entre las que no se

traduce mucho (¿cómo se haría p.ej. con una investigación entre, diríamos, el japonés y el

holandés?). Hay una multitud de córpora de traducción de tamaños variados que han sido

compuestos para investigaciones; muchos de estos córpora, sin embargo, se han construido

solamente para fines de investigación específicos.

(24)

En las tres décadas pasadas se han realizado unos proyectos para construir córpora mono y

bilingües como p.ej. el English Comparable Corpus (ECC)

15

_{, el Corpus de Referencia del}

Español Actual

(CREA) o el Corpus Diacrónico del Español (CORDE)

16

(Pérez

Hernández:2002) y el Corpus van de Nederlandse taal (D-coi) o el Corpus Geschreven

Nederlands

17

etc. para fines de investigación lingüística o traductológica. Un ejemplo de un

extensivo corpus de traducción es el RicoTerm2, un corpus de textos en inglés, español y

catalán

18

. Algunos de los córpora que hemos mencionado son accesibles por la red; otros han

sido publicados en cd-rom o ya no son accesibles, como p.ej. el corpus bilingüe de Nimega

(Hallebeek:2000)

19

. Otra parte de los córpora compuestos para fines de investigación científica

nunca han sido accesibles o sólo para un grupo limitado de investigadores por razones diversas,

como los derechos de autor.

2.2.3 Recursos electrónicos

Hay una multitud de recursos que apoyan los análisis por ordenador. Para los escáneres hay

programas de reconocimiento de caracteres ópticos (OCR), que por un lado aportan

considerablemente a la aceleración del proceso de escaneamiento, pero que todavía necesitan

desarrollarse mucho, porque la corrección de todos los errores de reconocimiento del programa

sigue siendo es muy alto (Olohan 2004:50). Además, existen programas de análisis que tienen

una índole estadística y que son más populares entre los investigadores porque facilitan la

producción de resúmenes del corpus o de la selección investigada. Estos resúmenes incluyen

listas de los cien palabras usadas más frecuentemente, la longitud media de las oraciones y la

type-token-ratio, que da una indicación de la repetitividad del texto. Estos tipos de análisis no

dan informaciones absolutas sobre el corpus, pero son una ayuda imprescindible para poner en

perspectiva tanto la complejidad de los textos usados como las relaciones entre el corpus

investigado y otros corpus (Pérez Hernández, 6.1.1).

Entre los recursos más usados también encontramos los programas para hacer concordancias

KWIC (Key-Word-In-Context), con los que se pueden encontrar resultados muy interesantes

15_{Véase http://www.llc.manchester.ac.uk/ctis/postgraduate/research/phd-theses/Laviosa/} 16_{Véase http://corpus.rae.es/creanet.html y http://corpus.rae.es/cordenet.html}

17_{Véase http://www.languagemagazine.be/artikellm02502.html}

18_{Véase http://ricoterm.iula.upf.edu/index.htm; en los proyectos actuales se aumentará el corpus por}

textos en gallego y vasco. El corpus no está accesible por Internet.

(25)

en el campo del uso de la lengua o de la terminología. Además hay programas de alineación

que facilitan la comparación de textos de una lengua origen con los textos de la lengua meta.

Una gran ventaja de estos programas es la gran accesibilidad por la red, por lo que los análisis

de concordancia se llevan a cabo más fácilmente que los otros, más complicados.

Cuando se quiere realizar una investigación de enfoque diferente, muchas veces faltan

programas de análisis efectivos o eficaces. Hay pocos recursos para el análisis gramatical que a

veces tampoco permiten acceso por la red. Los análisis gramaticales son difíciles de llevar a

cabo por el tiempo y la capacidad que requieren (Hallebeek 1992), y aunque el desarrollo de

analizadores sintácticos ciertamente ha avanzado mucho, queda el problema de la naturaleza de

la sintaxis. Mientras que el español tiene una morfología relativamente rigurosa que en la

mayoría de los casos permita una clara distinción entre los verbos y adverbios y las otras

categorías porque hay menos desinencias ambiguas, el holandés es más complejo desde esta

perspectiva por la ausencia de un componente morfológico claro que permite ciertas

distinciones básicas. Si se toma en consideración los datos de Hallebeek de 1990 (Hallebeek

1992), los problemas centrales del proceso de análisis automático son la capacidad limitada del

análisis de oraciones con un número de palabras elevado y la ambigüedad de los resultados,

que a veces pueden subir a unos seis diferentes análisis posibles (1992:325).

El área del análisis automático sigue desarrollándose, no obstante, con rapidez: en las pasadas

décadas, la rapidez de los sistemas operativos y la densidad se han doblado varias veces. Estos

y otros desarrollos en la informática promocionan el perfeccionamiento de los lenguajes

formales que a su vez permiten un análisis sintáctico automático más rápido y eficaz. Así se

facilita la extracción de datos de córpora también mediante la gramática (Subirats-Rüggeberg y

Ortega Gil 2001:155-159). Los córpora electrónicos pues sirven bien (y cada vez mejor) para

análisis hechos con asistencia del ordenador. Se pueden usar para llevar a cabo simples análisis

para caracterizar el corpus usado y establecer concordancias para conseguir un entendimiento

más profundo del uso de la lengua. Hoy en día incluso existen programas de análisis sintáctico

accesibles por la red

20

que permiten el análisis de oraciones en varias lenguas que son

claramente estructuradas en cuanto a la morfosintáxis, pero para las lenguas que no tienen una

20_{Véase p.ej. la interesantísima página de aprendizaje sintáctico visual e interactivo de la Syddansk}

(26)

estructura tan regular, como p.ej. el holandés, todavía es difícil tal análisis

21

. Las dos páginas

que hemos encontrado para conducir un análisis sintáctico de oraciones holandesas, tuvieron

problemas con el servidor, por lo que no ha habido sido posible evaluarlas.

22

2.3 Presentación del corpus usado en el análisis

El propósito de este trabajo es investigar las diferencias entre oraciones españolas originales y

sus traducciones al holandés. Para realizarlo, necesitamos datos. Estos datos los encontramos

en varios sitios, entre ellos los libros de gramática. En éstos se describen todas las

construcciones posibles que se permiten en una lengua, pero no se da mucha información sobre

el uso actual de estas construcciones ni sobre la frecuencia con la que aparecen. Por eso, la

recogida de datos para un estudio no puede depender solamente de los libros de gramática, ni

de la mera intuición del investigador, porque tales datos son poco controlables y además

subjetivos, lo que significa que a veces no son correctos, como señala Gloria Corpas Pastor

(2003:86).

La solución del problema viene de la aportación de la lingüística del corpus a la traductología:

un corpus pequeño, independiente, compuesto especialmente para el análisis que queremos

llevar a cabo aquí, nos suministrará los datos indispensables. Por razones de carácter práctico y

de accesibilidad usaremos un corpus reducido. La realización del análisis, como lo describimos

en el capítulo 4, consume demasiado tiempo para llevarse a cabo en un corpus más extenso.

Por eso vale la pena componer un corpus pequeño según criterios de selección específicos; una

selección al azar solamente se puede llevar a cabo si ya hay una visión de conjunto establecida

de la populación entre la que se quiere seleccionar. Pero muchas veces se da el problema de

que el campo no es fácil de abarcar. La vasta producción de material lingüístico es

indeterminable, y, además tiene un papel importante en esto la accesibilidad de estos

materiales, por lo que parece mejor factible el camino medio de abarcar un submarco en el

campo entero y seleccionar entre los textos de este submarco.

21_{Para el español p.ej. es posible hacer un análisis automático de cualquier oración que se quiere en el}

mismo sitio de la Universidad sud-danesa, incluso se puede elegir entre varias maneras de

representación, pero para el holandés solamente es posible hacer análisis de oraciones preformuladas.

22_{Los enlaces para estos sitios son: http://www.cnts.ua.ac.be/cgi-bin/nlsp y}

(27)

El primer paso consiste en la exclusión de uno de dos modos posibles propuestos por Atkins et

al. (1992:5). Excluimos el modo hablado, es decir, cualquier material hablado, y estipulamos

que el medio (íbid.) debe ser libros publicados. Como en ambas lenguas cada año se publican

una multitud de obras originales y traducidos, es lógico partir de los números más bajos de

libros traducidos del holandés al español o del español al holandés. Presuponemos, por el

número relativamente pequeño de hablantes del holandés frente al número de

hispanohablantes, que se traduce más del español al holandés que viceversa. Nuestro

razonamiento supone que el holandés como lengua con menos hablantes probablemente es una

lengua menos importante de aprender en los países hispanohablantes – en contraste con el

español, que es una lengua que en Holanda se enseña en gran número de bachilleratos – y que,

por consecuencia, hay menos traductores que traducen del holandés al español.

Los datos de libros que se han traducido del holandés al español se recogieron hace años en la

sección “Bibliografie van het Nederlandse boek in vertaling” de la revista Ons Erfdeel

23

y

también se publican en el sitio web del Fondo de Procucción y Traducción Literaria

Neerlandés. Por razones económicas y de tiempo, se han limitado los términos de la búsqueda

a los años entre 1995 y 2005 para evitar posibles diferencias diacrónicas.

24

Advertimos al

lector que no es posible determinar el grado de todos los parámetros con seguridad, ya que

algunas obras se escriben o traducen en un cierto año y se publican a veces más tarde.

En la década de 1995 a 2005 se publicaron unas 170 obras traducidas del holandés al español

25

,

de los que 76 eran novelas, 55 de literatura para niños, y 69 de áreas tan diversas como la

ciencia, el ocio, el teatro, la poesía, lo espiritual (que comprende tanto las obras sobre la

religión como la esotérica), o unos compendios. Algunas obras fueron traducidas a través de

otra lengua, como el inglés, francés o alemán. De las 167 traducciones, un total de 67 obras fue

publicado más de cinco años después de la publicación del original holandés, y entre ellos 28

más de diez años más tarde. Las obras que han sido traducidas a través de otro idioma se han

dejado fuera de consideración. Y también las obras del área mixta han sido dejadas fuera de

23_{Desde el tercer número de 2005 de Ons Erfdeel se cesó esta recogida de datos después de la 150}a

parte. Los datos también se pueden encontrar en la red, en el sitio del Nederlands Literair Productie- en Vertalingenfonds: nlpfv.nl/translations.

24_{Un ejemplo para una obra antigua traducida aún a través del alemán al español es la obra de Johan}

Huizinga, El otoño de la Edad Media, publicada en 1919 y traducida a través del alemán al español y publicada en 1931 y 2001. Ejemplos de autores españoles antiguos que se traducen al holandés son Cervantes, Pérez Galdós y García Lorca.

25_{En estos números no se han incluido reediciones aparecidas en la misma década. Sin embargo,}

(28)

consideración porque se trataba de compendios o antologías sin fechas específicas de

publicación de la versión holandesa. Así quedan 143 obras traducidas, y, si también limitamos

el año de publicación de la obra original a la misma década, quedan unas 33 novelas, veinte

libros para niños y 16 obras de áreas diversas. Podemos decir, pues, que entre la producción

total de traducciones compilada por la Biblioteca Real de Holanda, la traducción literaria es la

más prolífica, por lo que es el marco que invita más a la selección de textos para un corpus.

Con referencia al holandés, es evidente la preferencia por la traducción de novelas; por eso es

sencillo excluir de antemano todas las obras traducidas del español al holandés que no sean

novelas. De esta manera, resulta un número de 222 obras traducidas entre 1995 y 2005, sin

contar reediciones.

26

_{Ahora sí hay que tener en cuenta que el dominio de la lengua española se}

extiende sobre dos continentes, el europeo y el sudamericano. Por eso también se puede dividir

la producción de traducciones en dos áreas: novelas de España y novelas de Latinoamérica. Del

total de 222 novelas traducidas, 111 son de autores latinoamericanos, y 111 de autores

españoles

27

. Si se excluyen, tan como en la selección de novelas holandesas, las obras cuya

versión original se publicó antes de la década de selección, quedan 67 obras latinoamericanas y

70 españolas. Con respecto al número de hablantes de cada lengua, podemos decir que el

número de traducciones del castellano es mucho más alto, incluso más alto que el número de

traducción de novelas latinoamericanas, lo que resulta algo sorprendente por la supuesta

popularidad más alta de los autores hispanoamericanos.

En el punto de la extensión del dominio de la lengua española, se adelanta también el problema

del aspecto diatópico, es decir el de las diferencias geográficas de la lengua, en la construcción

del corpus, porque, aunque es evidente que incluso en un mismo país se emplean regionalismos

y se habla de maneras diferentes, con veinte países de habla hispana estas diferencias pueden

ser más extensas. Para excluir la posibilidad de que los resultados de nuestro análisis se

distorsionen por las diferencias sintácticas en el uso del castellano de Latinoamérica o de

España, el corpus seleccionado para este estudio consta de una sola área de la lengua. Así, los

resultados se pueden usar como materia de contraste en otro estudio sobre las diferencias entre

26_{Los resultados se han obtenido mediante dos búsquedas en la buscadora de la KB, www.kb.nl. Las}

reediciones fueron quitadas a mano. La lista de autores españoles se puede encontrar en el apéndice.

27_{Repasando los datos, en general, se da la impresión de que a los autores latinoamericanos se traducen}

(29)

la sintaxis española y latinoamericana. Por eso hemos decidido limitar el corpus a un solo

continente, el europeo, para evitar tales influencias diatópicas posibles.

Entonces, quedan dos preselecciones de 33 obras holandesas traducidas al castellano y 70

títulos españoles traducidos al holandés. Partiendo de estos números, hicimos dos selecciones

de 5 obras en cada lengua, una para el análisis, y otra para contrastar los resultados. Pero, con

todo eso, la selección de los textos todavía no se lleva a cabo totalmente al azar; si comparamos

la repartición de los autores, vemos que hay más autores masculinos que femeninos: las obras

españolas fueron escritas por 51 autores, entre ellos 36 son varones y 15 mujeres, y las obras

holandesas por 23 autores, de los que 16 son varones y 7 mujeres.

Para el corpus de análisis escogimos cinco obras de cinco autores españoles y cinco

holandeses. Para minimizar cualquier aparición de predisposición para la investigación y para

reducir la influencia de idiosincrasias por parte de los autores, cada autor aparece solamente

una vez entre las obras seleccionadas para el corpus. Como el número de autoras es más bajo

que el de los autores masculinos, opinamos que la selección del corpus también tiene que

reflejar esta diferencia y decidimos seleccionar para cada corpus textos de tres escritores y dos

escritoras. La edad de los escritores seleccionados es variada, por dos razones: primero es

imposible reunir un corpus que incluya exclusivamente textos recién publicados de autores de

la misma generación. Hay pocas publicaciones entre las que seleccionar y el grupo de

traductores es muy pequeño, por lo que no se puede garantizar que todas las obras

seleccionadas sean traducidas por diferentes personas (véase más abajo). Segundo, partiendo

de la presuposición de que entre las generaciones hay diferencias en el uso de la lengua,

seleccionar un corpus solamente de escritores de la misma edad significaría negar la variación

del uso de la lengua entre las generaciones y con eso limitar la validez de los resultados aún

más. Las mismas consideraciones valen para el origen de los autores: aparte del abarcamiento

que ya hemos realizado es imposible seleccionar solamente autores de la misma área

geográfica, tanto por la producción como por la representatividad del uso de la lengua con sus

diferencias regionales mínimas.

(30)

traductoras es más o menos al revés: en la traducción de las obras españolas al holandés

colaboran un total de treinta traductores, entre los que siete son varones y 19 mujeres, y en la

traducción del holandés al español colaboraban diez traductores, entre ellos cuatro varones y

seis mujeres. De estos datos podemos deducir que la relación entre los traductores y las

traductoras es de 1:3 y 1:2 respectivamente.

Otra consideración es la del estilo: si cada autor tiene su propio estilo, también lo tendrá el

traductor. Es difícil determinar si el traductor se atiene al estilo del autor o si usa un estilo

propio

28

_{. El fondo del problema es la interferencia: no hay modo de determinar si el traductor}

(o, si se para uno a considerarlo, además el mismo autor) se encuentra bajo de la influencia de

otro autor. Cada estudiante del bachillerato recordará un ejemplo en el que un libro recién leído

influencia el estilo propio. Una investigación en esta materia seguramente es interesante, pero

no es el objeto de esta tesina. La materia se hace aún más compleja cuando se considera las

posibilidades de interferencias de otras lenguas etc. Por eso es menester hacer unas

simplificaciones; hemos decidido que las obras seleccionadas para el corpus deben ser

traducidos por diferentes traductores, y, para dar un reflejo de la relación entre los números de

traductores masculinos y femeninos, que el grupo de traductores debe consistir de por lo menos

por dos hombres y tres mujeres. De esta manera se limitan no sólo las influencias de

idiosincrasia de cada autor, sino también las del traductor. En cuanto a los aspectos de edad y

origen que hemos definido para los autores, para la mayoría de los traductores no ha sido

posible establecer ni su origen ni su edad.

Ahora, con cinco obras de cinco escritores para cada lengua, tenemos todavía un corpus bien

grande, que comprende varios centenares de páginas. El material seleccionado de cinco obras

constituye un corpus limitado, pero todavía es demasiado grande para conducir un análisis que

no consuma demasiado tiempo para un solo investigador. Por limitaciones de tiempo, hemos

decidido reducir aún más el tamaño del corpus; no usamos el libro entero de las cinco obras

seleccionadas, sino solamente un extracto de las primeras mil palabras. Un corpus tan pequeño

es relativamente fácil de componer, se evita la pérdida de tiempo en el proceso del

escaneamiento. Se hace posible una investigación preliminar en la que además se pueden variar

los textos que se analizan, lo que permite que varios investigadores se ocupen de las mismas

cuestiones y después se comunican en una colaboración. La cantidad de datos es fácil de

28_{Un buen ejemplo de la investigación al estilo del traductor es el artículo de Mona Baker (1998) en}

(31)

manejar, y los resultados pueden indicar unas tendencias muy pronto. Además, en un corpus de

tamaño reducido es posible controlar los resultados, lo que es mucho más difícil de conseguir

con un corpus más amplio.

Resumimos que el mejor recurso para investigar las diferencias en la composición de oraciones

compuestas es un corpus de textos auténticos y sus traducciones. Una descripción del corpus

según todos los criterios propuestos en Atkins et al. (1992) y Laviosa (1997) sería excesiva

dentro del enfoque de este estudio. Por eso la descripción de los datos es limitada a los más

esenciales, los que también ofrecen una impresión más clara del corpus. El corpus que usamos

para el análisis consta de textos escritos por españoles de España y holandeses, del género

literario de la novela, publicados en forma de libro entre 1995 y 2005 tanto en la versión

original como en la traducción. El corpus que usamos consta de dos partes: una de textos

españoles originales y traducidos al holandés, y otra de textos holandeses originales y

traducidos al español, que servirá como corpus de control. Este corpus, que consta de un igual

número de fragmentos de igual tamaño escritos por autores holandeses y sus traducciones, lo

usamos para controlar los datos que obtengamos del análisis de la primera parte del corpus, los

textos españoles y sus traducciones, con ejemplos de la lengua original. Ambas partes tendrán

unos 10 mil palabras, acerca de mil palabras por cada obra seleccionada, con lo que el corpus

será de tamaño limitado, y por eso de validez limitada, pero permite una investigación acotada

y suficientemente específica, apta para obtener resultados.

La selección de los textos entonces no se lleva a cabo partiendo de la lista de los autores, sino

de la de los traductores. De esta manera, es posible contar con todos los criterios de selección

que hemos descrito más arriba y todavía integrar un poco del elemento de azar en la selección.

Los siguientes textos han sido seleccionados para el corpus:

I) El subcorpus de análisis:

1. Josefina Aldecoa (1926): La fuerza del destino y De kracht van het lot, traducido por*

Eugenie Schoolderman

2. Almudena Grandes (1964): Atlas de la geografía humana y Atlas van de menselijke*

geografie

, traducido por Sophie Brinkman y Ester van Buuren

3. Antonio Muñoz Molina (1956): Sefarad: una novela de novelas y Sefarad: het boek der*