Lenguas romance


De Wikipedia, la enciclopedia libre
  (Redirigido de Romanic )
Saltar a navegación Saltar a búsqueda

Las lenguas romances (menos comúnmente lenguas latinas o lenguas neolatinas ) son las lenguas modernas que evolucionaron del latín vulgar entre los siglos III y VIII. [1] Son un subgrupo de las lenguas itálicas de la familia de lenguas indoeuropeas . Las seis lenguas romances más habladas por número de hablantes nativos son el español (489 millones), el portugués (250 millones), el francés (77 millones), el italiano (67 millones), el rumano (24 millones) y el catalán (4,1 millones).[2] ). El italiano es el idioma nacional más cercanoal latín , seguido del español, rumano, portugués y el más divergente es el francés. Teniendo en cuenta todas las lenguas romances, incluidas las lenguas nacionales y regionales, el sardo , el italiano y el español son juntos los tres menos diferenciados del latín y el occitano está más cerca del latín que del francés. [3] [4] [5] Sin embargo, todas las lenguas romances están más próximas entre sí que al latín clásico .

Hay más de 900 millones de hablantes nativos de lenguas romances en todo el mundo, principalmente en América , Europa y partes de África . Las principales lenguas romances también tienen muchos hablantes no nativos y se utilizan ampliamente como lengua franca . [6] Esto es especialmente cierto en el caso del francés, que se usa ampliamente en África central y occidental , Madagascar , Mauricio , Seychelles , Comoras , Djibouti , Líbano y África del Norte (excepto Egipto , donde es una lengua minoritaria).

Debido a que es difícil asignar categorías rígidas a fenómenos como las lenguas, que existen en un continuo, las estimaciones del número de lenguas romances modernas varían. Por ejemplo, Dalby enumera 23, según el criterio de inteligibilidad mutua . A continuación se incluyen esas y otras lenguas vivas actuales y una lengua extinta , el dálmata : [7]

  • Iberorromance : portugués , gallego , Asturleonese / mirandés , español , aragonés , el ladino ( judeo-español );
  • Occitano-romance : catalán / valenciano , occitano (lenga d'oc) , gascón ;
  • Galorromance : francés / lenguas oli , franco-provenzal (arpitan) ;
  • Rhaeto-Romance : romanche , ladino , friulano ;
  • Galo-itálico : piamontés , ligur , lombardo , emiliano-romagnol ;
  • Italo-dálmata : italiano , toscano , romanesco , corso , sasarés , siciliano , napolitano , dálmata (extinto en 1898), veneciano (clasificación disputada), istriota ;
  • Sardo ;
  • Romance oriental : rumano , arrumano , megleno-rumano , istro-rumano .

Nombre

El término romance proviene del adverbio latino vulgar romanice , "en romano", derivado de romanicus : por ejemplo, en la expresión romanice loqui , "hablar en romano" (es decir, el latín vernáculo ), en contraste con latine loqui , " hablar en latín "( latín medieval , la versión conservadora de la lengua utilizada en la escritura y contextos formales o como lengua franca), y con barbarice loqui ," hablar en bárbaro "(las lenguas no latinas de los pueblos que viven fuera el Imperio Romano ). [8]De este adverbio se originó el sustantivo romance , que se aplicó inicialmente a cualquier cosa escrita romanice , o "en el vernáculo romano". [9]

Muestras

Las similitudes léxicas y gramaticales entre las lenguas romances, y entre el latín y cada una de ellas, son evidentes a partir de los siguientes ejemplos que tienen el mismo significado en varias conferencias románicas :

Parte de la divergencia proviene del cambio semántico : donde las mismas palabras raíz han desarrollado diferentes significados. Por ejemplo, la palabra portuguesa fresta desciende del latín fenestra "ventana" (y por lo tanto es análoga al francés fenêtre , italiano finestra , rumano fereastră, etc.), pero ahora significa "tragaluz" y "raja". Los cognados pueden existir pero se han vuelto raros, como finiestra en español, o han dejado de usarse por completo. Los términos español y portugués defenestrar que significa " tirar por una ventana " y fenestrado que significa "repleto de ventanas" también tienen la misma raíz, pero son préstamos posteriores del latín.

Del mismo modo, el portugués también tiene la palabra cear , un afín del italiano cenare y el español cenar , pero la usa en el sentido de "cenar tarde" en la mayoría de las variedades, mientras que la palabra preferida para "cenar" es jantar (relacionada con arcaico español yantar "comer") debido a los cambios semánticos en el siglo XIX. El gallego tiene tanto fiestra (de la fẽestra medieval , el antepasado de la fresta portuguesa estándar ) como ventá y xanela, de uso menos frecuente .

Como alternativa a lei (originalmente la forma genitiva), el italiano tiene el pronombre ella , un cognado de las otras palabras para "ella", pero casi nunca se usa al hablar.

La ventana española, asturiana y leonesa y la bentana mirandesa y sarda provienen del latín ventus "viento" (cf. ventana inglesa , etimológicamente 'ojo de viento'), y la portuguesa janela , la gallega xanela , la mirandesa jinela del latín * ianuella "pequeña apertura", un derivado de ianua "puerta".

El balcone de Cerdeña (alternativa de ventàna / bentàna ) proviene del italiano antiguo y es similar a otras lenguas romances como el balcon francés (del italiano balcone ), el balcão portugués , el balcón rumano , el balcón español , el balcó catalán y el balconi corso (alternativa de purtellu ).

Clasificación e idiomas relacionados

Cuadro de lenguas románicas en base a criterios estructurales y comparativos, no socio-funcionales. FP: Franco-Provenzal, IR: Istro-Rumano.
Áreas del romance oriental y occidental divididas por la línea La Spezia-Rimini
Lenguas y dialectos romances

La clasificación de las lenguas romances es intrínsecamente difícil, porque la mayor parte del área lingüística es un continuo de dialectos y, en algunos casos, pueden entrar en juego sesgos políticos. Junto con el latín (que no se incluye entre las lenguas romances) y algunas lenguas extintas de la antigua Italia, forman la rama itálica de la familia indoeuropea . [10]

Divisiones propuestas

Se utilizan varios esquemas para subdividir las lenguas romances. Tres de los esquemas más comunes son los siguientes:

  • Italo-occidental frente a oriental frente a sur. Este es el esquema seguido por Ethnologue , y se basa principalmente en el resultado de las diez vocales monoftonas en latín clásico. Esto se discute más a continuación .
  • Oeste contra Este. Este esquema divide los distintos idiomas a lo largo de la línea La Spezia-Rimini , que atraviesa el centro-norte de Italia justo al norte de la ciudad de Florencia (cuyo habla forma la base del italiano estándar). En este esquema, "Este" incluye las lenguas del centro y sur de Italia, y las lenguas romances de los Balcanes (o "Romance Oriental") en Rumania, Grecia y otras partes de los Balcanes; "Oeste" incluye los idiomas de Portugal, España, Francia, el norte de Italia y Suiza. El sardo no encaja fácilmente en este esquema.
  • " Conservador " vs. "innovador". Esta es una división no genética cuyos límites precisos están sujetos a debate. En general, las lenguas galorromances (discutidas más adelante) forman las lenguas "innovadoras" centrales, siendo el francés estándar el más innovador de todas, mientras que las lenguas cercanas a la periferia (que incluyen español, portugués, italiano y rumano) son " conservador". El sardo es generalmente reconocido como la lengua romance más conservadora, y también fue la primera lengua que se separó genéticamente del resto, posiblemente ya en el siglo I a. C. Dante denigró a los sardospor lo conservador de su discurso, remarcando que imitan al latín "como los monos imitan a los hombres". [11] [12]

Italo-occidental frente a oriental frente a sardo

Las principales subfamilias que ha propuesto Ethnologue dentro de los distintos esquemas de clasificación de las lenguas romances son:

  • Italo-Western , el grupo más grande, que incluye idiomas como catalán, portugués, italiano, español y francés.
  • Romance oriental , que incluye las lenguas romances de Europa del Este, como el rumano.
  • Romance sureño , que incluye algunas lenguas con rasgos particularmente conservadores , como el sardo y, según algunos autores, también el corso en un grado más limitado. Se cree que esta familia incluyó las ahora desaparecidas lenguas romances del norte de África (o al menos, parecen haber desarrollado algunas características fonológicas y sus vocales de la misma manera).

Esta división de tres vías se basa principalmente en el resultado de las vocales del latín vulgar (proto-romance):

Italo-Western, a su vez, se divide a lo largo de la llamada Línea La Spezia-Rimini en el norte de Italia, que divide las lenguas italianas central y meridional de las llamadas lenguas romances occidentales hacia el norte y el oeste. Las principales características que dividen a los dos son:

  • Fonémica lenición de paradas intervocálica, que pasa hacia el noroeste, pero no hacia el sureste.
  • De geminación de oclusivas geminadas (produciendo nuevas oclusiones sordas simples intervocálicas, después de lenidas las antiguas), lo que nuevamente ocurre al noroeste pero no al sureste.
  • Eliminación de vocales intertónicas (entre la sílaba tónica y la primera o la última sílaba), nuevamente en el noroeste pero no en el sureste.
  • Uso de plurales en / s / en el noroeste vs. plurales usando cambio de vocales en el sureste.
  • Desarrollo de palatalizado / k / antes / e, i / a / (t) s / en el noroeste vs. / tʃ / en el sureste.
  • Desarrollo de / kt / , que se desarrolla hasta / xt / > / it / (a veces progresando más hasta / tʃ / ) en el noroeste pero / tt / en el sureste.

La realidad es algo más compleja. Todas las características del "sureste" se aplican a todos los idiomas al sureste de la línea, y todas las características del "noroeste" se aplican a todos los idiomas en Francia y (la mayor parte de) España. Sin embargo, las lenguas galo-itálicas se encuentran en algún punto intermedio. Todos estos lenguajes tienen las características del "noroeste" de lenición y pérdida de geminación. Sin embargo:

  • Las lenguas gallo ‒ itálicas tienen plurales que cambian de vocales en lugar de plurales / s /.
  • La lengua lombarda en el centro-norte de Italia y las lenguas rhaeto-romances tienen la característica "sureste" de / tʃ / en lugar de / (t) s / para palatalizada / k /.
  • La lengua veneciana en el noreste de Italia y algunas de las lenguas rhaeto-romances tienen la característica "sureste" de desarrollar / kt / a / tt / .
  • La lenición de postvocálica / ptk / está muy extendida como realización fonética alofónica en Italia por debajo de la línea La Spezia-Rimini, incluida Córcega y la mayor parte de Cerdeña.

Además de esto, la antigua lengua mozárabe en el sur de España, en el extremo más alejado del grupo "noroeste", tenía las características "sureste" de falta de lenición y palatalización de / k / a / tʃ / . Ciertos idiomas alrededor de los Pirineos (por ejemplo, algunos dialectos aragoneses de las tierras altas ) también carecen de lenición, y los dialectos del norte de Francia como Norman y Picard tienen palatalización de / k / a / tʃ / (aunque esto es posiblemente un desarrollo secundario independiente, ya que / k / entre vocales, es decir, cuando está sujeto a lenición, desarrollado a / dz / en lugar de / dʒ / , como se esperaría para un desarrollo primario).

La solución habitual a estos problemas es crear varios subgrupos anidados. El romance occidental se divide en las lenguas galo-ibéricas, en las que se produce la lenición y que incluyen casi todas las lenguas romances occidentales, y el grupo pirenaico-mozárabe, que incluye las lenguas restantes sin lenición (y es poco probable que sea un clado válido ; probablemente al menos dos clados, uno para mozárabe y otro para pirenaico). El galo-ibérico se divide a su vez en las lenguas ibéricas (por ejemplo, el español y el portugués ) y las lenguas galorromances más grandes (que se extienden desde el este de España hasta el noreste de Italia).

Probablemente una descripción más precisa, sin embargo, sería decir que hubo un punto focal de innovación ubicado en el centro de Francia, desde el cual una serie de innovaciones se extendieron como cambios reales . La línea La Spezia-Rimini representa el punto más lejano al sureste al que llegaron estas innovaciones, correspondiente a la cadena norte de los Apeninos , que atraviesa el norte de Italia y forma una importante barrera geográfica para una mayor difusión del idioma.

Esto explicaría por qué algunas de las características del "noroeste" (casi todas las cuales se pueden caracterizar como innovaciones) terminan en puntos diferentes en el norte de Italia, y por qué algunas de las lenguas en partes geográficamente remotas de España (en el sur y altas en Pirineos) carecen de algunas de estas características. También explica por qué las lenguas en Francia (especialmente el francés estándar) parecen haber innovado antes y de forma más extensa que otras lenguas romances occidentales.

Muchas de las características del "sureste" también se aplican a las lenguas romances orientales (en particular, el rumano), a pesar de la discontinuidad geográfica. Algunos ejemplos son la falta de lenición, el mantenimiento de las vocales intertónicas, el uso de plurales que cambian de vocales y la palatalización de / k / a / tʃ / . Esto ha llevado a algunos investigadores, siguiendo a Walther von Wartburg, para postular una división básica bidireccional de este a oeste, con las lenguas "orientales" que incluyen el rumano y el centro y sur de Italia, aunque este punto de vista se ve afectado por el contraste de numerosos desarrollos fonológicos rumanos con los que se encuentran en Italia debajo de La Spezia. Línea Rimini. Entre estas características, en rumano las geminadas se redujeron históricamente a unidades individuales, lo que puede ser un desarrollo independiente o tal vez debido a la influencia eslava, y / kt / se convirtió en / pt /, mientras que en el centro y sur de Italia las geminadas se conservan y / kt / se sometieron. asimilación a / tt /. [13]

A pesar de ser la primera lengua romance en divergir del latín hablado, [14] el sardo no encaja en absoluto en este tipo de división. [15] Está claro que el sardo se independizó lingüísticamente del resto de las lenguas romances en una fecha muy temprana, posiblemente ya en el siglo I a. C. [16] El sardo contiene una gran cantidad de características arcaicas, incluida la falta total de palatalización de / k / y / g / y una gran cantidad de vocabulario que no se conserva en ningún otro lugar, incluidos algunos elementos ya arcaicos en la época del latín clásico (siglo I a. C. ). El sardo tiene plurales en / s / pero la lenición posvocálica de consonantes sordas normalmente se limita al estado de una regla alofónica (por ejemplo, [k] ane 'perro' perosu [g] ane o su [ɣ] ane 'el perro'), y hay algunas innovaciones que no se han visto en otros lugares, como un cambio de / au / a / a /. El uso del su < ipsum como artículo es un rasgo arcaico conservado que también existe en el catalán de las Illes Balears y que solía estar más extendido en occitano-romance, y se conoce como artículo salat  [ ca ] (literalmente el "artículo salado "), mientras que Cerdeña comparte la desvelarización de / kw / y / gw / anteriores con el rumano: Sard. abba , Ron. apă 'agua'; Sard. limba , Rom. limbă"lengua" (cf. italiano acqua , lingua ).

Dialectos del sur de Italia, Cerdeña y Córcega

El sistema de vocales de tipo sardo también se encuentra en una pequeña región perteneciente al área de Lausberg  [ it ] (también conocida como zona de Lausberg ; compare la distribución de la lengua napolitana § ) del sur de Italia, en el sur de Basilicata , y hay evidencia de que el rumano El sistema de vocales de tipo "compromiso" fue una vez característico de la mayor parte del sur de Italia, [17] aunque ahora se limita a un área pequeña en el oeste de Basilicata centrada en el dialecto de Castelmezzano , el área se conoce como Vorposten , la palabra alemana para ' avanzada'. El sistema de vocales sicilianas, ahora generalmente considerado como un desarrollo basado en el sistema Italo-Occidental, también está representado en el sur de Italia, en el sur de Cilento , Calabria y el extremo sur de Apulia , y puede haber estado más extendido en el pasado. [18]

La mayor variedad de sistemas de vocales fuera del sur de Italia se encuentra en Córcega, donde el tipo italo-occidental está representado en la mayor parte del norte y el centro y el tipo de Cerdeña en el sur, así como un sistema que se asemeja al sistema de vocales siciliano en el Región de Cap Corse ; finalmente, entre el sistema italo-occidental y el sardo se encuentra, en la región de Taravo , un sistema de vocales completamente único que no puede derivarse de ningún otro sistema, que tiene reflejos como el sardo en su mayor parte, pero las vocales agudas cortas del latín se reflejan de forma única como vocales medias-bajas. [19]

Lenguas galorromances

Gallo-Romance se puede dividir en los siguientes subgrupos:

  • Las Langues d'oïl , incluido el francés y lenguas estrechamente relacionadas.
  • El idioma franco-provenzal (también conocido como arpitan) del sureste de Francia, el oeste de Suiza y la región del Valle de Aosta en el noroeste de Italia.

Los siguientes grupos también se consideran a veces parte del galorromance:

  • Las lenguas occitano-romances del sur de Francia, a saber, occitano y gascón .
    • La lengua catalana del este de Iberia también se incluye a veces en galorromance. Sin embargo, esto es discutido por algunos lingüistas que prefieren agruparlo con el romance ibérico , ya que aunque el catalán antiguo está cerca del occitano antiguo, más tarde ajustó su léxico hasta cierto punto para alinearse con el español. En general, sin embargo, el catalán moderno, especialmente gramaticalmente, permanece más cerca del occitano moderno que del español o el portugués.
  • Los idiomas galo-italianos del norte de Italia, incluidos el piamontés , el ligur , el lombardo , el emiliano y el romagnol . Ligur conserva la -o final, siendo la excepción en Gallo-Romance.
  • Las lenguas rheto-romances , incluidos el romanche , el friulano y los dialectos ladinos .

Las lenguas galorromances se consideran generalmente las más innovadoras (menos conservadoras) entre las lenguas romances. Los rasgos galorromances característicos generalmente se desarrollaron más temprano y aparecen en su manifestación más extrema en la Langue d'oïl , extendiéndose gradualmente a lo largo de ríos y caminos transalpinos.

De alguna manera, sin embargo, las lenguas galorromances son conservadoras. Las etapas más antiguas de muchas de las lenguas conservaron un sistema de dos casos que consistía en nominativo y oblicuo, completamente marcado en sustantivos, adjetivos y determinantes, heredado casi directamente del nominativo y acusativo latino y conservando una serie de diferentes clases declinantes y formas irregulares. Las lenguas más cercanas al epicentro oleico conservan mejor el sistema de casos, mientras que las lenguas de la periferia lo pierden pronto.

Las características notables de las lenguas galorromances son:

  • Pérdida temprana de vocales finales átonas distintas de / a / - una característica definitoria del grupo.
    • Más reducciones de las vocales finales en Langue d'oïl y muchas lenguas galo-itálicas , con la / a / femenina y la vocal prop / e / fusionándose en / ə / , que a menudo se elimina posteriormente.
  • Reducción temprana y pesada de las vocales átonas en el interior de una palabra (otra característica definitoria).
  • La pérdida de las vocales finales fonemicizó las vocales largas que solían ser concomitantes automáticos de las sílabas abiertas acentuadas. Estas vocales largas fonémicas se mantienen directamente en muchos dialectos del norte de Italia; en otros lugares, la longitud fonémica se perdió, pero mientras tanto muchas de las vocales largas diptongadas, resultando en un mantenimiento de la distinción original. La rama de la langue d'oïl vuelve a estar a la vanguardia de la innovación, con no menos de cinco de las siete vocales largas diptongándose (solo se salvaron las vocales altas).
  • Las vocales delanteras redondeadas están presentes en todas las ramas del galorromance. / u / por lo general van al frente de / y / , y las vocales redondeadas del frente medio secundario a menudo se desarrollan a partir de / oː / o / ɔː / largas .
  • La lenición extrema (es decir, múltiples rondas de lenición) ocurre en muchos idiomas, especialmente en Langue d'oïl y muchos idiomas galo-italianos .
  • La Langue d'oïl , las lenguas rhaetorrománicas suizas y muchos de los dialectos del occitano del norte tienen una palatalización secundaria de / k / y / ɡ / antes de / a / , produciendo resultados diferentes de la palatalización romance primaria: por ejemplo, centum "cien" > cent / sɑ̃ / , cantum "song"> chant / ʃɑ̃ / .
  • Aparte de las lenguas occitano-romances , la mayoría de las lenguas galorromances son de asignatura obligatoria (mientras que el resto de las lenguas romances son lenguas pro-drop ). Este es un desarrollo tardío provocado por la erosión fonética progresiva: el francés antiguo todavía era una lengua de sujeto nulo, y esto solo cambió cuando se perdieron las consonantes finales secundarias en el francés medio.

Pidgins, criollos y lenguas mixtas

Algunas lenguas romances han desarrollado variedades que parecen reestructuradas dramáticamente en cuanto a sus gramáticas o ser mezclas con otras lenguas. Hay varias decenas de criollos de origen francés , español y portugués , algunos de ellos hablados como lenguas nacionales en las antiguas colonias europeas.

Criollos de francés:

  • Antillano ( Antillas Francesas , Santa Lucía , Dominica )
  • Haitiano (uno de los dos idiomas oficiales de Haití )
  • Luisiana (EE. UU.)
  • Mauriciano ( lengua franca de Mauricio )
  • Reunión (lengua materna de Reunión )
  • Seychelles ( idioma oficial de Seychelles )

Criollos del español:

  • Chavacano (en parte de Filipinas )
  • Palenquero (en parte de Colombia )

Criollos de portugués:

  • Angolar (idioma regional en Santo Tomé y Príncipe )
  • Caboverdiano ( idioma nacional de Cabo Verde ; incluye varias variedades distintas)
  • Forro (idioma regional en Santo Tomé y Príncipe)
  • Kristang ( Malasia )
  • Macao ( Macao )
  • Papiamento ( idioma oficial de las Antillas Holandesas )
  • Guinea Bissau criolla ( Guinea Bissau lengua nacional 's)

Lenguajes auxiliares y construidos

El latín y las lenguas románicas también han servido de inspiración y base de numerosas lenguas auxiliares y construidas, las llamadas "lenguas neorromances". [20] [21]

El concepto fue desarrollado por primera vez en 1903 por el matemático italiano Giuseppe Peano , bajo el título Latino sine flexione . [22] Quería crear un lenguaje internacional naturalista , en oposición a un lenguaje construido autónomo como el esperanto o el volapük, que fueron diseñados para la máxima simplicidad del léxico y la derivación de palabras. Peano usó el latín como base de su idioma, porque en el momento de su florecimiento era el idioma internacional de facto de la comunicación científica. [ dudoso ]

Otros lenguajes desarrollados incluyen Idiom Neutral (1902), Interlingue -Occidental (1922), Interlingua (1951) y Lingua Franca Nova (1998). El más famoso y exitoso de ellos es Interlingua. [ cita requerida ] Cada uno de estos idiomas ha intentado, en diversos grados, lograr un vocabulario pseudo-latino lo más común posible a las lenguas romances vivas. Algunas lenguas se han construido específicamente para la comunicación entre hablantes de lenguas romances, las lenguas pan-romances .

También hay lenguajes creados solo con fines artísticos, como el talossan . Debido a que el latín es una lengua antigua muy bien atestiguada, algunos lingüistas aficionados incluso han construido lenguas romances que reflejan lenguas reales que se desarrollaron a partir de otras lenguas ancestrales. Estos incluyen Brithenig (que refleja el galés ), Breathanach [23] (refleja el irlandés ), Wenedyk (refleja el polaco ), Þrjótrunn (refleja el islandés ), [24] y helvético (refleja el alemán ). [25]

Estado moderno

Extensión europea de las lenguas romances en el siglo XX
Número de hablantes nativos de cada lengua romance, como fracciones del total de 690 millones (2007)

La lengua romance más hablada de forma nativa en la actualidad es el español , seguida del portugués , el francés , el italiano y el rumano , que en conjunto cubren un vasto territorio en Europa y más allá, y funcionan como lenguas oficiales y nacionales en decenas de países.

Lenguas romances del mundo

El francés, el italiano, el portugués, el español y el rumano también son idiomas oficiales de la Unión Europea . El español, el portugués, el francés, el italiano, el rumano y el catalán eran los idiomas oficiales de la extinta Unión Latina ; y el francés y el español son dos de los seis idiomas oficiales de las Naciones Unidas . Fuera de Europa se habla francés , portugués y español y gozan de estatus oficial en varios países surgidos de los respectivos imperios coloniales .

El español es un idioma oficial en España y en nueve países de América del Sur , hogar de aproximadamente la mitad de la población de ese continente; en seis países de Centroamérica (todos excepto Belice ); y en México . En el Caribe , es oficial en Cuba , República Dominicana y Puerto Rico . En todos estos países, el español latinoamericano es la lengua vernácula de la mayoría de la población, lo que le da al español la mayor cantidad de hablantes nativos de cualquier lengua romance. En África es un idioma oficial de Guinea Ecuatorial .

El portugués, en su patria original, Portugal , es hablado por prácticamente toda la población de 10 millones. Como idioma oficial de Brasil , es hablado por más de 200 millones de personas en ese país, así como por residentes vecinos del este de Paraguay y norte de Uruguay , que representan un poco más de la mitad de la población de América del Sur, por lo que el portugués es el lengua romance oficial más hablada en un solo país. Es el idioma oficial de seis países africanos ( Angola , Cabo Verde , Guinea-Bissau , Mozambique , Guinea Ecuatorial ySanto Tomé y Príncipe ), y es hablado como primer idioma por quizás 30 millones de residentes de ese continente. [26] En Asia, el portugués es cooficial con otros idiomas en Timor Oriental y Macao , mientras que la mayoría de los hablantes de portugués en Asia (unos 400.000 [27]) se encuentran en Japón debido a la inmigración de retorno de japoneses brasileños . En América del Norte, 1.000.000 de personas hablan portugués como lengua materna. [28] En Oceanía, el portugués es la segunda lengua romance más hablada, después del francés, debido principalmente al número de hablantes en Timor Oriental . Su pariente más cercano, el gallego, tiene estatus oficial en elcomunidad autónoma de Galicia en España , junto con el español.

Fuera de Europa, el francés se habla principalmente en la provincia canadiense de Quebec y en partes de New Brunswick y Ontario . Canadá es oficialmente bilingüe, siendo el francés y el inglés los idiomas oficiales. En partes del Caribe, como Haití , el francés tiene estatus oficial, pero la mayoría de las personas hablan criollos como el criollo haitiano como lengua materna. El francés también tiene estatus oficial en gran parte de África, con relativamente pocos hablantes nativos pero un mayor número de hablantes de un segundo idioma. En las posesiones extranjeras restantes de Francia, el uso nativo del francés está aumentando.

Aunque Italia también tenía algunas posesiones coloniales antes de la Segunda Guerra Mundial , su idioma no se mantuvo oficial después del final de la dominación colonial. Como resultado, los italianos fuera de Italia y Suiza ahora se habla sólo como una lengua minoritaria por las comunidades de inmigrantes en Norte y Sur América y Australia . En algunas antiguas colonias italianas en África — a saber , Libia , Eritrea y Somalia — lo hablan unas pocas personas educadas en comercio y gobierno.

Rumania no estableció un imperio colonial, pero más allá de su territorio natal en el sureste de Europa , la lengua rumana es hablada como lengua minoritaria por poblaciones autóctonas en Serbia, Bulgaria y Hungría, y en algunas partes de la antigua Gran Rumanía (antes de 1945). , así como en Ucrania ( Bucovina , Budjak ) y en algunos pueblos entre los ríos Dniéster y Bug . [29] El idioma arrumano es hablado hoy por los arrumanos en Bulgaria, Macedonia, Albania, Kosovo y Grecia. [30]El rumano también se extendió a otros países del Mediterráneo (especialmente a otros países de habla romance, sobre todo a Italia y España ), y a otros lugares como Israel , donde es el idioma nativo del cinco por ciento de la población, [31] y se habla por muchos más como lengua secundaria. Esto se debe a la gran cantidad de judíos nacidos en Rumania que se mudaron a Israel después de la Segunda Guerra Mundial . [32] Y finalmente, unos 2,6 millones de personas en la ex república soviética de Moldavia hablan una variedad de rumano, llamado de diversas maneras moldavo o rumano por ellos.

El total de hablantes nativos de lenguas romances se divide de la siguiente manera (con su clasificación dentro de las lenguas del mundo entre paréntesis): [33] [34]

  • Español ( Hispanosfera ) 49% ( 2o )
  • Portugués ( lusosfera ) 26% ( 6 ° )
  • Francés ( Francofonía ) 8,6% ( 18 ° )
  • Italiano 7,7% ( 23º )
  • Rumano 3,0% ( 49º )
  • Catalán 0,9% ( no entre los 100 primeros )
  • Otros 3,6%

El catalán es el idioma oficial de Andorra . En España es cooficial con el español en Cataluña , Comunidad Valenciana y Baleares , y está reconocido, pero no oficial, en La Franja y en Aragón . Además, es hablado por muchos vecinos de Alghero , en la isla de Cerdeña , y es cooficial en esa ciudad. El gallego , con más de un millón de hablantes nativos, es oficial junto con el español en Galicia , y tiene reconocimiento legal en los territorios limítrofes de Castilla y León.. Algunos otros idiomas tienen reconocimiento oficial a nivel regional o de otro modo limitado; por ejemplo, asturianos y aragoneses en España; Mirandese en Portugal; Friulano , sardo y franco-provenzal en Italia; y romanche en Suiza.

Las lenguas romances restantes sobreviven principalmente como lenguas habladas para el contacto informal. Los gobiernos nacionales han considerado históricamente la diversidad lingüística como una responsabilidad económica, administrativa o militar, así como una fuente potencial de movimientos separatistas ; por ello, en general han luchado por eliminarlo, promoviendo ampliamente el uso de la lengua oficial, restringiendo el uso de las otras lenguas en los medios de comunicación, reconociéndolas como meros "dialectos", o incluso persiguiéndolas. Como resultado, todos estos idiomas se consideran en peligro de extinción en diversos grados según el Libro Rojo de Idiomas en Peligro de la UNESCO , que van desde "vulnerables" (por ejemplo, siciliano y veneciano ) a "gravemente amenazados" (Franco-provenzal , la mayoría de las variedades occitanas ). Desde finales del siglo XX y principios del XXI, la mayor sensibilidad hacia los derechos de las minorías ha permitido que algunas de estas lenguas comiencen a recuperar su prestigio y derechos perdidos. Sin embargo, no está claro si estos cambios políticos serán suficientes para revertir el declive de las lenguas romances minoritarias.

Historia

Las lenguas romances son la continuación del latín vulgar , el sociolecto popular y coloquial del latín hablado por soldados , colonos y comerciantes del Imperio Romano , a diferencia de la forma clásica de la lengua hablada por las clases altas romanas , la forma en que el el lenguaje se escribía generalmente. [14] Entre el 350 a. C. y el 150 d. C., la expansión del Imperio , junto con sus políticas administrativas y educativas, convirtió al latín en la lengua materna dominante en la Europa occidental continental. El latín también ejerció una fuerte influencia en el sureste de Gran Bretaña., la provincia romana de África , Alemania occidental , Panonia y todos los Balcanes .

Durante el declive del Imperio, y después de su fragmentación y el colapso de su mitad occidental en los siglos V y VI, las variedades habladas del latín se volvieron más aisladas unas de otras, con los dialectos occidentales bajo una fuerte influencia germánica (los godos y los francos en particular) y los dialectos orientales bajo influencia eslava. [35] [36] Los dialectos divergieron del latín clásico a un ritmo acelerado y eventualmente evolucionaron hacia un continuo de tipologías reconociblemente diferentes. Los imperios coloniales establecidos por Portugal , España y Franciaa partir del siglo XV extendió sus lenguas a los demás continentes hasta tal punto que alrededor de dos tercios de todos los hablantes de lenguas romances de la actualidad viven fuera de Europa.

A pesar de otras influencias (por ejemplo, el sustrato de las lenguas prerromanas, especialmente las lenguas celtas continentales ; y el superestrato de las invasiones germánicas o eslavas posteriores ), la fonología , la morfología y el léxico de todas las lenguas romances consisten principalmente en formas evolucionadas del latín vulgar. Sin embargo, se producen algunas diferencias notables entre las lenguas romances de hoy y su antepasado romano. Con solo una o dos excepciones, las lenguas romances han perdido el sistema de declinación del latín y, como resultado, tienen una estructura de oraciones SVO y hacen un uso extensivo de las preposiciones .

Latín vulgar

Duración del dominio romano y las lenguas romances [37]
Lenguas romances en Europa

La evidencia documental sobre el latín vulgar es limitada a los efectos de una investigación exhaustiva, y la literatura suele ser difícil de interpretar o generalizar. Muchos de sus hablantes eran soldados, esclavos, pueblos desplazados y reasentados forzados, más propensos a ser nativos de tierras conquistadas que nativos de Roma. En Europa occidental, el latín reemplazó gradualmente al celta y otras lenguas itálicas , que estaban relacionadas con él por un origen indoeuropeo compartido. Las similitudes en la sintaxis y el vocabulario facilitaron la adopción del latín. [38] [39] [40]

Se cree que el latín vulgar ya tenía la mayoría de las características compartidas por todas las lenguas romances, que las distinguen del latín clásico, como la pérdida casi completa del sistema de casos gramaticales latinos y su reemplazo por preposiciones ; la pérdida del género gramatical neutro y las inflexiones comparativas ; sustitución de algunos paradigmas verbales por innovaciones (por ejemplo, el futuro sintético dio paso a una estrategia originalmente analítica que ahora está formada típicamente por infinitivo + formas indicativas presentes evolucionadas de 'tener'); el uso de artículos ; y las etapas iniciales de la palatalización de las oclusivas / k /, / g / y / t /.

Para algunos eruditos, esto sugiere que la forma de latín vulgar que evolucionó hacia las lenguas romances existía durante la época del Imperio Romano (desde finales del siglo I a.C.), y se hablaba junto con el latín clásico escrito, que estaba reservado para las lenguas oficiales. y ocasiones formales. Otros estudiosos argumentan que las distinciones se ven más correctamente como indicativas de diferencias sociolingüísticas y de registro que normalmente se encuentran en cualquier idioma. Ambos eran mutuamente inteligibles como un mismo idioma, lo cual fue cierto hasta aproximadamente la segunda mitad del siglo VII. Sin embargo, en doscientos años el latín se convirtió en una lengua muerta, ya que "los romanizados de Europa ya no podían entender los textos que se les leían en voz alta o se les recitaban" [41].es decir, el latín había dejado de ser una primera lengua y se había convertido en una lengua extranjera que debía aprenderse, si la etiqueta latín se limita a referirse a un estado de la lengua congelado en el tiempo pasado y restringido a características lingüísticas en su mayor parte típicas de los niveles superiores. registros.

Con el surgimiento del Imperio Romano, el latín vulgar se extendió primero por Italia y luego por el sur , oeste , centro y sureste de Europa , y el norte de África a lo largo de partes de Asia occidental . [42] : 1

Caída del Imperio Romano Occidental

Durante el declive político del Imperio Romano Occidental en el siglo V, hubo migraciones a gran escala hacia el imperio y el mundo de habla latina se fragmentó en varios estados independientes. Europa central y los Balcanes fueron ocupados por tribus germánicas y eslavas , así como por hunos . Estas incursiones aislaron a los valacos del resto de la Europa de habla románica .

El romance británico y africano, las formas del latín vulgar utilizadas en Gran Bretaña y la provincia romana de África , donde había sido hablado por gran parte de la población urbana, desapareció en la Edad Media (al igual que el romance panónico en lo que hoy es Hungría y Moselle Romance en Alemania). Pero las tribus germánicas que habían penetrado en la Italia romana , la Galia y la Hispania finalmente adoptaron el latín / romance y los restos de la cultura de la antigua Roma.junto con los habitantes existentes de esas regiones, por lo que el latín siguió siendo el idioma dominante allí. En parte debido a los dialectos regionales del idioma latino y los entornos locales, varios idiomas evolucionaron a partir de él. [42] : 4

Caída del Imperio Romano de Oriente

Mientras tanto, las migraciones a gran escala hacia el Imperio Romano de Oriente comenzaron con los godos y continuaron con los hunos , ávaros , búlgaros , eslavos , pechenegos , húngaros y cumanos . Las invasiones de los eslavos fueron las más profundas y redujeron parcialmente el elemento románico en los Balcanes . [43] La invasión de los turcos y la conquista de Constantinopla en 1453 marcaron el fin del imperio. Los eslavos nombraron a la población de habla romanceLos valacos , mientras que los últimos se llamaban a sí mismos "Rumân" o "Român", del latín "Romanus" [44] El dialecto daco-romano se volvió completamente distinto de los tres dialectos que se hablan al sur del Danubio: el rumano, el istrorrumano y el megleno -Rumano: durante los siglos IX y X, cuando los rumanos (a veces llamados valacos o valacos) emergieron como pueblo. [45]

Romance temprano

En el transcurso de los siglos IV al VIII, los cambios locales en fonología, morfología, sintaxis y léxico se acumularon hasta el punto de que el habla de cualquier lugar era notablemente diferente de otro. En principio, las diferencias entre dos lecturas aumentaban cuanto más estaban separadas geográficamente, lo que reducía la fácil inteligibilidad mutua entre hablantes de comunidades distantes. [46] La evidencia clara de algunos niveles de cambio se encuentra en las Glosas de Reichenau , una compilación del siglo VIII de unas 1200 palabras de la Vulgata de Jerónimo del siglo IV que habían cambiado en forma fonológica o que ya no se usaban normalmente, junto con su equivalentes del siglo VIII en proto -franco-provenzal. Los siguientes son algunos ejemplos con reflejos en varias lenguas romances modernas para comparar:

En todos los ejemplos anteriores, las palabras que aparecen en la Vulgata del siglo IV son las mismas palabras que se habrían utilizado en el latín clásico de c. 50 a. C. Es probable que algunas de estas palabras ya hubieran desaparecido del habla informal en la época de las Glosas ; pero si es así, es posible que todavía se hayan entendido ampliamente, ya que no hay evidencia registrada de que la gente común de la época tuviera dificultades para entender el idioma.

En el siglo VIII, la situación era muy diferente. Durante finales del siglo VIII, Carlomagno , sosteniendo que "el latín de su época era intolerablemente corrupto según los estándares clásicos", [46] : 6 impuso con éxito el latín clásico como una lengua vernácula escrita artificial para Europa Occidental . Desafortunadamente, esto significó que los feligreses ya no podían entender los sermones de sus sacerdotes, lo que obligó al Concilio de Tours en 813 a emitir un edicto que los sacerdotes necesitaban para traducir sus discursos a la rustica romana lingua , un reconocimiento explícito de la realidad de las lenguas romances. como idiomas separados del latín. [46] : 6

Por esta vez, y posiblemente tan temprano como el siglo 6 de acuerdo con los precios (1984), [46] : 6 el romance lectos se habían separado suficientemente separados como para poder hablar de separada Gallo-romance , iberorromance , Italo-romance y Lenguas romances orientales . Algunos investigadores [ ¿quién? ] han postulado que las principales divergencias en los dialectos hablados comenzaron o se aceleraron considerablemente en el siglo V, a medida que las redes de comunicación anteriormente generalizadas y eficientes del Imperio Romano Occidentalse derrumbó rápidamente, lo que llevó a la desaparición total del Imperio Romano Occidental a finales de siglo. El período crítico entre los siglos V y X d.C. está poco documentado porque ha sobrevivido muy poca o ninguna escritura de la caótica " Edad Media " de los siglos V-VIII, y la escritura posterior a ese tiempo se hizo en latín medieval conscientemente clasicizado , con solo escritura vernácula. comenzando en serio en los siglos XI o XII. Una excepción como los Juramentos de Estrasburgo es la evidencia de que en el siglo IX la comunicación efectiva con una audiencia no instruida se llevó a cabo en el romance evolucionado.

Un idioma que estaba estrechamente relacionado con el rumano medieval fue hablado durante la Edad Media por los valacos en los Balcanes, Herzegovina, Dalmacia ( Morlachs ), Ucrania ( Hutsuls ), Polonia ( Goral ), Eslovaquia y la Moravia checa, pero gradualmente estas comunidades perdieron su poder. lengua materna. [49]

Reconocimiento de las lenguas vernáculas

Romance - frontera de la lengua germánica: [50]
• Alta Edad Media • Principios del siglo XX 
 

Entre los siglos X y XIII, algunas lenguas vernáculas locales desarrollaron una forma escrita y comenzaron a suplantar al latín en muchas de sus funciones. En algunos países, como Portugal , esta transición se aceleró por la fuerza de la ley; mientras que en otros, como Italia , muchos poetas y escritores destacados utilizaron la lengua vernácula por su propia voluntad; algunos de los más famosos de Italia son Giacomo da Lentini y Dante Alighieri . Mucho antes de eso, la lengua vernácula también se usaba con fines prácticos, como los testimonios en el Placiti Cassinesi , escrito en 960–963.

Uniformización y estandarización

La invención de la imprenta trajo consigo una tendencia hacia una mayor uniformidad de las lenguas estándar dentro de las fronteras políticas, a expensas de otras lenguas romances y dialectos menos favorecidos políticamente. En Francia, por ejemplo, el dialecto hablado en la región de París se extendió gradualmente por todo el país y el occitano del sur perdió terreno.

Cambios de sonido

Consonantes

Los cambios de sonido significativos afectaron a las consonantes de las lenguas romances.

Apócope

Había una tendencia a eliminar las consonantes finales en el latín vulgar, ya sea eliminándolas ( apócope ) o añadiendo una vocal después de ellas ( epéntesis ).

Muchas consonantes finales eran raras, apareciendo sólo en ciertas preposiciones (por ejemplo, ad "hacia", apud "en, cerca de (una persona)"), conjunciones ( sed "pero"), demostrativas (por ejemplo, illud "que (allá)", hoc "esto"), y formas nominativas singulares de sustantivos, especialmente de sustantivos neutros (por ejemplo, lac "leche", mel "miel", cor "corazón"). Muchas de estas preposiciones y conjunciones fueron reemplazadas por otras, mientras que los sustantivos se regularizaron en formas basadas en sus raíces oblicuas que evitaban las consonantes finales (por ejemplo, * lacte , * mele ,* núcleo ).

La -m final se dejó caer en latín vulgar. Incluso en el latín clásico , la -am final , -em , -um ( sufijos de flexión del caso acusativo ) a menudo se elidían en la métrica poética , lo que sugiere que la m se pronuncia débilmente, lo que probablemente marca la nasalización de la vocal anterior. Esta vocal nasal perdió su nasalización en las lenguas romances excepto en los monosílabos, donde se convirtió en / n / eg español quien < quem "quién", francés rien "cualquier cosa" < rem"cosa"; nótese especialmente el francés y catalán mon < meum "my (m.sg.)" que se derivan de monosilábico / meu̯m / > * / meu̯n /, / mun / , mientras que el español disilábico mío y el portugués y catalán monosilábico meu se derivan de disilábico / ˈMe.um / > * /ˈme.o/ . [ cita requerida ]

Como resultado, solo las siguientes consonantes finales ocurrieron en latín vulgar:

  • -T final en las formas verbales de tercera persona del singular, y -nt (más tarde reducido en muchos idiomas a -n ) en las formas verbales de la tercera persona del plural.
  • Finales -S (incluyendo -x ) en un gran número de terminaciones morfológicas (verbo terminaciones -Como / -ES / -es / -is , -mus , -tis ; nominativo singular -us / -is ; plural -Como / -os / -ēs ) y algunas otras palabras ( trēs "tres", sexo "seis", crās "mañana", etc.).
  • -N final en algunos monosílabos (del anterior -m ).
  • -R , -d finales en algunas preposiciones (por ejemplo , ad , per ), que eran clíticos que se adjuntaban fonológicamente a la siguiente palabra.
  • Muy ocasionalmente, -c final , por ejemplo, occitano oc "sí" < hoc , francés antiguo avuec "con" < apud hoc (aunque estos casos posiblemente estuvieran protegidos por una vocal epentética final en un punto).

La -t final finalmente se eliminó en muchos idiomas, aunque esto a menudo ocurrió varios siglos después del período del latín vulgar. Por ejemplo, el reflejo de -t se eliminó en francés antiguo y español antiguo sólo alrededor de 1100. En francés antiguo, esto ocurrió sólo cuando una vocal todavía precedía a la t (generalmente / ə / <latín a ). De ahí amat "él ama"> Antiguo francés aime pero venit "él viene"> Antiguo francés vient : la / t / nunca se abandonó y sobrevive en francés moderno en enlace , por ejemplo, vient-il?"¿Viene?" / vjɛ̃ti (l) / (el / t / correspondiente en aime-t-il? es analógico, no heredado). El francés antiguo también mantuvo intacta la terminación en tercera persona del plural -nt .

En las lenguas italo-romances y romances orientales , eventualmente todas las consonantes finales fueron eliminadas o protegidas por una vocal epentética, excepto en las formas clíticas (por ejemplo, preposiciones con , per ). El italiano estándar moderno casi no tiene palabras finales de consonante, aunque el rumano las ha resurgido debido a la pérdida posterior de / u / y / i / finales . Por ejemplo, amās "amas"> ame > italiano ami ; amant "ellos aman"> * aman > Ital. amano . Sobre la evidencia de un lenguaje lombardo "descuidadamente escrito"documentos, sin embargo, la pérdida de / s / final en Italia no ocurrió hasta el siglo VII o VIII, después del período del latín vulgar, y la presencia de muchas consonantes finales anteriores es traicionada por la geminación sintáctica ( raddoppiamento sintattico ) que desencadenan . También se cree que después de una vocal larga / s / se convirtió en / j / en lugar de simplemente desaparecer: nōs > noi "nosotros", se (d) ēs > sei "tú eres", crās > crai "mañana" (sur de Italia) . En sílabas átonas, los diptongos resultantes se simplificaron: canēs >/ ˈKanej /> cani "perros"; amīcās > / aˈmikaj / > amiche / aˈmike / "amigas (femeninas)", donde amīcae nominativo debe producir ** amice en lugar de amiche (nota masculino amīcī > amici no ** amichi ).

Las lenguas romances centro occidentales finalmente recuperaron un gran número de consonantes finales a través de la pérdida general de / e / y / o / finales , por ejemplo, catalán llet "leche" < lactem , foc "fuego" < focum , peix "pescado" < piscem . En francés, la mayoría de estas consonantes finales secundarias (así como las primarias) se perdieron antes de alrededor de 1700, pero las consonantes finales terciarias surgieron más tarde a través de la pérdida de / ə / < -a . De ahí el frīgidum masculino "frío"> Francés antiguo freit / frwεt / >froid / fʁwa /, femenino frigidam > Francés antiguo freide / frwεdə / > froide / fʁwad / .

Palatalización

La palatalización fue uno de los procesos más importantes que afectan a las consonantes en latín vulgar. Esto eventualmente resultó en una serie completa de consonantes " palatales " y postalveolares en la mayoría de las lenguas romances, por ejemplo, italiano / ʃ /, / tʃ /, / dʒ /, / ts /, / dz /, / ɲ /, / ʎ / .

Ocurrieron las siguientes etapas históricas:

Observe cómo los entornos se vuelven progresivamente menos "palatinos" y los idiomas afectados se vuelven progresivamente menos.

The outcomes of palatalization depended on the historical stage, the consonants involved, and the languages involved. The primary division is between the Western Romance languages, with /ts/ resulting from palatalization of /k/, and the remaining languages (Italo-Dalmatian and Eastern Romance), with /tʃ/ resulting. It is often suggested that /tʃ/ was the original result in all languages, with /tʃ/ > /ts/ a later innovation in the Western Romance languages. Evidence of this is the fact that Italian has both /ttʃ/ and /tts/ as outcomes of palatalization in different environments, while Western Romance has only /(t)ts/. Even more suggestive is the fact that the Mozarabic language in al-Andalus (modern southern Spain) had /tʃ/ as the outcome despite being in the "Western Romance" area and geographically disconnected from the remaining /tʃ/ areas; this suggests that Mozarabic was an outlying "relic" area where the change /tʃ/ > /ts/ failed to reach. (Northern French dialects, such as Norman and Picard, also had /tʃ/, but this may be a secondary development, i.e. due to a later sound change /ts/ > /tʃ/.) Note that /ts, dz, dʒ/eventualmente se convirtió en / s, z, ʒ / en la mayoría de las lenguas romances occidentales. Así, el latín caelum (cielo, cielo), pronunciado [ˈkai̯lu (m)] con una inicial [k] , se convirtió en italiano cielo [ˈtʃɛlo] , rumano cer [tʃer] , español cielo [ˈθjelo] / [ˈsjelo] , francés ciel [sjɛl ] , Catalán cel [ˈsɛɫ] y portugués céu [ˈsɛw] .

El resultado de palatalizados / d / y / ɡ / es menos claro:

  • La / j / original tiene el mismo resultado que la / ɡ / palatalizada en todas partes.
  • El rumano tiene de manera bastante consistente / z / < / dz / de palatalizado / d / , pero / dʒ / de palatalizado / ɡ / .
  • El italiano tiene inconsistentemente / ddz ~ ddʒ / de palatalized / d / , y / ddʒ / de palatalized / ɡ / .
  • Most other languages have the same results for palatalized /d/ and /ɡ/: consistent /dʒ/ initially, but either /j/ or /dʒ/ medially (depending on language and exact context). But Spanish has /j/ (phonetically [ɟ͡ʝ]) initially except before /o/, /u/; nearby Gascon is similar.

This suggests that palatalized /d/ > /dʲ/ > either /j/ or /dz/ depending on location, while palatalized /ɡ/ > /j/; after this, /j/ > /(d)dʒ/ in most areas, but Spanish and Gascon (originating from isolated districts behind the western Pyrenees) were relic areas unaffected by this change.

In French, the outcomes of /k, ɡ/ palatalized by /e, i, j/ and by /a, au/ were different: centum "hundred" > cent /sɑ̃/ but cantum "song" > chant /ʃɑ̃/. French also underwent palatalization of labials before /j/: Vulgar Latin /pj, bj~vj, mj/ > Old French /tʃ, dʒ, ndʒ/ (sēpia "cuttlefish" > seiche, rubeus "red" > rouge, sīmia "monkey" > singe).

The original outcomes of palatalization must have continued to be phonetically palatalized even after they had developed into alveolar/postalveolar/etc. consonants. This is clear from French, where all originally palatalized consonants triggered the development of a following glide /j/ in certain circumstances (most visible in the endings -āre, -ātum/ātam). In some cases this /j/ came from a consonant palatalized by an adjoining consonant after the late loss of a separating vowel. For example, mansiōnātam > /masʲoˈnata/ > masʲˈnada/ > /masʲˈnʲæðə/ > early Old French maisnieḍe /maisˈniɛðə/ "household". Similarly, mediētātem > /mejeˈtate/ > /mejˈtade/ > /mejˈtæðe/ > early Old French meitieḍ /mejˈtʲɛθ/ > modern French moitié /mwaˈtje/ "half". In both cases, phonetic palatalization must have remained in primitive Old French at least through the time when unstressed intertonic vowels were lost (?c.8th century), well after the fragmentation of the Romance languages.

The effect of palatalization is indicated in the writing systems of almost all Romance languages, where the letters have the "hard" pronunciation [k, ɡ] in most situations, but a "soft" pronunciation (e.g. French/Portuguese [s, ʒ], Italian/Romanian [tʃ, dʒ]) before ⟨e, i, y⟩. (This orthographic trait has passed into Modern English through Norman French-speaking scribes writing Middle English; this replaced the earlier system of Old English, which had developed its own hard-soft distinction with the soft ⟨c, g⟩ representing [tʃ, j~dʒ].) This has the effect of keeping the modern spelling similar to the original Latin spelling, but complicates the relationship between sound and letter. In particular, the hard sounds must be written differently before ⟨e, i, y⟩ (e.g. Italian ⟨ch, gh⟩, Portuguese ⟨qu, gu⟩), and likewise for the soft sounds when not before these letters (e.g. Italian ⟨ci, gi⟩, Portuguese ⟨ç, j⟩). Furthermore, in Spanish, Catalan, Occitan and Brazilian Portuguese, the use of digraphs containing ⟨u⟩ to signal the hard pronunciation before ⟨e, i, y⟩ means that a different spelling is also needed to signal the sounds /kw, ɡw/ before these vowels (Spanish ⟨cu, gü⟩, Catalan, Occitan and Brazilian Portuguese ⟨qü, gü⟩).[51] This produces a number of orthographic alternations in verbs whose pronunciation is entirely regular. The following are examples of corresponding first-person plural indicative and subjunctive in a number of regular Portuguese verbs: marcamos, marquemos "we mark"; caçamos, cacemos "we hunt"; chegamos, cheguemos "we arrive"; averiguamos, averigüemos "we verify"; adequamos, adeqüemos "we adapt"; oferecemos, ofereçamos "we offer"; dirigimos, dirijamos "we drive" erguemos, ergamos "we raise"; delinquimos, delincamos "we commit a crime". In the case of Italian, the convention of digraphs <ch> and <gh> to represent /k/ and /g/ before written <e, i> results in similar orthographic alternations, such as dimentico 'I forget', dimentichi 'you forget', baco 'worm', bachi 'worms' with [k] or pago 'I pay', paghi 'you pay' and lago 'lake', laghi 'lakes' with [g]. The use in Italian of <ci> and <gi> to represent /tʃ/ or /dʒ/ before vowels written <a,o,u> neatly distinguishes dico 'I say' with /k/ from dici 'you say' with /tʃ/ or ghiro 'dormouse' /g/ and giro 'turn, revolution' /dʒ/, but with orthographic <ci> and <gi> also representing the sequence of /tʃ/ or /dʒ/ and the actual vowel /i/ (/ditʃi/ dici, /dʒiro/ giro), and no generally observed convention of indicating stress position, the status of i when followed by another vowel in spelling can be unrecognizable. For example, the written forms offer no indication that <cia> in camicia 'shirt' represents a single unstressed syllable /tʃa/ with no /i/ at any level (/kaˈmitʃa/ → [kaˈmiːtʃa] ~ [kaˈmiːʃa]), but that underlying the same spelling <cia> in farmacia 'pharmacy' is a bisyllabic sequence consisting of the stressed syllable /tʃi/ and syllabic /a/ (/farmaˈtʃia/ → [farmaˈtʃiːa] ~ [farmaˈʃiːa]).

Lenition

Detener consonantes cambiadas por lenición en latín vulgar en algunas áreas.

The voiced labial consonants /b/ and /w/ (represented by ⟨b⟩ and ⟨v⟩, respectively) both developed a fricative [β] as an intervocalic allophone.[52] This is clear from the orthography; in medieval times, the spelling of a consonantal ⟨v⟩ is often used for what had been a ⟨b⟩ in Classical Latin, or the two spellings were used interchangeably. In many Romance languages (Italian, French, Portuguese, Romanian, etc.), this fricative later developed into a /v/; but in others (Spanish, Galician, some Catalan and Occitan dialects, etc.) reflexes of /b/ and /w/ simply merged into a single phoneme.

Several other consonants were "softened" in intervocalic position in Western Romance (Spanish, Portuguese, French, Northern Italian), but normally not phonemically in the rest of Italy (except some cases of "elegant" or Ecclesiastical words), nor apparently at all in Romanian. The dividing line between the two sets of dialects is called the La Spezia–Rimini Line and is one of the most important isoglosses of the Romance dialects. The changes (instances of diachronic lenition resulting in phonological restructuring) are as follows: Single voiceless plosives became voiced: -p-, -t-, -c- > -b-, -d-, -g-. Subsequently, in some languages they were further weakened, either becoming fricatives or approximants, [β̞], [ð̞], [ɣ˕] (as in Spanish) or disappearing entirely (as /t/ and /k/, but not /p/, in French). The following example shows progressive weakening of original /t/: e.g. vītam > Italian vita [ˈvita], Portuguese vida [ˈvidɐ] (European Portuguese [ˈviðɐ]), Spanish vida [ˈbiða] (Southern Peninsular Spanish [ˈbia]), and French vie [vi]. Some scholars once speculated that these sound changes may be due in part to the influence of Continental Celtic languages,[citation needed] but scholarship of the past few decades challenges that hypothesis.

  • The voiced plosives /d/ and /ɡ/ tended to disappear.
  • The plain sibilant -s- [s] was also voiced to [z] between vowels, although in many languages its spelling has not changed. (In Spanish, intervocalic [z] was later devoiced back to [s]; [z] is only found as an allophone of /s/ before voiced consonants in Modern Spanish.)
  • The double plosives became single: -pp-, -tt-, -cc-, -bb-, -dd-, -gg- > -p-, -t-, -c-, -b-, -d-, -g- in most languages. In French spelling, double consonants are merely etymological, except for -ll- after -i (pronounced [ij]), in most cases.
  • The double sibilant -ss- [sː] also became phonetically single [s], although in many languages its spelling has not changed.

Consonant length is no longer phonemically distinctive in most Romance languages. However some languages of Italy (Italian, Sardinian, Sicilian, and numerous other varieties of central and southern Italy) do have long consonants like /ɡɡ/, /dd/, /bb/, /kk/, /tt/, /pp/, /ll/, /mm/, /nn/, /ss/, /rr/, etc., where the doubling indicates either actual length or, in the case of plosives and affricates, a short hold before the consonant is released, in many cases with distinctive lexical value: e.g. note /ˈnɔ.te/ (notes) vs. notte /ˈnɔt.te/ (night), cade /ˈka.de/ (s/he, it falls) vs. cadde /ˈkad.de/ (s/he, it fell), caro /ˈka.ro/ (dear, expensive) vs. carro /ˈkar.ro/ (cart). They may even occur at the beginning of words in Romanesco, Neapolitan, Sicilian and other southern varieties, and are occasionally indicated in writing, e.g. Sicilian cchiù (more), and ccà (here). In general, the consonants /b/, /ts/, and /dz/ are long at the start of a word, while the archiphoneme |R|[dubious ] is realised as a trill /r/ in the same position. In much of central and southern Italy, the affricates /t͡ʃ/ and /d͡ʒ/ weaken synchronically to fricative [ʃ] and [ʒ] between vowels, while their geminate congeners do not, e.g. cacio /ˈka.t͡ʃo/ → [ˈkaːʃo] (cheese) vs. caccio /ˈkat.t͡ʃo/ → [ˈkat.t͡ʃo] (I chase).

A few languages have regained secondary geminate consonants. The double consonants of Piedmontese exist only after stressed /ə/, written ë, and are not etymological: vëdde (Latin vidēre, to see), sëcca (Latin sicca, dry, feminine of sech). In standard Catalan and Occitan, there exists a geminate sound /lː/ written ŀl (Catalan) or ll (Occitan), but it is usually pronounced as a simple sound in colloquial (and even some formal) speech in both languages.

Vowel prosthesis

In Late Latin a prosthetic vowel /i/ (lowered to /e/ in most languages) was inserted at the beginning of any word that began with /s/ (referred to as s impura) and a voiceless consonant (#sC- > isC-):

  • scrībere 'to write' > Sardinian iscribere, Spanish escribir, Portuguese escrever, Catalan escriure, Old French escri(v)re (mod. écrire);
  • spatha "sword" > Sard ispada, Sp/Pg espada, Cat espasa, OFr espeḍe (modern épée);
  • spiritus "spirit" > Sard ispìritu, Sp espíritu, Pg espírito, Cat esperit, French esprit;
  • Stephanum "Stephen" > Sard Istèvene, Sp Esteban, Cat Esteve, Pg Estêvão, OFr Estievne (mod. Étienne);
  • status "state" > Sard istadu, Sp/Pg estado, Cat estat, OFr estat (mod. état).

Prosthetic /i/ ~ /e/ in Romance languages may have been influenced by Continental Celtic languages,[citation needed] although the phenomenon exists or existed in some areas where Celtic was never present (e.g. Sardinia, southern Italy). While Western Romance words undergo prothesis, cognates in Balkan Romance and southern Italo-Romance do not, e.g. Italian scrivere, spada, spirito, Stefano, and stato. In Italian, syllabification rules were preserved instead by vowel-final articles, thus feminine spada as la spada, but instead of rendering the masculine *il spaghetto, lo spaghetto came to be the norm. Though receding at present, Italian once had a prosthetic /i/ if a consonant preceded such clusters, so that 'in Switzerland' was in [i]Svizzera. Some speakers still use the prothetic [i] productively, and it is fossilized in a few set locutions such as in ispecie 'especially' or per iscritto 'in writing' (although in this case its survival may be due partly to the influence of the separate word iscritto < Latin īnscrīptus). The association of /i/ ~ /j/ and /s/ also led to the vocalization of word-final -s in Italian, Romanian, certain Occitan dialects, and the Spanish dialect of Chocó in Colombia.[53]

Stressed vowels

Loss of vowel length, reorientation

One profound change that affected Vulgar Latin was the reorganisation of its vowel system. Classical Latin had five short vowels, ă, ĕ, ĭ, ŏ, ŭ, and five long vowels, ā, ē, ī, ō, ū, each of which was an individual phoneme (see the table in the right, for their likely pronunciation in IPA), and four diphthongs, ae, oe, au and eu (five according to some authors, including ui). There were also long and short versions of y, representing the rounded vowel /y(ː)/ in Greek borrowings, which however probably came to be pronounced /i(ː)/ even before Romance vowel changes started.

There is evidence that in the imperial period all the short vowels except a differed by quality as well as by length from their long counterparts.[54] So, for example ē was pronounced close-mid /eː/ while ĕ was pronounced open-mid /ɛ/, and ī was pronounced close /iː/ while ĭ was pronounced near-close /ɪ/.

During the Proto-Romance period, phonemic length distinctions were lost. Vowels came to be automatically pronounced long in stressed, open syllables (i.e. when followed by only one consonant), and pronounced short everywhere else. This situation is still maintained in modern Italian: cade [ˈkaːde] "he falls" vs. cadde [ˈkadde] "he fell".

The Proto-Romance loss of phonemic length originally produced a system with nine different quality distinctions in monophthongs, where only original /ă ā/ had merged. Soon, however, many of these vowels coalesced:

  • The simplest outcome was in Sardinian,[55] where the former long and short vowels in Latin simply coalesced, e.g. /ĕ ē/ > /e/, /ĭ ī/ > /i/: This produced a simple five-vowel system /a e i o u/.
  • In most areas, however (technically, the Italo-Western languages), the near-close vowels /ɪ ʊ/ lowered and merged into the high-mid vowels /e o/. As a result, Latin pira "pear" and vēra "true", came to rhyme (e.g. Italian and Spanish pera, vera, and Old French poire, voire). Similarly, Latin nucem (from nux "nut") and vōcem (from vōx "voice") become Italian noce, voce, Portuguese noz, voz, and French noix, voix. This produced a seven-vowel system /a ɛ e i ɔ o u/, still maintained in conservative languages such as Italian and Portuguese, and lightly transformed in Spanish (where /ɛ/ > /je/, /ɔ/ > /we/).
  • In the Eastern Romance languages (particularly, Romanian), the front vowels /ĕ ē ĭ ī/ evolved as in the majority of languages, but the back vowels /ŏ ō ŭ ū/ evolved as in Sardinian. This produced an unbalanced six-vowel system: /a ɛ e i o u/. In modern Romanian, this system has been significantly transformed, with /ɛ/ > /je/ and with new vowels /ə ɨ/ evolving, leading to a balanced seven-vowel system with central as well as front and back vowels: /a e i ə ɨ o u/.
  • Sicilian is sometimes described as having its own distinct vowel system. In fact, Sicilian passed through the same developments as the main bulk of Italo-Western languages. Subsequently, however, high-mid vowels (but not low-mid vowels) were raised in all syllables, stressed and unstressed; i.e. /e o/ > /i u/. The result is a five-vowel /a ɛ i ɔ u/.

Further variants are found in southern Italy and Corsica, which also boasts a completely distinct system (see above).

The Proto-Romance allophonic vowel-length system was rephonemicized in the Gallo-Romance languages as a result of the loss of many final vowels. Some northern Italian languages (e.g. Friulian) still maintain this secondary phonemic length, but most languages dropped it by either diphthongizing or shortening the new long vowels.

French phonemicized a third vowel length system around AD 1300 as a result of the sound change /VsC/ > /VhC/ > /VːC/ (where V is any vowel and C any consonant). This vowel length was eventually lost by around AD 1700, but the former long vowels are still marked with a circumflex. A fourth vowel length system, still non-phonemic, has now arisen: All nasal vowels as well as the oral vowels /ɑ o ø/ (which mostly derive from former long vowels) are pronounced long in all stressed closed syllables, and all vowels are pronounced long in syllables closed by the voiced fricatives /v z ʒ ʁ vʁ/. This system in turn has been phonemicized in some non-standard dialects (e.g. Haitian Creole), as a result of the loss of final /ʁ/.

Latin diphthongs

The Latin diphthongs ae and oe, pronounced /ai/ and /oi/ in earlier Latin, were early on monophthongized.

ae became /ɛː/ by the 1st century a.d. at the latest. Although this sound was still distinct from all existing vowels, the neutralization of Latin vowel length eventually caused its merger with /ɛ/ < short e: e.g. caelum "sky" > French ciel, Spanish/Italian cielo, Portuguese céu /sɛw/, with the same vowel as in mele "honey" > French/Spanish miel, Italian miele, Portuguese mel /mɛl/. Some words show an early merger of ae with /eː/, as in praeda "booty" > *prēda /preːda/ > French proie (vs. expected **priée), Italian preda (not **prieda) "prey"; or faenum "hay" > *fēnum [feːnũ] > Spanish heno, French foin (but Italian fieno /fjɛno/).

oe generally merged with /eː/: poenam "punishment" > Romance */pena/ > Spanish/Italian pena, French peine; foedus "ugly" > Romance */fedo/ > Spanish feo, Portuguese feio. There are relatively few such outcomes, since oe was rare in Classical Latin (most original instances had become Classical ū, as in Old Latin oinos "one" > Classical ūnus[56]) and so oe was mostly limited to Greek loanwords, which were typically learned (high-register) terms.

au merged with ō /oː/ in the popular speech of Rome already by the 1st century b.c. A number of authors remarked on this explicitly, e.g. Cicero's taunt that the populist politician Publius Clodius Pulcher had changed his name from Claudius to ingratiate himself with the masses. This change never penetrated far from Rome, however, and the pronunciation /au/ was maintained for centuries in the vast majority of Latin-speaking areas, although it eventually developed into some variety of o in many languages. For example, Italian and French have /ɔ/ as the usual reflex, but this post-dates diphthongization of /ɔ/ and the French-specific palatalization /ka/ > /tʃa/ (hence causa > French chose, Italian cosa /kɔza/ not **cuosa). Spanish has /o/, but Portuguese spelling maintains ⟨ou⟩, which has developed to /o/ (and still remains as /ou/ in some dialects, and /oi/ in others). Occitan, Romanian, southern Italian languages, and many other minority Romance languages still have /au/. A few common words, however, show an early merger with ō /oː/, evidently reflecting a generalization of the popular Roman pronunciation: e.g. French queue, Italian coda /koda/, Occitan co(d)a, Romanian coadă (all meaning "tail") must all derive from cōda rather than Classical cauda (but notice Portuguese cauda).[57] Similarly, Spanish oreja, Portuguese orelha, French oreille, Romanian ureche, and Sardinian olícra, orícla "ear" must derive from ōric(u)la rather than Classical auris (Occitan aurelha was probably influenced by the unrelated ausir < audīre "to hear"), and the form oricla is in fact reflected in the Appendix Probi.

Further developments

Metaphony

An early process that operated in all Romance languages to varying degrees was metaphony (vowel mutation), conceptually similar to the umlaut process so characteristic of the Germanic languages. Depending on the language, certain stressed vowels were raised (or sometimes diphthongized) either by a final /i/ or /u/ or by a directly following /j/. Metaphony is most extensive in the Italo-Romance languages, and applies to nearly all languages in Italy; however, it is absent from Tuscan, and hence from standard Italian. In many languages affected by metaphony, a distinction exists between final /u/ (from most cases of Latin -um) and final /o/ (from Latin , -ud and some cases of -um, esp. masculine "mass" nouns), and only the former triggers metaphony.

Some examples:

  • In Servigliano in the Marche of Italy, stressed /ɛ e ɔ o/ are raised to /e i o u/ before final /i/ or /u/:[58] /ˈmetto/ "I put" vs. /ˈmitti/ "you put" (< *metti < *mettes < Latin mittis); /moˈdɛsta/ "modest (fem.)" vs. /moˈdestu/ "modest (masc.)"; /ˈkwesto/ "this (neut.)" (< Latin eccum istud) vs. /ˈkwistu/ "this (masc.)" (< Latin eccum istum).
  • Calvallo in Basilicata, southern Italy, is similar, but the low-mid vowels /ɛ ɔ/ are diphthongized to /je wo/ rather than raised:[59] /ˈmette/ "he puts" vs. /ˈmitti/ "you put", but /ˈpɛnʒo/ "I think" vs. /ˈpjenʒi/ "you think".
  • Metaphony also occurs in most northern Italian dialects, but only by (usually lost) final *i; apparently, final *u was lowered to *o (usually lost) before metaphony could take effect.
  • Some of the Astur-Leonese languages in northern Spain have the same distinction between final /o/ and /u/[60] as in the Central-Southern Italian languages,[61] with /u/ triggering metaphony.[62] The plural of masculine nouns in these dialects ends in -os, which does not trigger metaphony, unlike in the singular (vs. Italian plural -i, which does trigger metaphony).
  • Sardinian has allophonic raising of mid vowels /ɛ ɔ/ to [e o] before final /i/ or /u/. This has been phonemicized in the Campidanese dialect as a result of the raising of final /e o/ to /i u/.
  • Raising of /ɔ/ to /o/ occurs sporadically in Portuguese in the masculine singular, e.g. porco /ˈporku/ "pig" vs. porcos /ˈpɔrkus/ "pig". It is thought that Galician-Portuguese at one point had singular /u/ vs. plural /os/, exactly as in modern Astur-Leonese.[61]
  • In all of the Western Romance languages, final /i/ (primarily occurring in the first-person singular of the preterite) raised mid-high /e o/ to /i u/, e.g. Portuguese fiz "I did" (< *fidzi < *fedzi < Latin fēcī) vs. fez "he did" (< *fedze < Latin fēcit). Old Spanish similarly had fize "I did" vs. fezo "he did" (-o by analogy with amó "he loved"), but subsequently generalized stressed /i/, producing modern hice "I did" vs. hizo "he did". The same thing happened prehistorically in Old French, yielding fis "I did", fist "he did" (< *feist < Latin fēcit).
Diphthongization

A number of languages diphthongized some of the free vowels, especially the open-mid vowels /ɛ ɔ/:

  • Spanish consistently diphthongized all open-mid vowels /ɛ ɔ/ > /je we/ except for before certain palatal consonants (which raised the vowels to close-mid before diphthongization took place).
  • Romanian similarly diphthongized /ɛ/ to /je/ (the corresponding vowel /ɔ/ did not develop from Proto-Romance).
  • Italian diphthongized /ɛ/ > /jɛ/ and /ɔ/ > /wɔ/ in open syllables (in the situations where vowels were lengthened in Proto-Romance), the most salient exception being /ˈbɛne/ bene 'well', perhaps due to the high frequency of apocopated ben (e.g. ben difficile 'quite difficult', ben fatto 'well made' etc.).
  • French similarly diphthongized /ɛ ɔ/ in open syllables (when lengthened), along with /a e o/: /aː ɛː eː ɔː oː/ > /aɛ iɛ ei uɔ ou/ > middle OF /e je ɔi we eu/ > modern /e je wa œ ~ ø œ ~ ø/.
  • French also diphthongized /ɛ ɔ/ before palatalized consonants, especially /j/. Further development was as follows: /ɛj/ > /iej/ > /i/; /ɔj/ > /uoj/ > early OF /uj/ > modern /ɥi/.
  • Catalan diphthongized /ɛ ɔ/ before /j/ from palatalized consonants, just like French, with similar results: /ɛj/ > /i/, /ɔj/ > /uj/.

These diphthongizations had the effect of reducing or eliminating the distinctions between open-mid and close-mid vowels in many languages. In Spanish and Romanian, all open-mid vowels were diphthongized, and the distinction disappeared entirely. Portuguese is the most conservative in this respect, keeping the seven-vowel system more or less unchanged (but with changes in particular circumstances, e.g. due to metaphony). Other than before palatalized consonants, Catalan keeps /ɔ o/ intact, but /ɛ e/ split in a complex fashion into /ɛ e ə/ and then coalesced again in the standard dialect (Eastern Catalan) in such a way that most original /ɛ e/ have reversed their quality to become /e ɛ/.

In French and Italian, the distinction between open-mid and close-mid vowels occurred only in closed syllables. Standard Italian more or less maintains this. In French, /e/ and /ɛ/ merged by the twelfth century or so, and the distinction between /ɔ/ and /o/ was eliminated without merging by the sound changes /u/ > /y/, /o/ > /u/. Generally this led to a situation where both [e,o] and [ɛ,ɔ] occur allophonically, with the close-mid vowels in open syllables and the open-mid vowels in closed syllables. In French, both [e/ɛ] and [o/ɔ] were partly rephonemicized: Both /e/ and /ɛ/ occur in open syllables as a result of /aj/ > /ɛ/, and both /o/ and /ɔ/ occur in closed syllables as a result of /al/ > /au/ > /o/.

Old French also had numerous falling diphthongs resulting from diphthongization before palatal consonants or from a fronted /j/ originally following palatal consonants in Proto-Romance or later: e.g. pācem /patsʲe/ "peace" > PWR */padzʲe/ (lenition) > OF paiz /pajts/; *punctum "point" > Gallo-Romance */ponʲto/ > */pojɲto/ (fronting) > OF point /põjnt/. During the Old French period, preconsonantal /l/ [ɫ] vocalized to /w/, producing many new falling diphthongs: e.g. dulcem "sweet" > PWR */doltsʲe/ > OF dolz /duɫts/ > douz /duts/; fallet "fails, is deficient" > OF falt > faut "is needed"; bellus "beautiful" > OF bels [bɛɫs] > beaus [bɛaws]. By the end of the Middle French period, all falling diphthongs either monophthongized or switched to rising diphthongs: proto-OF /aj ɛj jɛj ej jej wɔj oj uj al ɛl el il ɔl ol ul/ > early OF /aj ɛj i ej yj oj yj aw ɛaw ew i ɔw ow y/ > modern spelling ⟨ai ei i oi ui oi ui au eau eu i ou ou u⟩ > mod. French /ɛ ɛ i wa ɥi wa ɥi o o ø i u u y/.

Nasalization

In both French and Portuguese, nasal vowels eventually developed from sequences of a vowel followed by a nasal consonant (/m/ or /n/). Originally, all vowels in both languages were nasalized before any nasal consonants, and nasal consonants not immediately followed by a vowel were eventually dropped. In French, nasal vowels before remaining nasal consonants were subsequently denasalized, but not before causing the vowels to lower somewhat, e.g. dōnat "he gives" > OF dune /dunə/ > donne /dɔn/, fēminam > femme /fam/. Other vowels remained diphthongized, and were dramatically lowered: fīnem "end" > fin /fɛ̃/ (often pronounced [fæ̃]); linguam "tongue" > langue /lɑ̃ɡ/; ūnum "one" > un /œ̃/, /ɛ̃/.

In Portuguese, /n/ between vowels was dropped, and the resulting hiatus eliminated through vowel contraction of various sorts, often producing diphthongs: manum, *manōs > PWR *manu, ˈmanos "hand(s)" > mão, mãos /mɐ̃w̃, mɐ̃w̃s/; canem, canēs "dog(s)" > PWR *kane, ˈkanes > *can, ˈcanes > cão, cães /kɐ̃w̃, kɐ̃j̃s/; ratiōnem, ratiōnēs "reason(s)" > PWR *raˈdʲzʲone, raˈdʲzʲones > *raˈdzon, raˈdzones > razão, razões /χaˈzɐ̃w̃, χaˈzõj̃s/ (Brazil), /ʁaˈzɐ̃ũ, ʁɐˈzõj̃ʃ/ (Portugal). Sometimes the nasalization was eliminated: lūna "moon" > Galician-Portuguese lũa > lua; vēna "vein" > Galician-Portuguese vẽa > veia. Nasal vowels that remained actually tend to be raised (rather than lowered, as in French): fīnem "end" > fim /fĩ/; centum "hundred" > PWR tʲsʲɛnto > cento /ˈsẽtu/; pontem "bridge" > PWR pɔnte > ponte /ˈpõtʃi/ (Brazil), /ˈpõtɨ/ (Portugal).

Front-rounded vowels

Characteristic of the Gallo-Romance and Rhaeto-Romance languages are the front rounded vowels /y ø œ/. All of these languages show an unconditional change /u/ > /y/, e.g. lūnam > French lune /lyn/, Occitan /ˈlyno/. Many of the languages in Switzerland and Italy show the further change /y/ > /i/. Also very common is some variation of the French development /ɔː oː/ (lengthened in open syllables) > /we ew/ > /œ œ/, with mid back vowels diphthongizing in some circumstances and then re-monophthongizing into mid-front rounded vowels. (French has both /ø/ and /œ/, with /ø/ developing from /œ/ in certain circumstances.)

Unstressed vowels

There was more variability in the result of the unstressed vowels. Originally in Proto-Romance, the same nine vowels developed in unstressed as stressed syllables, and in Sardinian, they coalesced into the same five vowels in the same way.

In Italo-Western Romance, however, vowels in unstressed syllables were significantly different from stressed vowels, with yet a third outcome for final unstressed syllables. In non-final unstressed syllables, the seven-vowel system of stressed syllables developed, but then the low-mid vowels /ɛ ɔ/ merged into the high-mid vowels /e o/. This system is still preserved, largely or completely, in all of the conservative Romance languages (e.g. Italian, Spanish, Portuguese, Catalan).

In final unstressed syllables, results were somewhat complex. One of the more difficult issues is the development of final short -u, which appears to have been raised to /u/ rather than lowered to /o/, as happened in all other syllables. However, it is possible that in reality, final /u/ comes from long * < -um, where original final -m caused vowel lengthening as well as nasalization. Evidence of this comes from Rhaeto-Romance, in particular Sursilvan, which preserves reflexes of both final -us and -um, and where the latter, but not the former, triggers metaphony. This suggests the development -us > /ʊs/ > /os/, but -um > /ũː/ > /u/.[63]

The original five-vowel system in final unstressed syllables was preserved as-is in some of the more conservative central Italian languages, but in most languages there was further coalescence:

  • In Tuscan (including standard Italian), final /u/ merged into /o/.
  • In the Western Romance languages, final /i/ eventually merged into /e/ (although final /i/ triggered metaphony before that, e.g. Spanish hice, Portuguese fiz "I did" < *fize < Latin fēcī). Conservative languages like Spanish largely maintain that system, but drop final /e/ after certain single consonants, e.g. /r/, /l/, /n/, /d/, /z/ (< palatalized c).
  • In the Gallo-Romance languages (part of Western Romance), final /o/ and /e/ were dropped entirely unless that produced an impossible final cluster (e.g. /tr/), in which case a "prop vowel" /e/ was added. This left only two final vowels: /a/ and prop vowel /e/. Catalan preserves this system.
  • Loss of final stressless vowels in Venetian shows a pattern intermediate between Central Italian and the Gallo-Italic branch, and the environments for vowel deletion vary considerably depending on the dialect. In the table above, final /e/ is uniformly absent in mar, absent in some dialects in part(e) /part(e)/ and set(e) /sɛt(e)/, but retained in mare (< Latin mātrem) as a relic of the earlier cluster *dr.
  • In primitive Old French (one of the Gallo-Romance languages), these two remaining vowels merged into /ə/.

Various later changes happened in individual languages, e.g.:

  • In French, most final consonants were dropped, and then final /ə/ was also dropped. The /ə/ is still preserved in spelling as a final silent -e, whose main purpose is to signal that the previous consonant is pronounced, e.g. port "port" /pɔʁ/ vs. porte "door" /pɔʁt/. These changes also eliminated the difference between singular and plural in most words: ports "ports" (still /pɔʁ/), portes "doors" (still /pɔʁt/). Final consonants reappear in liaison contexts (in close connection with a following vowel-initial word), e.g. nous [nu] "we" vs. nous avons [nu.za.ˈvɔ̃] "we have", il fait [il.fɛ] "he does" vs. fait-il ? [fɛ.til] "does he?".
  • In Portuguese, final unstressed /o/ and /u/ were apparently preserved intact for a while, since final unstressed /u/, but not /o/ or /os/, triggered metaphony (see above). Final-syllable unstressed /o/ was raised in preliterary times to /u/, but always still written ⟨o⟩. At some point (perhaps in late Galician-Portuguese), final-syllable unstressed /e/ was raised to /i/ (but still written ⟨e⟩); this remains in Brazilian Portuguese, but has developed to /ɨ/ in northern and central European Portuguese.
  • In Catalan, final unstressed /as/ > /es/. In many dialects, unstressed /o/ and /u/ merge into /u/ as in Portuguese, and unstressed /a/ and /e/ merge into /ə/. However, some dialects preserve the original five-vowel system, most notably standard Valencian.

Intertonic vowels

The so-called intertonic vowels are word-internal unstressed vowels, i.e. not in the initial, final, or tonic (i.e. stressed) syllable, hence intertonic. Intertonic vowels were the most subject to loss or modification. Already in Vulgar Latin intertonic vowels between a single consonant and a following /r/ or /l/ tended to drop: vétulum "old" > veclum > Dalmatian vieklo, Sicilian vecchiu, Portuguese velho. But many languages ultimately dropped almost all intertonic vowels.

Generally, those languages south and east of the La Spezia–Rimini Line (Romanian and Central-Southern Italian) maintained intertonic vowels, while those to the north and west (Western Romance) dropped all except /a/. Standard Italian generally maintained intertonic vowels, but typically raised unstressed /e/ > /i/. Examples:

  • septimā́nam "week" > Italian settimana, Romanian săptămână vs. Spanish/Portuguese semana, French semaine, Occitan/Catalan setmana, Piedmontese sman-a
  • quattuórdecim "fourteen" > Italian quattordici, Venetian cuatòrdexe, Lombard/Piedmontese quatòrdes, vs. Spanish catorce, Portuguese/French quatorze
  • metipsissimus[64] > medipsimus /medíssimos/ ~ /medéssimos/ "self"[65] > Italian medésimo vs. Venetian medemo, Lombard medemm, Old Spanish meísmo, meesmo (> modern mismo), Galician-Portuguese meesmo (> modern mesmo), Old French meḍisme (> later meïsme > MF mesme > modern même)[66]
  • bonitā́tem "goodness" > Italian bonità ~ bontà, Romanian bunătate but Spanish bondad, Portuguese bondade, French bonté
  • collocā́re "to position, arrange" > Italian coricare vs. Spanish colgar "to hang", Romanian culca "to lie down", French coucher "to lay sth on its side; put s.o. to bed"
  • commūnicā́re "to take communion" > Romanian cumineca vs. Portuguese comungar, Spanish comulgar, Old French comungier
  • carricā́re "to load (onto a wagon, cart)" > Portuguese/Catalan carregar vs. Spanish/Occitan cargar "to load", French charger, Lombard cargà/caregà, Venetian carigar/cargar(e) "to load"
  • fábricam "forge" > /*fawrɡa/ > Spanish fragua, Portuguese frágua, Occitan/Catalan farga, French forge
  • disjējūnā́re "to break a fast" > *disjūnā́re > Old French disner "to have lunch" > French dîner "to dine" (but *disjū́nat > Old French desjune "he has lunch" > French (il) déjeune "he has lunch")
  • adjūtā́re "to help" > Italian aiutare, Romanian ajuta but French aider, Lombard aidà/aiuttà (Spanish ayudar, Portuguese ajudar based on stressed forms, e.g. ayuda/ajuda "he helps"; cf. Old French aidier "to help" vs. aiue "he helps")

Portuguese is more conservative in maintaining some intertonic vowels other than /a/: e.g. *offerḗscere "to offer" > Portuguese oferecer vs. Spanish ofrecer, French offrir (< *offerīre). French, on the other hand, drops even intertonic /a/ after the stress: Stéphanum "Stephen" > Spanish Esteban but Old French Estievne > French Étienne. Many cases of /a/ before the stress also ultimately dropped in French: sacraméntum "sacrament" > Old French sairement > French serment "oath".

Writing systems

The Romance languages for the most part have kept the writing system of Latin, adapting it to their evolution. One exception was Romanian before the nineteenth century, where, after the Roman retreat, literacy was reintroduced through the Romanian Cyrillic alphabet, a Slavic influence. A Cyrillic alphabet was also used for Romanian (Moldovan) in the USSR. The non-Christian populations of Spain also used the scripts of their religions (Arabic and Hebrew) to write Romance languages such as Ladino and Mozarabic in aljamiado.

Letters

The Romance languages are written with the classical Latin alphabet of 23 letters – A, B, C, D, E, F, G, H, I, K, L, M, N, O, P, Q, R, S, T, V, X, Y, Z – subsequently modified and augmented in various ways. In particular, the single Latin letter V split into V (consonant) and U (vowel), and the letter I split into I and J. The Latin letter K and the new letter W, which came to be widely used in Germanic languages, are seldom used in most Romance languages – mostly for unassimilated foreign names and words. Indeed, in Italian prose kilometro is properly chilometro. Catalan eschews importation of "foreign" letters more than most languages. Thus Wikipedia is Viquipèdia in Catalan but Wikipedia in Spanish.

While most of the 23 basic Latin letters have maintained their phonetic value, for some of them it has diverged considerably; and the new letters added since the Middle Ages have been put to different uses in different scripts. Some letters, notably H and Q, have been variously combined in digraphs or trigraphs (see below) to represent phonetic phenomena that could not be recorded with the basic Latin alphabet, or to get around previously established spelling conventions. Most languages added auxiliary marks (diacritics) to some letters, for these and other purposes.

The spelling rules of most Romance languages are fairly simple, and consistent within any language. Since the spelling systems are based on phonemic structures rather than phonetics, however, the actual pronunciation of what is represented in standard orthography can be subject to considerable regional variation, as well as to allophonic differentiation by position in the word or utterance. Among the letters representing the most conspicuous phonological variations, between Romance languages or with respect to Latin, are the following:

B, V: Merged in Spanish and some dialects of Catalan, where both letters represent a single phoneme pronounced as either [b] or [β] depending on position, with no differentiation between B and V.
C: Generally a "hard" [k], but "soft" (fricative or affricate) before e, i, or y.
G: Generally a "hard" [ɡ], but "soft" (fricative or affricate) before e, i, or y. In some languages, like Spanish, the hard g, phonemically /g/, is pronounced as a fricative [ɣ] after vowels. In Romansch, the soft g is a voiced palatal plosive [ɟ] or a voiced alveolo-palatal affricate [dʑ].
H: Silent in most languages; used to form various digraphs. But represents [h] in Romanian, Walloon and Gascon Occitan.
J: Represents the fricative [ʒ] in most languages, or the palatal approximant [j] in Romansh and in several of the languages of Italy, and [x] or [h] in Spanish, depending on the variety. Italian does not use this letter in native words.
Q: As in Latin, its phonetic value is that of a hard c, i.e. [k], and in native words it is almost always followed by a (sometimes silent) u. Romanian does not use this letter in native words.
S: Generally voiceless [s], but voiced [z] between vowels in some languages. In Spanish, Romanian, Galician and several varieties of Italian, however, it is always pronounced voiceless between vowels. If the phoneme /s/ is represented by the letter S, predictable assimilations are normally not shown (e.g. Italian /slitta/ 'sled', spelled slitta but pronounced [zlitːa], never with [s]). Also at the end of syllables it may represent special allophonic pronunciations. In Romansh, it also stands for a voiceless or voiced fricative, [ʃ] or [ʒ], before certain consonants.
W: No Romance language uses this letter in native words, with the exception of Walloon.
X: Its pronunciation is rather variable, both between and within languages. In the Middle Ages, the languages of Iberia used this letter to denote the voiceless postalveolar fricative [ʃ], which is still the case in modern Catalan and Portuguese. With the Renaissance the classical pronunciation [ks] – or similar consonant clusters, such as [ɡz], [ɡs], or [kθ] – were frequently reintroduced in latinisms and hellenisms. In Venetian it represents [z], and in Ligurian the voiced postalveolar fricative [ʒ]. Italian does not use this letter in native words.
Y: This letter is not used in most languages, with the prominent exceptions of French and Spanish, where it represents [j] before vowels (or various similar fricatives such as the palatal fricative [ʝ], in Spanish), and the vowel [i] or semivowel [j] elsewhere.
Z: In most languages it represents the sound [z]. However, in Italian it denotes the affricates [dz] and [ts] (which are two separate phonemes, but rarely contrast; among the few examples of minimal pairs are razza "ray" with [ddz], razza "race" with [tts] (note that both are phonetically long between vowels); in Romansh the voiceless affricate [ts]; and in Galician and Spanish it denotes either the voiceless dental fricative [θ] or [s].

Otherwise, letters that are not combined as digraphs generally represent the same phonemes as suggested by the International Phonetic Alphabet (IPA), whose design was, in fact, greatly influenced by Romance spelling systems.

Digraphs and trigraphs

Since most Romance languages have more sounds than can be accommodated in the Roman Latin alphabet they all resort to the use of digraphs and trigraphs – combinations of two or three letters with a single phonemic value. The concept (but not the actual combinations) is derived from Classical Latin, which used, for example, TH, PH, and CH when transliterating the Greek letters "θ", "ϕ" (later "φ"), and "χ". These were once aspirated sounds in Greek before changing to corresponding fricatives, and the H represented what sounded to the Romans like an /ʰ/ following /t/, /p/, and /k/ respectively. Some of the digraphs used in modern scripts are:

CI: used in Italian, Romance languages in Italy, Corsican and Romanian to represent /tʃ/ before A, O, or U.
CH: used in Italian, Romance languages in Italy, Corsican, Romanian, Romansh and Sardinian to represent /k/ before E or I (including yod /j/); /tʃ/ in Occitan, Spanish, Astur-leonese and Galician; [c] or [tɕ] in Romansh before A, O or U; and /ʃ/ in most other languages. In Catalan it is used in some old spelling conventions for /k/.
DD: used in Sicilian and Sardinian to represent the voiced retroflex plosive /ɖ/. In recent history more accurately transcribed as DDH.
DJ: used in Walloon and Catalan for /dʒ/.
GI: used in Italian, Romance languages in Italy, Corsican and Romanian to represent /dʒ/ before A, O, or U, and in Romansh to represent [ɟi] or /dʑi/ or (before A, E, O, and U) [ɟ] or /dʑ/
GH: used in Italian, Romance languages in Italy, Corsican, Romanian, Romansh and Sardinian to represent /ɡ/ before E or I (including yod /j/), and in Galician for the voiceless pharyngeal fricative /ħ/ (not standard sound).
GL: used in Romansh before consonants and I and at the end of words for /ʎ/.
GLI: used in Italian and Corsican for /ʎʎ/ and Romansh for /ʎ/.
GN: used in French, some Romance languages in Italy, Corsican and Romansh for /ɲ/, as in champignon; in Italian to represent /ɲɲ/, as in "ogni" or "lo gnocco".
GU: used before E or I to represent /ɡ/ or /ɣ/ in all Romance languages except Italian, Romance languages in Italy, Corsican, Romansh, and Romanian, which use GH instead.
IG: used at the end of word in Catalan for /tʃ/, as in maig, safareig or enmig.
IX: used between vowels or at the end of word in Catalan for /ʃ/, as in caixa or calaix.
LH: used in Portuguese and Occitan /ʎ/.
LL: used in Spanish, Catalan, Galician, Astur-leonese, Norman and Dgèrnésiais, originally for /ʎ/ which has merged in some cases with /j/. Represents /l/ in French unless it follows I (i) when it represents /j/ (or /ʎ/ in some dialects). As in Italian, it is used in Occitan for a long /ll/.
L·L: used in Catalan for a geminate consonant /ɫɫ/.
NH: used in Portuguese and Occitan for /ɲ/, used in official Galician for /ŋ/ .
N-: used in Piedmontese and Ligurian for /ŋ/ between two vowels.
NN: used in Leonese for /ɲ/, in Italian for geminate /nn/.
NY: used in Catalan for /ɲ/.
QU: represents /kw/ in Italian, Romance languages in Italy, and Romansh; /k/ in French, Astur-leonese (normally before e or i); /k/ (before e or i) or /kw/ (normally before a or o) in Occitan, Catalan and Portuguese; /k/ in Spanish (always before e or i).
RR: used between vowels in several languages (Occitan, Catalan, Spanish) to denote a trilled /r/ or a guttural R, instead of the flap /ɾ/.
SC: used before E or I in Italian, Romance languages in Italy as /ʃʃ/, in European Portuguese as /ʃˈs/ and in French, Brazilian Portuguese, Catalan and Latin American Spanish as /s/ in words of certain etymology (notice this would represent /θ/ in standard peninsular Spanish)
SCH: used in Romansh for [ʃ] or [ʒ], in Italian for /sk/ before "E"or "I", including yod /j/.
SCI: used in Italian, Romance languages in Italy, and Corsican to represent /ʃ/ or /ʃʃ/ before A, O, or U.
SH: used in Aranese Occitan for /ʃ/.
SS: used in French, Portuguese, Piedmontese, Romansh, Occitan, and Catalan for /s/ between vowels, in Italian, Romance languages of Italy, and Corsican for long /ss/.
TS: used in Catalan for /ts/.
TG: used in Romansh for [c] or [tɕ]. In Catalan is used for /dʒ/ before E and I, as in metge or fetge.
TH: used in Jèrriais for /θ/; used in Aranese for either /t/ or /tʃ/.
TJ: used between vowels and before A, O or U, in Catalan for /dʒ/, as in sotjar or mitjó.
TSCH: used in Romansh for [tʃ].
TX: used at the beginning or at the end of word or between vowels in Catalan for /tʃ/, as in txec, esquitx or atxa.
TZ: used in Catalan for /dz/.

While the digraphs CH, PH, RH and TH were at one time used in many words of Greek origin, most languages have now replaced them with C/QU, F, R and T. Only French has kept these etymological spellings, which now represent /k/ or /ʃ/, /f/, /ʀ/ and /t/, respectively.

Double consonants

Gemination, in the languages where it occurs, is usually indicated by doubling the consonant, except when it does not contrast phonemically with the corresponding short consonant, in which case gemination is not indicated. In Jèrriais, long consonants are marked with an apostrophe: s's is a long /zz/, ss's is a long /ss/, and t't is a long /tt/. The phonemic contrast between geminate and single consonants is widespread in Italian, and normally indicated in the traditional orthography: fatto /fatto/ 'done' vs. fato /fato/ 'fate, destiny'; cadde /kadde/ 's/he, it fell' vs. cade /kade/ 's/he, it falls'. The double consonants in French orthography, however, are merely etymological. In Catalan, the gemination of l is marked by a punt volat ("flying point"): l·l.

Diacritics

Romance languages also introduced various marks (diacritics) that may be attached to some letters, for various purposes. In some cases, diacritics are used as an alternative to digraphs and trigraphs; namely to represent a larger number of sounds than would be possible with the basic alphabet, or to distinguish between sounds that were previously written the same. Diacritics are also used to mark word stress, to indicate exceptional pronunciation of letters in certain words, and to distinguish words with same pronunciation (homophones).

Depending on the language, some letter-diacritic combinations may be considered distinct letters, e.g. for the purposes of lexical sorting. This is the case, for example, of Romanian ș ([ʃ]) and Spanish ñ ([ɲ]).

The following are the most common use of diacritics in Romance languages.

  • Vowel quality: the system of marking close-mid vowels with an acute accent, é, and open-mid vowels with a grave accent, è, is widely used (e.g. Catalan, French, Italian). Portuguese, however, uses the circumflex (ê) for the former, and the acute (é), for the latter. Some minority Romance languages use an umlaut (diaeresis mark) in the case of ä, ö, ü to indicate fronted vowel variants, as in German. Centralized vowels (/ɐ/, /ə/) are indicated variously (â in Portuguese, ă/î in Romanian, ë in Piedmontese, etc.). In French, Occitan and Romanian, these accents are used whenever necessary to distinguish the appropriate vowel quality, but in the other languages, they are used only when it is necessary to mark unpredictable stress, or in some cases to distinguish homophones.
  • Vowel length: French uses a circumflex to indicate what had been a long vowel (although nowadays this rather indicates a difference in vowel quality, if it has any effect at all on pronunciation). This same usage is found in some minority languages.
  • Nasality: Portuguese marks nasal vowels with a tilde (ã) when they occur before other written vowels and in some other instances.
  • Palatalization: some historical palatalizations are indicated with the cedilla (ç) in French, Catalan, Occitan and Portuguese. In Spanish and several other world languages influenced by it, the grapheme ñ represents a palatal nasal consonant.
  • Separate pronunciation: when a vowel and another letter that would normally be combined into a digraph with a single sound are exceptionally pronounced apart, this is often indicated with a diaeresis mark on the vowel. This is particularly common in the case of /gw/ before e or i, because plain gu in this case would be pronounced /g/. This usage occurs in Spanish, French, Catalan and Occitan, and occurred before the 2009 spelling reform in Brazilian Portuguese. French also uses the diaeresis on the second of two adjacent vowels to indicate that both are pronounced separately, as in Noël "Christmas" and haïr "to hate".
  • Stress: the stressed vowel in a polysyllabic word may be indicated with an accent, when it cannot be predicted by rule. In Italian, Portuguese and Catalan, the choice of accent (acute, grave or circumflex) may depend on vowel quality. When no quality needs to be indicated, an acute accent is normally used (ú), but Italian and Romansh use a grave accent (ù). Portuguese puts a diacritic on all stressed monosyllables that end in a e o as es os, to distinguish them from unstressed function words: chá "tea", más "bad (fem. pl.)", "seat (of government)", "give! (imperative)", mês "month", "only", nós "we" (cf. mas "but", se "if/oneself", de "of", nos "us"). Word-final stressed vowels in polysyllables are marked by the grave accent in Italian, thus università "university/universities", virtù "virtue/virtues", resulting in occasional minimal or near-minimal pairs such as parlo "I speak" ≠ parlò "s/he spoke", capi "heads, bosses" ≠ capì "s/he understood", gravita "it, s'/he gravitates" ≠ gravità "gravity, seriousness".
  • Homophones: words (especially monosyllables) that are pronounced exactly or nearly the same way and are spelled identically, but have different meanings, can be differentiated by a diacritic. Typically, if one of the pair is stressed and the other isn't, the stressed word gets the diacritic, using the appropriate diacritic for notating stressed syllables (see above). Portuguese does this consistently as part of notating stress in certain monosyllables, whether or not there is an unstressed homophone (see examples above). Spanish also has many pairs of identically pronounced words distinguished by an acute accent on the stressed word: si "if" vs. "yes", mas "but" vs. más "more", mi "my" vs. "me", se "oneself" vs. "I know", te "you (object)" vs. "tea", que/quien/cuando/como "that/who/when/how" vs. qué/quién/cuándo/cómo "what?/who?/when?/how?", etc. A similar strategy is common for monosyllables in writing Italian, but not necessarily determined by stress: stressed "it, s/he gives" vs. unstressed da "by, from", but also "tea" and te "you", both capable of bearing phrasal stress. Catalan has some pairs where both words are stressed, and one is distinguished by a vowel-quality diacritic, e.g. os "bone" vs. ós "bear". When no vowel-quality needs distinguishing, French and Catalan use a grave accent: French ou "or" vs. "where", French la "the" vs. "there", Catalan ma "my" vs. "hand".

Upper and lower case

Most languages are written with a mixture of two distinct but phonetically identical variants or "cases" of the alphabet: majuscule ("uppercase" or "capital letters"), derived from Roman stone-carved letter shapes, and minuscule ("lowercase"), derived from Carolingian writing and Medieval quill pen handwriting which were later adapted by printers in the fifteenth and sixteenth centuries.

In particular, all Romance languages capitalize (use uppercase for the first letter of) the following words: the first word of each complete sentence, most words in names of people, places, and organizations, and most words in titles of books. The Romance languages do not follow the German practice of capitalizing all nouns including common ones. Unlike English, the names of months, days of the weeks, and derivatives of proper nouns are usually not capitalized: thus, in Italian one capitalizes Francia ("France") and Francesco ("Francis"), but not francese ("French") or francescano ("Franciscan"). However, each language has some exceptions to this general rule.

Vocabulary comparison

The tables below provide a vocabulary comparison that illustrates a number of examples of sound shifts that have occurred between Latin and Romance languages. Words are given in their conventional spellings. In addition, for French the actual pronunciation is given, due to the dramatic differences between spelling and pronunciation. (French spelling approximately reflects the pronunciation of Old French, c. 1200 AD.)

Degrees of lexical similarity between the Romance languages

Data from Ethnologue:[84]

See also

  • Romance languages linguistics
  • Italo-Celtic
  • Romance peoples
  • Legacy of the Roman Empire
  • Southern Romance
  • African Romance
  • British Latin
  • Moselle Romance
  • Pannonian Romance
  • Romance-speaking Africa
  • Romance-speaking Europe
  • Romance-speaking world

Notes

  1. ^ Herman, József; Wright, Roger (Translator) (2000). Vulgar Latin. University Park: Pennsylvania State University Press. pp. 96–115. ISBN 0-271-02001-6.
  2. ^ "Catalan". Ethnologue. Retrieved 14 November 2017.
  3. ^ «Classifications that are not based on family trees usually involve ranking languages according to degree of differentiation rather than grouping them; thus, if the Romance languages are compared with Latin, it is seen that by most measures Sardinian and Italian are least differentiated and French most (though in vocabulary Romanian has changed most).» Marius Sala; et al. "Romance languages". Britannica.com.
  4. ^ Pei, Mario (1949). "A New Methodology for Romance Classification". WORD. 5 (2): 135–146. doi:10.1080/00437956.1949.11659494.
  5. ^ For example, a 1949 study by Pei, analyzing the degree of difference from a language's parent (Latin, in the case of Romance languages) by comparing phonology, inflection, syntax, vocabulary, and intonation, indicated the following percentages (the higher the percentage, the greater the distance from Latin): Sardinian 8%, Italian 12%, Spanish 20%, Romanian 23.5%, Occitan 25%, Portuguese 31%, and French 44%.
  6. ^ M. Paul Lewis, "Summary by language size", Ethnologue: Languages of the World, Sixteenth Edition.
  7. ^ David Dalby (1999). The Linguasphere register of the world's languages and speech communities (PDF). 2. Oxford, England: Observatoire Linguistique, Linguasphere Press. pp. 390–410 (zone 51). Retrieved July 30, 2020.
  8. ^ Ilari, Rodolfo (2002). Lingüística Românica. Ática. p. 50. ISBN 85-08-04250-7.
  9. ^ "romance | Origin and meaning of romance by Online Etymology Dictionary". www.etymonline.com. Retrieved 2021-03-30.
  10. ^ "Romance languages". Encyclopædia Britannica. Retrieved 2 December 2014.
  11. ^ Sardos etiam, qui non Latii sunt sed Latiis associandi videntur, eiciamus, quoniam soli sine proprio vulgari esse videntur, gramaticam tanquam simie homines imitantes: nam domus nova et dominus meus locuntur. ["As for the Sardinians, who are not Italian but may be associated with Italians for our purposes, out they must go, because they alone seem to lack a vernacular of their own, instead imitating gramatica as apes do humans: for they say domus nova [my house] and dominus meus [my master]." (English translation provided by Dante Online, De Vulgari Eloquentia, I-xi)] It is unclear whether this indicates that Sardinian still had a two-case system at the time; modern Sardinian lacks grammatical case.
  12. ^ "Dante's Peek". Online Etymology Dictionary. 2020.
  13. ^ Jaberg, Karl and Jud, Jakob, Sprach- und Sachatlas Italiens und der Südschweiz, Vol.1-8, Bern: Zofingen, 1928-1940; Karte 1045: QUELLA VACCA, Karte 342: UNA NOTTE (Online access: [1])
  14. ^ a b Zhang, Huiying (2015). "From Latin to the Romance languages: A normal evolution to what extent?" (PDF). Quarterly Journal of Chinese Studies. 3 (4): 105–111. Archived from the original (PDF) on 2018-01-19. Retrieved 2018-01-18.
  15. ^ Ruhlen M. (1987). A guide to the world's languages, Stanford University Press, Stanford.
  16. ^ Jones, Michael Allan (1990). "Sardinian". In Harris, Martin; Vincent, Nigel (eds.). The Romance Languages. New York: Oxford University Press. pp. 314–350. ISBN 978-0-19-520829-0.
  17. ^ Loporcaro, Michele (2011). "Phonological Processes". In Maiden; et al. (eds.). The Cambridge History of the Romance Languages: Volume 1, Structures.
  18. ^ Ledgeway, Adam; Maiden, Martin (2016). The Oxford Guide to the Romance Languages. Oxford University Press. p. 248ff. ISBN 978-0-19-967710-8.
  19. ^ Dalbera-Stefanaggi, Marie-Josée (2002). La langue corse (1st ed.). Paris: Presses universitaires de France. ISBN 978-2-13-052946-0. Compare comment 1 at the blog Language Hat and comment 2.
  20. ^ "NEO-ROMANTICISM IN LANGUAGE PLANNING (Edo BERNASCONI)". Archived from the original on 2015-02-04.
  21. ^ "NEO-ROMANTICISM IN LANGUAGE PLANNING (Edo BERNASCONI)". Archived from the original on 2015-07-10.
  22. ^ Peano, Giuseppe (1903). De Latino Sine Flexione. Lingua Auxiliare Internationale [2], Revista de Mathematica (Revue de Mathématiques), Tomo VIII, pp. 74–83. Fratres Bocca Editores: Torino.
  23. ^ "Eall fhoil de Bhreathanach". Archived from the original on June 10, 2008.
  24. ^ Henrik Theiling (2007-10-28). "Þrjótrunn: A North Romance Language: History". Kunstsprachen.de. Retrieved 2010-11-06.
  25. ^ "Relay 10/R – Jelbazech". Steen.free.fr. 2004-08-28. Retrieved 2010-11-06.
  26. ^ See Portuguese in Africa.
  27. ^ See Portuguese in Asia and Oceania.
  28. ^ See list of countries where Portuguese is an official language.
  29. ^ I.S. Nistor, "Istoria românilor din Transnistria" (The history of Romanians from Transnistria), București, 1995
  30. ^ Djuvara Neagu, "La Diaspora aroumaine aux XVIIIe et XIXe siècles " In: Les Aroumains, Paris : Publications Langues’O, 1989 (Cahiers du Centre d’étude des civilisations d’Europe centrale et du Sud-Est; 8). P. 95-125.
  31. ^ 1993 Statistical Abstract of Israel reports 250,000 speakers of Romanian in Israel, while the 1995 census puts the total figure of the Israeli population at 5,548,523
  32. ^ "Reports of about 300,000 Jews who left the country after WW2". Eurojewcong.org. Archived from the original on 2006-08-31. Retrieved 2010-11-06.
  33. ^ "Encarta Dictionary". Microsoft Encarta 2006. Archived from the original on 2009-10-28. Retrieved 2009-11-16.
  34. ^ "Ethnologue". SIL Haley. 3 October 2018.
  35. ^ Percy, Thomas (1887). Reliques of Ancient English Poetry: Consisting of Old Heroic Ballads, Songs, Etc. Abe Books. p. 289.
  36. ^ The Encyclopædia Britannica: A Dictionary of Arts, Sciences, Literature, and General Information. 28 (11 ed.). 1957. p. 167.
  37. ^ Bereznay, András (2011). Erdély történetének atlasza [Atlas of the History of Transylvania]. Méry Ratio. p. 63. ISBN 978-80-89286-45-4.
  38. ^ Rochette, p. 550
  39. ^ Stefan Zimmer, "Indo-European," in Celtic Culture: A Historical Encyclopedia (ABC-Clio, 2006), p. 961
  40. ^ Curchin, Leonard A. (1995). "Literacy in the Roman Provinces: Qualitative and Quantitative Data from Central Spain". The American Journal of Philology. 116 (3): 461–476 (464). doi:10.2307/295333. JSTOR 295333.
  41. ^ Herman, Jozsef (1 November 2010). Vulgar Latin. Penn State Press. ISBN 978-0-271-04177-3., pp. 108–115
  42. ^ a b Harris, Martin; Vincent, Nigel (2001). Romance Languages. London, England, UK: Routledge.
  43. ^ Vlad Georgescu, The Romanians: A History, Ohio State University Press, Columbus, p.12
  44. ^ Ioan-Aurel Pop, "On the Significance of Certain Names: Romanian/Wallachian and Romania/Wallachia" (PDF). Retrieved 18 June 2018
  45. ^ Vlad Georgescu, The Romanians: A History, Ohio State University Press, Columbus, p.13
  46. ^ a b c d Price, Glanville (1984). The French language: past and present. London: Grant and Cutler Ltd.
  47. ^ "Na" is a contraction of "em" (in) + "a" (the), the form "em a" is never used, it is always replaced by "na". The same happens with other prepositions: "de" (of) + o/a/os/as (singular and plural forms for "the" in masculine and feminine) = do, da, dos, das; etc.
  48. ^ Verb; literally means "to put in mouth"
  49. ^ Ilona Czamańska, "Vlachs and Slavs in the Middle Ages and Modern Era", Res Historica, 41, Lublin, 2016
  50. ^ van Durme, Luc (2002). "Genesis and Evolution of the Romance-Germanic Language Border in Europe". In Treffers-Daller, Jeanine; Willemyns, Roland (eds.). Language Contact at the Romance–Germanic Language Border (PDF). Multilingual Matters. p. 13. ISBN 9781853596278.
  51. ^ Note that the current Portuguese spelling (Portuguese Language Orthographic Agreement of 1990) abolished the use of the diaeresis for this purpose.
  52. ^ Pope (1934).
  53. ^ Rodney Sampson, Vowel Prosthesis in Romance: A Diachronic Study (Oxford: Oxford UP, 2010), 63.
  54. ^ Allen (2003) states: "There appears to have been no great difference in quality between long and short a, but in the case of the close and mid vowels (i and u, e and o) the long appear to have been appreciably closer than the short." He then goes on to the historical development, quotations from various authors (from around the second century AD), as well as evidence from older inscriptions where "e" stands for normally short i, and "i" for long e, etc.
  55. ^ Technically, Sardinian is one of the Southern Romance languages. The same vowel outcome occurred in a small strip running across southern Italy (the Lausberg Zone), and is thought to have occurred in the Romance languages of northern Africa.
  56. ^ Palmer (1954).
  57. ^ cauda would produce French **choue, Italian */kɔda/, Occitan **cauda, Romanian **caudă.
  58. ^ Kaze, Jeffery W. (1991). "Metaphony and Two Models for the Description of Vowel Systems". Phonology. 8 (1): 163–170. doi:10.1017/s0952675700001329. JSTOR 4420029.
  59. ^ Calabrese, Andrea. "Metaphony" (PDF). Archived from the original (PDF) on 2013-09-21. Retrieved 2012-05-15.
  60. ^ "ALVARO ARIAS CABAL - Publicaciones". personales.uniovi.es.
  61. ^ a b Penny, Ralph (1994). "Continuity and Innovation in Romance: Metaphony and Mass-Noun Reference in Spain and Italy". The Modern Language Review. 89 (2): 273–281. doi:10.2307/3735232. JSTOR 3735232.
  62. ^ Álvaro Arias. "La armonización vocálica en fonología funcional (de lo sintagmático en fonología a propósito de dos casos de metafonía hispánica) Archived 2018-01-19 at the Wayback Machine", Moenia 11 (2006): 111–139.
  63. ^ Note that the outcome of -am -em -om would be the same regardless of whether lengthening occurred, and that -im was already rare in Classical Latin, and appears to have barely survived in Proto-Romance. The only likely survival is in "-teen" numerals such as trēdecim "thirteen" > Italian tredici. This favors the vowel-lengthening hypothesis -im > /ĩː/ > /i/; but notice unexpected decem > Italian dieci (rather than expected *diece). It is possible that dieci comes from *decim, which analogically replaced decem based on the -decim ending; but it is also possible that the final /i/ in dieci represents an irregular development of some other sort and that the process of analogy worked in the other direction.
  64. ^ The Latin forms are attested; metipsissimus is the superlative of the formative -metipse, found for example in egometipse "myself in person"
  65. ^ Ralph Penny, A History of the Spanish Language, 2nd edn. (Cambridge: Cambridge UP, 2002), 144.
  66. ^ Espinosa, Aurelio M. (1911). "Metipsimus in Spanish and French". PMLA. 26 (2): 356–378. doi:10.2307/456649. JSTOR 456649.
  67. ^ Formerly ⟨qü⟩ in Brazilian Portuguese
  68. ^ Formerly ⟨gü⟩ in Brazilian Portuguese
  69. ^ "Ditzionàriu in línia de sa limba e de sa cultura sarda, Regione Autònoma de sa Sardigna". Archived from the original on 2017-10-08. Retrieved 2013-09-14.
  70. ^ "Sicilian–English Dictionary". Italian.about.com. 2010-06-15. Retrieved 2010-11-06.
  71. ^ "Dictionary Sicilian – Italian". Utenti.lycos.it. Archived from the original on 2009-04-20. Retrieved 2010-11-06.
  72. ^ "Indo-European Languages". Retrieved 2013-09-18.
  73. ^ "Traduttore Italiano Genovese - TIG".
  74. ^ "Grand Dissionari Piemontèis / Grande Dizionario Piemontese". Retrieved 2013-09-17.
  75. ^ "Dictionary English–Friulian Friulian–English". Sangiorgioinsieme.it. Archived from the original on 2011-07-22. Retrieved 2011-07-31.
  76. ^ "Lo trèsor arpitan".
  77. ^ Beaumont (2008-12-16). "Occitan–English Dictionary". Freelang.net. Retrieved 2010-11-06.
  78. ^ "English Aragonese Dictionary Online". Glosbe. Retrieved 2013-09-18.
  79. ^ "English Asturian Dictionary Online". Glosbe. Retrieved 2013-09-18.
  80. ^ Developed from *pluviūtam.
  81. ^ Initial h- due to contamination of Germanic *hauh "high". Although no longer pronounced, it reveals its former presence by inhibiting elision of a preceding schwa, e.g. le haut "the high" vs. l'eau "the water".
  82. ^ a b c d e f Cognate with Latin , not ego. Note that this parallels the state of affairs in Celtic, where the cognate of ego is not attested anywhere, and the use of the accusative form cognate to has been extended to cover the nominative, as well.
  83. ^ a b c Developed from an assimilated form *nossum rather than from nostrum.
  84. ^ Ethnologue, Languages of the World, 15th edition, SIL International, 2005.

References

Overviews:

  • Frederick Browning Agard. A Course in Romance Linguistics. Vol. 1: A Synchronic View, Vol. 2: A Diachronic View. Georgetown University Press, 1984.
  • Harris, Martin; Vincent, Nigel (1988). The Romance Languages. London: Routledge. Reprint 2003.
  • Posner, Rebecca (1996). The Romance Languages. Cambridge: Cambridge University Press.
  • Gerhard Ernst et al., eds. Romanische Sprachgeschichte: Ein internationales Handbuch zur Geschichte der romanischen Sprachen. 3 vols. Berlin: Mouton de Gruyter, 2003 (vol. 1), 2006 (vol. 2).
  • Alkire, Ti; Rosen, Carol (2010). Romance Languages: A Historical Introduction. Cambridge: Cambridge University Press.
  • Martin Maiden, John Charles Smith & Adam Ledgeway, eds., The Cambridge History of the Romance Languages. Vol. 1: Structures, Vol. 2: Contexts. Cambridge: Cambridge UP, 2011 (vol. 1) & 2013 (vol. 2).
  • Martin Maiden & Adam Ledgeway, eds. The Oxford Guide to the Romance Languages. Oxford: Oxford University Press, 2016.
  • Lindenbauer, Petrea; Metzeltin, Michael; Thir, Margit (1995). Die romanischen Sprachen. Eine einführende Übersicht. Wilhelmsfeld: G. Egert.
  • Metzeltin, Michael (2004). Las lenguas románicas estándar. Historia de su formación y de su uso. Uviéu: Academia de la Llingua Asturiana.

Phonology:

  • Boyd-Bowman, Peter (1980). From Latin to Romance in Sound Charts. Washington, D.C.: Georgetown University Press.
  • Cravens, Thomas D. Comparative Historical Dialectology: Italo-Romance Clues to Ibero-Romance Sound Change. Amsterdam: John Benjamins, 2002.
  • Sónia Frota & Pilar Prieto, eds. Intonation in Romance. Oxford: Oxford UP, 2015.
  • Christoph Gabriel & Conxita Lleó, eds. Intonational Phrasing in Romance and Germanic: Cross-Linguistic and Bilingual studies. Amsterdam: John Benjamins, 2011.
  • Philippe Martin. The Structure of Spoken Language: Intonation in Romance. Cambridge: Cambridge UP, 2016.
  • Rodney Sampson. Vowel Prosthesis in Romance. Oxford: Oxford UP, 2010.

Lexicon:

  • Holtus, Günter; Metzeltin, Michael; Schmitt, Christian (1988). Lexikon der Romanistischen Linguistik. (LRL, 12 volumes). Tübingen: Niemeyer.

French:

  • Price, Glanville (1971). The French language: present and past. Edward Arnold.
  • Kibler, William W. (1984). An introduction to Old French. New York: Modern Language Association of America.
  • Lodge, R. Anthony (1993). French: From Dialect to Standard. London: Routledge.

Portuguese:

  • Williams, Edwin B. (1968). From Latin to Portuguese, Historical Phonology and Morphology of the Portuguese Language (2nd ed.). University of Pennsylvania.
  • Wetzels, W. Leo; Menuzzi, Sergio; Costa, João (2016). The Handbook of Portuguese Linguistics. Oxford: Wiley Blackwell.

Spanish:

  • Penny, Ralph (2002). A History of the Spanish Language (2nd ed.). Cambridge: Cambridge University Press.
  • Lapesa, Rafael (1981). Historia de la Lengua Española. Madrid: Editorial Gredos.
  • Pharies, David (2007). A Brief History History of the Spanish Language. Chicago: University of Chicago Press.
  • Zamora Vicente, Alonso (1967). Dialectología Española (2nd ed.). Madrid: Editorial Gredos.

Italian:

  • Devoto, Giacomo; Giacomelli, Gabriella (2002). I Dialetti delle Regioni d'Italia (3rd ed.). Milano: RCS Libri (Tascabili Bompiani).
  • Devoto, Giacomo (1999). Il Linguaggio d'Italia. Milano: RCS Libri (Biblioteca Universale Rizzoli).
  • Maiden, Martin (1995). A Linguistic History of Italian. London: Longman.

Rhaeto-Romance:

  • John Haiman & Paola Benincà, eds., The Rhaeto-Romance Languages. London: Routledge, 1992.

External links

  • Michael de Vaan, Etymological Dictionary of Latin and the other Italic Languages, Brill, 2008, 826pp. (part available freely online)
  • Michael Metzeltin, Las lenguas románicas estándar. Historia de su formación y de su uso, Oviedo, 2004
  • Orbis Latinus, site on Romance languages
  • Hugh Wilkinson's papers on Romance Languages
  • Spanish is a Romance language, but what does that have to do with the type of romance between lovers?, dictionary.com
  • Comparative Grammar of the Romance Languages
  • Comparison of the computer terms in Romance languages
Retrieved from "https://en.wikipedia.org/w/index.php?title=Romance_languages&oldid=1036104036"