Fem una mica de lingüística comparada amb Google Sheets

Fem una mica de lingüística comparada amb Google Sheets

Ricardo Viruete-Erdozáin

Molts mestres i professors, com és el meu cas, solem fer servir els fulls de càlcul per emmagatzemar les diferents notes dels alumnes i calcular posteriorment llurs qualificacions trimestrals i finals. D’altres també hi hem fet petites bases de dades sobre temes diversos, com per exemple, un recull de vocabulari en diferents llengües per poder explicar als nostres alumnes el paregut o no d’aquestes. Però en aquest últim cas som nosaltres qui hem de buscar totes les correspondències i introduir-les al full.

Però... i si poguéssim automatitzar aquest procés amb alguna fórmula? Sens dubte, ens estalviaríem molt de treball i podríem introduir diferents correspondències lingüístiques de manera automàtica. Doncs bé, som d’enhorabona perquè, com podem llegir a Genbeta o Xataka, el gegant informàtic Google ha implementat una fórmula als seus fulls de càlcul en línia, anomenats Google Sheets, per tal de poder aprofitar el seu conegut traductor Google Translate i fer-lo servir en qualsevol cel·la del nostre document.

Aquesta fórmula s’anomena GOOGLETRANSLATE i, com podem llegir a la seva pàgina d’ajuda, la seva sintaxi és la següent:

=GOOGLETRANSLATE(text;[idioma_origen;idioma_destí])

on “text” és el contingut que volem traduir; “idioma_origen”, la llengua del contingut que volem traduir; i “idioma_destí”, la llengua a la qual el traduirem. Les 103 llengües que, fins al moment d’escriure aquest article, tradueix Google Translate s’han d’introduir mitjançant un codi de dues lletres corresponent a la normativa ISO 639-1 o, en algun cas, amb un de tres de la ISO 639-2 −els codis de les 103 llengües els podeu trobar en un annex al final d’aquest article−. Dels tres elements de la fórmula només el primer (“text”) és obligatori, però si s’indica una de les dues llengües és obligatòria la presència de l’altra. Si només s’indica el text a traduir, el sistema detecta, teòricament −al meu ordinador aquesta formulació em dona error−, la llengua d’origen i tradueix a la llengua per defecte del sistema.

Passem ara a veure alguns exemples de l’ús d’aquesta fórmula.

Exemple 1:

=GOOGLETRANSLATE("Letux és un poble de l'Aragó i Aibar un altre de Navarra.";"ca";"es")

Com podem veure en aquest exemple, hem escrit dintre de la fórmula el text que volem traduir i després hem indicat que aquest text està escrit en català (amb el codi ca) i que s’ha de traduir al castellà (amb el codi es). En aquest cas els tres elements s’han d’escriure entre cometes perquè no es fa referència a cap cel·la de la taula.

Exemple 2:

=GOOGLETRANSLATE(A1;"es";"ca")

En aquest exemple el text que traduirem, aquest cop del castellà al català, es troba escrit a la cel·la A1, que és on havíem aplicat l’exemple anterior. Ara, com que el text és una referència a una cel·la, escrivim les coordenades sense cometes. L’aspecte positiu de fer servir referències rau en el fet de poder canviar els elements processats per la fórmula sense haver de canviar-la. Així doncs, si ara sobreescrivim la cel·la A1 amb un altre text en castellà (Este fin de semana visitaremos Cuarte y Burlada.), aquest serà traduït automàticament a la cel·la on tenim la fórmula d’aquest exemple.

Exemple 3:

=GOOGLETRANSLATE(A2;B2;C2)

En aquest exemple tots els elements són referències: el text és a la cel·la A2 (Mi hijo se llama Arán.), el codi de la llengua d’origen a la B2 (es) i el de la llengua de destí a la C2 (ca). Escrivint així la fórmula podem canviar els tres elements sense haver de modificar-la. D’aquesta manera si ara volem traduir del castellà a l’italià només caldrà anar a la cel·la C2 i canviar el codi ca del català pel codi it de l’italià i el resultat que es mostra s’actualitzarà automàticament.

Exemple 4:

=GOOGLETRANSLATE(A2;"auto";"ca")

Ara es reconeix automàticament (amb el codi auto) el text de la llengua d’origen (Mi mujer se llama Elisabet.; Mia moglie è nata a Cuarte.; But our son was born in Reus.) que hi ha a A2 i la tradueix, sigui quina sigui, al català.

Com acabem de comprovar, Google Translate és capaç de detectar la llengua d’origen i traduir-la a una altra. Potser, però, a nosaltres no ens interessa traduir res sinó simplement saber a quina llengua pertany un text determinat. Per a aquest propòsit s’ha implementat una altra fórmula anomenada DETECTLANGUAGE. La seva sintaxi, segons la seva pàgina d’ajuda, és la següent:

=DETECTLANGUAGE(text_o_interval)

on “text” pot ser una cadena de caràcters entre cometes o una referència i “interval” ha de ser sempre una referència. Si a les cel·les que comprèn l’interval hi ha més d’una llengua només es detectarà la de la primera. El resultat de la detecció apareix en forma de codi. Aquests codis són els mateixos que usem a la fórmula GOOGLETRANSLATE.

Veiem ara la fórmula en acció.

Exemple 5:

=DETECTLANGUAGE (A2)

En aquest exemple s’examina el contingut del text de la cel·la A2 i es determina que està escrit en la llengua amb codi es, és a dir, castellà. Si sobreescrivim A2 amb textos en altres llengües, la detecció automàtica s’actualitza i ens indica el codi corresponent de la nova llengua que hi hem escrit (al nostre exemple: it d’itàlià, en d’anglès i ca de català, respectivament).

Si el text que escrivim és curt és possible que la detecció no sigui molt precisa i es detecti una altra llengua molt semblant, com ara detectar com a portuguès (pt) un text escrit en gallec (gl).

Exemple 6:

Un cop que ja hem après el funcionament d’ambdues fórmules, podem començar ja a fer-les treballar i, com diu el títol de l’article, fer una mica de lingüística comparada.

Com sembla obvi, el que farem serà crear una taula on es tradueixin mots d’una llengua a moltes altres. En el nostre cas compararem el català, d’una banda, amb altres llengües romàniques i el llatí i, d’una altra, amb altres llengües indoeuropees i no indoeuropees. D’aquesta manera els nostres alumnes podran veure com les llengües romàniques s’assemblen molt entre elles i amb el llatí i com s’assemblen una mica menys amb llengües indoeuropees i, finalment, com no s’assemblen gens ni mica amb llengües no indoeuropees. També podem triar paraules que s’assemblen en llengües que no haurien de tenir cap paregut per tal d’explicar diferents mecanismes d’intercanvi de vocabulari o la diferència entre cultismes i paraules patrimonials. També podem posar llengües no escrites en alfabet llatí, si més no, per poder fer-los veure que hi ha moltes maneres d’escriure i que la nostra no és l’única. Comencem doncs!

Abans d’escriure les fórmules escriurem a la primera fila els grups de llengües que traduirem: llengües romàniques, altres llengües indoeuropees i llengües no indoeuropees. A la segona fila escriurem el nom de les llengües que hem triat. A la tercera posarem el codi que correspon a cada llengua. A la primera columna a partir de la quarta fila podem començar ja a escriure tot allò que volem traduir.

Ara ja només ens queda escriure la fórmula adient a la primera cel·la on volem començar a traduir (en el nostre exemple la cel·la B4) i, després, arrossegar-la per copiar-la a la resta de cel·les de la taula per tal que tot es tradueixi a totes les llengües seleccionades. La fórmula que farem servir és la següent:

=GOOGLETRANSLATE($A4;$A$3;B$3)

Exemple 7:

Així, doncs, estem dient que llegeixi el text de la cel·la A4, que està escrit en la llengua el codi del qual es troba en A3, i el tradueixi a la llengua el codi del qual és en B3. Com veieu, també hem introduït alguns signes de dòlar ($). Aquest símbol posat al davant de la referència d’una columna o una fila indica que, quan s’arrossegui i es copiï la fórmula en d’altres cel·les, aquella referència s’ha de mantenir fixa, és a dir, sense canviar correlativament com normalment passa als fulls de càlcul. D’aquesta manera la referència del text ($A4) indica que, quan copiarem la fórmula cap a la dreta, sempre es prendrà com a referència la columna A i que, quan es copiarà cap a baix, la fila sí que anirà canviant de manera correlativa. La referència a la llengua d’origen ($A$3), català, es mantindrà sempre fixa i la referència a la llengua de destí (B$3) canviarà correlativament la columna de referència (cada columna és una llengua diferent) però no la fila (la fila 3 és on hem escrit els codis de les llengües).

Una vegada que hem introduït la fórmula anterior a la cel·la B4, l’arrossegarem fins a l’última fila per copiar-la i traduir tot al castellà. Després seleccionarem l’interval des de la B4 fins a la B38 i l’arrossegarem fins a la columna Q per traduir-ho a la resta de llengües. I ja tenim la nostra graella enllestida! Com que hi ha molta informació a traduir i depenent de la velocitat de la connexió a internet, la traducció pot trigar algun segon.

Finalment, per comprovar que la fórmula s’ha modificat correctament, mirem la fórmula de la cel·la Q38:

=GOOGLETRANSLATE($A38;$A$3;Q$3)

Efectivament la fórmula s’ha transformat tal com volíem i, ara, qualsevol error o inexactitud en les traduccions ja és culpa de Google.

Quant al fet de baixar una còpia del document, hem de dir que tant GOOGLETRANSLATE com DETECTLANGUAGE són fórmules exclusives de Google Sheets, el que vol dir que, quan exportem el nostre full a un format com xlsx o ods, la fórmula no funcionarà. Ens quedarà l’opció d’exportar en pdf o copiar i enganxar totes les cel·les manualment al xlsx o ods exportat.

Google Translate té les seves limitacions i aquestes fórmules no les hauríem d’usar per fer un treball seriós de lingüística comparada, però sí podem dir que aquesta és una eina excepcional si el que pretenem és simplement fer un primer i ràpid apropament escolar a la comparació entre diferents llengües, ja que ens estalvia molt de temps i ens posa a l’abast un gran cabdal lèxic d’un munt de llengües de les quals no tenim diccionaris a les nostres biblioteques.

M’acomiado esperant que aquest article hagi pogut ser d’utilitat i, havent vist com és la traducció a la llengua llatina, amb la tranquil·litat que els professors de Llatí com jo encara no hem de tenir por de perdre la nostra feina per culpa de Mr. Google.


Annex I: llengües i codis suportats per Google Translate.

afrikaans (af)

albanès (sq)

alemany (de)

amhàric (am)

àrab (ar)

armeni (hy)

àzeri (az)

bengalí (bn)

bielorús (be)

birmà (my)

bosnià (bs)

búlgar (bg)

cambodjà (km)

canarés (kn)

català (ca)

cebuà (ceb)

txec (cs)

chichewa (ny)

xinès (zh)

singalès (si)

coreà (ko)

cors (co)

croat (hr)

danès (da)

eslovac (sk)

eslovè (sl)

espanyol (es)

esperanto (eo)

estonià (et)

basc (eu)

finlandès (fi)

francès (fr)

frisio (fy)

gaèlic escocès (gd)

gal·lès (cy)

gallec (gl)

georgià (ka)

grec (el)

gujarati (gu)

crioll haitià (ht)

hausa (ha)

hawaià (haw)

hebreu (he)

hindi (hi)

hmong (hmn)

hongarès (hu)

igbo (ig)

indonesi (id)

anglès (en)

irlandès (ga)

islandès (is)

italià (it)

japonès (ja)

javanès (jv)

kazakh (kk)

kirguís (ky)

kurd (ku)

lao (lo)

llatí (la)

letó (lv)

lituà (lt)

luxemburguès (lb)

macedoni (mk)

malaialam (ml)

malai (ms)

malgache (mg)

maltès (mt)

maorí (mi)

maratí (mr)

mongol (mn)

neerlandès (nl)

nepalès (ne)

noruec (no)

panjabi (pa)

paixtu (ps)

persa (fa)

polonès (pl)

portuguès (pt)

romanès (ro)

rus (ru)

samoà (sm)

serbi (sr)

sesotho (st)

shona (sn)

sindhi (sd)

somali (so)

sundanès (su)

suahili (sw)

suec (sv)

tagal (tl)

tailandès (th)

tàmil (ta)

tadjik (tg)

telugu (te)

turc (tr)

ucraïnès (uk)

urdú (ur)

uzbek (uz)

vietnamita (vi)

xhosa (xh)

jiddisch (yi)

yoruba (yo)

zulu (zu)


Annex 2: Webgrafia.

FM., Yúbal (2019). Cómo usar Google Translate automáticamente en las hojas de cálculo de Google Sheets. Recollit de https://www.xataka.com/basics/como-usar-google-translate-automaticamente-hojas-calculo-google-sheets (Consultat el 27 de juny de 2019).

González, G. (2019). Este truco de las hojas de cálculo de Google es la forma más sencilla de traducir muchas palabras a la vez. Recollit de https://www.genbeta.com/paso-a-paso/este-truco-hojas-calculo-google-forma-sencilla-traducir-muchas-palabras-a-vez (Consultat el 27 de juny de 2019).

Google (2019). Ayuda de GOOGLETRANSLATE. Recollit de https://support.google.com/docs/answer/3093331?hl=es (Consultat el 27 de juny de 2019).

Google (2019). Ayuda de DETECTLANGUAGE Recollit de https://support.google.com/docs/answer/3093278?hl=es (Consultat el 27 de juny de 2019).

Library of Congress (2017). Codes for the Representation of Names of Languages. Recollit de https://www.loc.gov/standards/iso639-2/php/code_list.php (Consultat el 27 de juny de 2019).

Viquipèdia (2018). ISO 639-1. Recollit de https://ca.wikipedia.org/wiki/ISO_639-1 (Consultat el 27 de juny de 2019).


Annex 3: Recursos multimèdia utilitzats.

Google Sheets: https://www.google.es/intl/ca/sheets/about/

Google Translate: https://translate.google.es/?hl=ca

Online converter: https://video.online-convert.com/

Record screen: https://recordscreen.io/

Telegraph: https://telegra.ph

Youtube: https://www.youtube.com/channel/UC9fgeDC9VWRBa4ufos5kJxQ

Wordcloud: https://play.google.com/store/apps/details?id=ice.lenor.nicewordplacer.app&hl=ca_419

Llicència d’aquest article:

Reconeixement-NoComercial-CompartirIgual (CC BY-NC-SA)

«Aquesta llicència permet a qualsevol persona mesclar, adaptar i construir a partir de la vostra obra sense finalitat comercial, sempre que us en reconeguin l’autoria i mantinguin llicència en les seves noves creacions». (Recollit de https://creativecommons.org/licenses/?lang=ca i consultat el el 28 de juny de 2019).

Vegeu aquí el resum de la llicència i aquí el codi legal.