Alfabetos y diccionarios

Alfabetos y diccionarios

Teko
Alfabeto con cuerpos humanos

Definición:

El término alfabeto procede del griego ἀλφάβετον (alfábeton), derivado de las dos primeras letras griegas ἄλφα (alfa, α) y βῆτα (beta, β), derivadas a su vez de las letras fenicias ʾalp y bēt, que significaban 'buey' y 'casa' respectivamente.

En la época actual, etiquetada como la era digital, revolución digital y cualquier otra cosa, pero digital, se detecta un cierto desapego por los conocimientos tradicionales. Me refiero en este caso a algo tan básico y común como es el alfabeto. Haberlos lo hay de muchos tipos, no sólo nuestro ABD... XYZ, ni mucho menos. Recordemos que los países eslavos utilizan el cirílico, los árabes su grafía curvilínea, en Asia tenemos decenas de combinaciones de ideogramas y kanjis, y un largo etcétera.

Con todo, el alfabeto occidental se asimila a lo que llamamos abecedario. Esto es:

Definición:

El término abecedario etimológicamente es de origen latino en el vocablo “abecedarium” que significa “abecedario, alfabeto”. “Alfabeto” proviene del griego compuesto por el nombre de la primera y la última letra de su sistema de escritura “alfa” y “beta”.

Como vemos, son casi sinónimos. La importancia del alfabeto no es ya sólo constituir los elementos necesarios para formar palabras y articular nuestros pensamientos con ellas. Hay otro uso importante, casi crucial diría yo, que es la ordenación. Como es lógico pensar, me refiero a la ordenación alfabética.

Definición:

Orden alfabético. En el idioma español este orden alfabético es el siguiente: A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z. A partir de esta secuencia ordenada es posible ordenar alfabéticamente cualquier palabra teniendo en cuenta las letras de la misma, en prioridad de izquierda a derecha. Ejemplos de uso: "ordenar alfabéticamente las siguientes palabras". "debes buscar en la guía telefónica su apellido; la guía telefónica está ordenada alfabéticamente por apellidos".

Y es a este último caso o acepción al que quiero referirme. Sin lugar a dudas los que ya peinamos algún pelillo blanco, y quizás no tanto, recordamos un libro que estaba presente en todas las aulas y en la mesa de cada alumno. Me refiero, como no, al diccionario (de la Lengua Española, o de cualquier lengua vehicular en la escuela de turno).

Diccionario Rancés - Sopena

Dicho libro, diccionario digo, contenía las definiciones de miles de palabras, así como, en algunos casos, ilustraciones de los términos más complejos, con diagramas que explicaban visualmente toda suerte de objetos, máquinas, animales, incluso mapas de países, etc.

En la memoria quedan aquellos ejercicios planteados por el maestro: "Buscad palabras que empiecen por la letra g que sean sustantivos". No teníamos ni idea de lo que era un sustantivo, pero gracias a la definición de cada palabra, podíamos verificar si la palabra tal o cual lo era, o quizás se trataba de una forma verbal, un adverbio o un adjetivo. El diccionario se convertía en un instrumento de aprendizaje, tanto del idioma como de la ordenación de las palabras, a la par que un medio ameno de estudio, gracias al "juego" planteado por el maestro.

Un paso más allá era el uso del diccionario de Sinónimos y Antónimos, es decir, el diccionario con el que era posible encontrar palabras de igual significado: casa, morada, hogar, o de significado contrario: bien, mal. Se añadía así un nuevo peldaño en el camino del aprendizaje del lenguaje, de nuestro idioma, entre definiciones que explicaban de forma breve y concisa cada una de las palabras, y parecidos y contrarios entre las mismas.

En alguna escuela cuyo maestro quería ir un poco más allá se utilizaba el llamado Diccionario Etimológico. Esto es, el diccionario que no sólo definía la palabra, si no que también indicaba el origen de la misma, tal como vemos en las dos primeras definiciones al principio de este texto. La Etimología es una ciencia curiosa que requiere la investigación en profundidad de cada palabra, puesto que no siempre está claro el origen real de cada una de ellas. Es frecuente que en algunas ediciones de este tipo de diccionarios se incluya, junto a la definición y descripción de la palabra, una cifra, en realidad una fecha del año aproximado de su primer uso en escritos publicados. Esta información es la que permite, por ejemplo, emprender una tarea titánica como la que la Real Academia Española está realizando con el Diccionario Histórico de la Lengua Española, con el que se pretende registrar la historia completa de cada una de las palabras del idioma español.

Diccionario de la Real Academia Española online

Volviendo al principio, el tema que preocupa es la desaparición de estos libros de referencia de las escuelas. "Ahora todo está online". Sí, es tan fácil como buscar cualquier palabra en Google o en un diccionario online para conocer su significado. Incluso los lectores de libros electrónicos incorporan dicha búsqueda para poder consultar cualquier palabra dudosa mientras se lee un texto cualquiera. El efecto lateral y perverso, de podría decir, es que los "nuevos lectores", las nuevas generaciones que no han utilizado nunca un diccionario en papel, apenas son capaces de recitar el abecedario en orden correcto, y menos aún ordenar un conjunto de datos siguiendo el alfabeto. Esto implica que tareas analógicas como el archivado de documentos impresos sufre de la incapacidad del sujeto por situar un documento cualquiera (una factura, un informe, una sentencia, un boletín) en el lugar correcto del archivo siguiendo algo tan utilizado hasta hace bien poco como es el abecedario.

Y no es que el orden alfabético sea la perfección absoluta. Los criterios de ordenación, aún sabiendo aplicar el abecedario, no son dogma. Así, si ordenamos títulos de libros, por ejemplo, algunos tenderán a usar el primer sustantivo del mismo obviando el artículo del mismo. Así, La Casa de la Pradera, se ordenaría en la C, como Casa de la Pradera, La en lugar en la L, como La Casa de la Pradera. Esto originaba y sigue originando no pocos problemas para localizar información a posteriori. Lo peor es que el archivado sea tarea de varias personas y cada una de ellas aplique un criterio diferente en este sentido. Se complica aún más si el texto a ordenar, sea un título o cualquier otro elemento, incluye signos de puntuación, números, etc. No hay un consenso en cuál es el orden correcto que debe aplicarse. ¡Ni siquiera los sistemas operativos funcionan con un mismo criterio! **

Por ejemplo, la ordenación de los ficheros y carpetas de un disco duro no sigue los mismos patrones en un sistema operativo Windows, Mac o Linux, con o sin diferenciación de mayúsculas y minúsculas, ordenando las carpetas primero y luego los ficheros, utilizando el criterio de primero símbolos, luego números y después letras, y un largo etcétera de combinaciones. En el caso del entorno informático lo más lógico sería aplicar un orden ya establecido hace decenas de años: el del alfabeto, perdón, código ASCII, convención utilizada desde los años 60 para ordenar los caracteres utilizados por el ordenador.

El código ASCII

Definición:

ASCII, pronunciado generalmente ​ o [áspi*], es un código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno. Fue creado en 1963 por el Comité Estadounidense de Estándares como una refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía.

*Diría que es una errata y se refiere a ásqi.

No es la solución perfecta, y no hay más que mirar una tabla ASCII para comprenderlo:

Tabla ASCII estándar separada en dos mitades, 127 bit y 256 bit

Es extraño ver que las letras mayúsculas están seguidas de unos símbolos cuando menos curiosos y luego siguen las letras minúsculas. Ya no decir lo que ocurre con los caracteres acentuados y sus variantes. Entonces, no nos vale como ordenación alfabética... o si, porque cualquier texto digital puede contener estos caracteres, así que algún criterio hay que aplicar y seguir para ordenar cadenas de texto formadas por los mismos.

Si ya era complicado ordenar un archivo de documentos sin conocer el orden del abecedario básico, ¿cómo será hacerlo siguiendo éste patrón o secuencia?

Hay que ir un paso más allá, porque aquí no se terminan las trabas digitales. Dado que el número de caracteres que pueden representarse a través del código ASCII está limitado a 256, es imposible incluir todas las posibles variantes de letras, acentos y modificadores de las mismas, pongo por caso, de las lenguas europeas. Tomemos el checo, por ejemplo, con sus consonantes con acento circunflejo: a b c č d ď e f g h ch i j k l m n ň o p q r ř s š t ť u v w x y z ž. No están en el código ASCII estándar. Hay que usar una tabla específica localizada, es decir, aplicando un criterio local según el país.***

Unicode al rescate

Esto ha generado problemas informáticos durante decenas de años. Y la solución vino de la mano de la ampliación de los 8-bits usados para representar un solo caracter (256 posibles combinaciones) a los 16-bit, utilizando dos bytes de memoria para un solo caracter. Esto da como resultado 65.536 combinaciones****. Y ahí es donde se pudo incluir prácticamente todo. Las variantes occidentales, el cirílico, el árabe, el japonés, incluso el chino, con algunas reservas en todos los casos.

¿Quién sería capaz de ordenar un archivo siguiendo el orden de la gigantesca tabla Unicode? Nadie.

Unicode completo

No bastaba con 65.000 caracteres.... así que Unicode también adolece del mismo problema que el código ASCII. Hay cientos de variantes locales (UFT-8, Latin, etc), extensiones, excepciones, diferencias entre sistemas ... Y así llegamos a la monstruosa tabla de 143.859 caracteres que podemos consultar aquí:

https://en.wikipedia.org/wiki/List_of_Unicode_characters

Parece que el objetivo de la ordenación alfabética sea imposible de asumir.

Si el problema del desconocimiento de algo tan básico como el abecedario tiene sus implicaciones para trabajos tan simples como archivar el papeleo de una oficina... ¿cuáles serán los que se deriven de no tener idea en absoluto de todo lo anterior? En una época en que se habla con la boca llena del big data, esto es, tratar con ingentes cantidades de datos, de información digital, ¿cómo puede alguien analfabeto en este aspecto comprender o tratar de trabajar con estas nuevas tecnologías de minería de datos? Son conceptos básicos como sumar y restar, indispensables para realizar cálculos más complejos. Lo mismo ocurre con la información. Si no se sabe que es un byte, un código ASCII, una ordenación equis... ¿es posible realizar un estudio sobre un conjunto de datos para dar unos resultados útiles? Mi opinión personal es que no, o cuando menos, no será nada fácil, y más aún, falto de fiabilidad y rigor. El software puede ser muy eficiente y potente, pero el criterio humano debe estar presente para conseguir que sus resultados se acerquen a la excelencia, en lugar de a la simple mecánica automática relegada a la calidad de los algoritmos utilizados por el mismo.

Y de esto iba toda la diatriba anterior. Conceptos base, sustrato de conocimientos adquiridos desde la escuela más primaria. Si eliminamos estos conocimientos de raíz, el futuro de nuestros estudiantes en el mundo laboral, tecnificado y digitalizado hasta el extremo es, cuando menos, dudoso. Igual que se promueve la lectura para no estar siempre pendiente de una conexión a Internet, porque "allí está todo", hay que promover el conocimiento y estudio de este tipo de cuestiones para poder sobrevivir en el mundo real, estemos conectados o no.



Notas

** Una interesante posibilidad de las actuales bases de datos o de cualquier sistema de almacenamiento de información, es el etiquetado (o tags, hashtags, etc.). Dado que un elemento cualesquiera, pongamos un libro, puede se considerado como parte de varias clasificaciones, como categorías, temas, estilos, etc. en lugar de tener que elegir una de ellas es más eficaz etiquetar dicho libro con todas las que coincidan. Ejemplo: Las enseñanzas de Don Juan, de Carlos Castaneda, puede clasificarse como crónica, autobiografía, fantasía, magia, literatura latina, etc. ¿En qué categoría lo ponemos? Si etiquetamos, podemos ponerlo en todas las mencionadas.

*** Los procesos de búsqueda en cualquier sistema, sea una página Web, una app, etc. tienden, a base de experiencia y aprendizaje, a ser más relajados y menos rigurosos. Me explico. Si busco la palabra camión, el sistema buscará exactamente eso, camión. ¿Qué ocurre si me equivoco y no acentúo la palabra? Puede que esté utilizando un medio que no me permita usar acentos, por cualquier motivo. El sistema debe ser más "inteligente" y para poder dar una respuesta a una pregunta no del todo exacta puede aplicar estrategias tales como sustituir todas las vocales, acentuadas o no, a su equivalente sin acentuar, y hacer una búsqueda con dicho patrón. O bien realizar una búsqueda sustituyendo cualquier vocal por cualquiera de sus variantes posibles, con o sin acentos. El resultado puede ser que encuentre palabras que no nos interesan, pero cuando menos asegura que sí que encontrará las que nos interesan a pesar de nuestro desliz ortográfico. Este tipo de estrategias son responsabilidad del programador o equipo de programación y sería muy extenso entrar en detalles. Inferencia, heurística... y un sinfín de términos más se aplican para ello. Como digo, extenso.

**** 256, 65.536 ... ¿de dónde salen estos números? Del código binario, o para ser exactos, de los números binarios. Toda información almacenada o tratada por un sistema digital se basa en números binarios. Es decir, en numeración en base 2. Lo que nos lleva a dos posibles estados: 0 y 1. Físicamente hablando eso corresponde, de forma simplificada, a tener corriente eléctrica en un circuito o no tenerla. Dos estados. Para poder tratar con cifras mayores de 0 y 1, que representan un solo bit de información, se utilizan combinaciones de más de un bit, como por ejemplo 8 bits, 16 bits, etc. Por convención se utilizan 8 bits, también llamado byte, para representar un caracter, una letra (o número, símbolo, etc) y almacenarlo en la memoria del ordenador (o dispositivo digital similar). ¿Cuántas combinaciones diferentes permiten 8 bits de información? Pues, sencillo, 2 elevado a 8, ya que cada bit sólo puede tener dos valores distintos. 2^8 = 256 valores, justo los que usa la tabla ASCII, desde 0 a 255. Si en su lugar se usan dos bytes de información, tenemos 2^16 = 65.536 valores diferentes. Y así hasta el infinito.

Libros impresos a bajo coste

https://telegra.ph/Libros-impresos-a-bajo-coste-05-13

Cien años de perdón

https://telegra.ph/Cien-a%C3%B1os-de-perd%C3%B3n-05-06

Whipple van Buren Philips

https://telegra.ph/Whipple-van-Buren-Phillips-03-29

Buscando libros

https://telegra.ph/Buscando-libros-11-01

No hay suficiente vida

https://telegra.ph/No-hay-suficiente-vida-10-19

Prestas libros... y pretendes recuperarlos?

https://telegra.ph/Prestas-libros-y-pretendes-recuperarlos-06-11

¿Es el coleccionista un sociopata digital?

https://telegra.ph/Es-el-coleccionista-un-soci%C3%B3pata-digital-01-18

¿Qué es un libro de autoayuda?

https://telegra.ph/Qu%C3%A9-es-un-libro-de-autoayuda-05-15

LEGOPURISMO

https://telegra.ph/LEGOPURISMO-04-03

Beneficios de escribir a mano

https://telegra.ph/Beneficios-de-escribir-a-mano-03-25

¿Digital o papel?

https://telegra.ph/Digital-o-Papel-02-21

Marcapáginas

https://telegra.ph/Marcap%C3%A1ginas-02-18






Report Page