El juego de caracteres (CHARSET) en HTML PARTE I

Como bien saben HTML es un lenguaje para formar sitios o páginas web que se maneja en la Red Global y por ello, se tiene que dejar elaborar archivos redactados en diferentes idiomas. Ahora bien, se sabe que cada idioma posee un concreto carácter, que constituyen las palabras, y diverso de esos logran ser hasta determinados de una lengua delimitada, como por ejemplo la letra Eñe “ñ” del español o la ce cedilla “ç” del catalán, portugués etc. Pero no solo están las letras de cada alfabeto, sino que asimismo diversos signos como el dólar o euro, que conjuntamente tienen que lograr representarse en una página web.

En el ámbito informático en corriente, los documentos de texto lograrían redactarse con diferentes juegos de grafías. Eso es algo en la que la totalidad de los individuos no posee ninguna necesidad de estar al corriente, por lo que, en el momento de guardar un archivo de texto en un programa como el Bloc de Notas, ninguno se pregunta qué juego de caracteres se está empleando o se quiere utilizar.

Hay distintos tipos de juegos con caracteres, que poseen un conjunto más grande o menor de letras y símbolos, pendiendo para lo que fueron creados. Posiblemente alguien haya podido escuchar, o visto nombrar por alguna parte, el juego de caracteres UTF-8, el cual es uno de los más frecuentes, o el ISO-8859-1, que es el establecido en la totalidad de los editores de texto plano, en Windows. O sea, si bien no lo sepan que cuando se salva un archivo de texto en el ordenador, se codifica manejando un juego de caracteres en concreto.

Como ya se pueden hacer una idea, el juego de caracteres no es más que un contiguo de letras y símbolos manejados en la redacción y ahora ya conocen que cualquier fichero informático que posea texto plano (archivos .txt o .html por ejemplo) está catalogado con un juego de caracteres. Al momento de hacer páginas web en HTML se tiene que tener en cuenta esto ya que, depende del juego de grafías usadas, se tendrá asequibles unos u otros símbolos a la hora de escribir los textos de una página web.

Comunicar sobre el juego de caracteres con el atributo META CHARSET

En un archivo HTML se tiene la posibilidad de avisar sobre qué juego de caracteres se está empleando. No obstante, en caso que no lo empleen, los navegadores pretenderán detectarlo de forma automática. Claro está que, si vosotros mismos señalan qué juego de caracteres utilizan, será mucho mejor ya que el navegador no tendrá que resolverlo por su cuenta y se ahorrarán potentes fallas de lectura.

Para comunicar en el código fuente HTML del contiguo de caracteres que se usan se coloca una etiqueta o atributo META, que se sitúa en la cabecera del documento (en el HEAD). Ese atributo posee la siguiente metodología:

<meta http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-1″>
Como se ve, adentro de esa etiqueta o atributo se está informando el “charset” (set o conjunto de caracteres) manejado, que en ese caso sería “ISO-8859-1“. Si se está trabajando con UTF-8 se pudiese manejar esta META para informar sobre ello:

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>