Google soporta la nueva versión Unicode 5.1

El formato Unicode es un estándar que intenta ofrecer al usuario un juego de caracteres universal que sea capaz de transmitir textos escritos en cualquier alfabeto del planeta, cosa que no consiguen otros formatos como ASCII o Latin-1. Lo que pretende Unicode es asignar a cada caracter de cada alfabeto un único número, independientemente de la plataforma en la que sea escrito o leído dicho caracter. En este enlace tenéis una prueba de página web.

La primera especificación de Unicode (la 1.0) fue presentada en 1991, y poco a poco han ido surgiendo nuevas versiones que han ido cubriendo más alfabetos. Hace unos días, el Consorcio Unicode presentó la versión 5.1, soportando 1.624 nuevos caracteres, como por ejemplo la mayúscula de la famosa ‘Eszett‘ del alfabeto alemán, a la cual se le ha asignado el código ‘U+1E9E’.

Google está muy interesado en que los documentos de texto que se publican en la WWW estén codificados siguiendo un estándar único, como lo es Unicode. Por ello, ha sido uno de los mayores impulsores de este formato, y en este post oficial anuncia que además de rastrear páginas web genreadoras con Unicode, el buscador web también lo soporta a la hora de realizar búsquedas. Además, en este gráfico se muestra, a partir de los miles de millones de páginas rastreadas por Google, la evolución de los diferentes juegos de caracteres. Así por ejemplo, vemos como ASCII y Latin-1 pierden terreno progresivamente a favor del estándar Unicode, y más en concreto de su versión UTF-8.

Esta entrada fue publicada en Conocimientos, Curiosidades, Google. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *