驴Cu谩les son las diferencias entre ASCII, Unicode y UTF-8?
Los strings si bien se muestran en pantalla como texto, se almacenan en la computadora en forma de n煤meros.
Para hacer la conversi贸n de n煤meros a caracteres, se utiliza una tabla de conversi贸n o codificaci贸n est谩ndar llamada ASCII (American Standard Code for Information Interchange).
El c贸digo ASCII esta representado por enteros de 7 bits.
Por ejemplo…
- El 65 representa el caract茅r A.
- El 66 el caract茅r B.
Si bien el c贸digo ASCII permite desplegar caracteres de forma correcta en el Ingl茅s, no ofrece soporte para otros lenguajes existentes como el Japon茅s.
Para solucionar este problema existe el c贸digo Unicode creado en 1987, y provee soporte para la mayor铆a de los caracteres existentes en los diferentes lenguajes. La ultima versi贸n soporta 128,000 caracteres. De forma conveniente los primeros 128 caracteres de Unicode son el equivalente al c贸digo ASCII.
UTF-8 es uno de los esquemas que implementa Unicode. Los colaboradores en la creaci贸n de UTF-8 (Rob Pike y Khen Thompson), son tambi茅n dos de los co-creadores del lenguaje de programaci贸n Go, lo que permite que tenga un excelente soporte de caracteres internacionales. De igual forma el c贸digo fuente de Go, es siempre almacenado en UTF-8.
Tabla del C贸digo ASCII
La siguiente es la tabla completa del C贸digo ASCII.