Cuando pasa información a través de una URL, la cadena solo debe usar caracteres permitidos específicos. Estos caracteres permitidos incluyen caracteres alfabéticos, números y algunos caracteres especiales que tienen significado en la cadena de URL. Cualquier otro carácter que deba agregarse a una URL debe estar codificado para que no cause problemas durante el viaje del navegador para ubicar las páginas y los recursos que está buscando.
Codificar una URL
La codificación simplemente toma un carácter especial y lo reemplaza con su alternativa codificada. La cadena se ve desordenada, pero el resultado es fácil de leer para las computadoras y no se arriesgará a direcciones URL erróneas.
Por ejemplo, vincular a un archivo titulado mi currículum.pdf requiere codificación de URL para acomodar el espacio entre mi y reanudar. El resultado es my% 20resume.pdf. Sin la codificación del símbolo de espacio, el navegador web asumirá que la URL termina al final de la palabra mi, con resume.pdf descartándose como datos superfluos. En tal situación, ¡nunca encontraría su archivo!
¿Qué se debe codificar?
Cualquier carácter que no sea un carácter alfabético, un número o un carácter especial que se esté utilizando fuera de su contexto normal debe estar codificado en su página. A continuación, se muestra una tabla de caracteres comunes en las URL y su codificación:
Codificación de URL de caracteres reservados
Personaje | Propósito en URL | Codificación |
: | Protocolo separado (http) de la dirección | % 3B |
/ | Dominio y directorios separados | % 2F |
# | Anclas separadas | %23 |
? | Cadena de consulta separada | % 3F |
& | Elementos de consulta separados | %24 |
@ | Separe el nombre de usuario y la contraseña del dominio | %40 |
% | Indica un carácter codificado | %25 |
+ | Indica un espacio | % 2B |
No recomendado en URL | % 20 o + |
Estos ejemplos codificados son diferentes de los que encuentra con Caracteres especiales HTML. Por ejemplo, para codificar una URL con un carácter comercial, utilice %24. Sin embargo, en HTML, utilice & o &, los cuales escribirían el ampersand en la página HTML.
Estos diferentes esquemas de codificación no son tan contradictorios como parecen. Un conjunto gobierna las URL mientras que el otro gobierna el contenido de la página a la que apunta la URL.