A codificação de caracteres GSM-7 é um padrão de codificação de 7 bits utilizado nas redes de comunicações móveis GSM para a transmissão de mensagens de texto SMS. Abrange um conjunto básico de caracteres latinos, algarismos, sinais especiais e um número limitado de caracteres adicionais através de um mecanismo de expansão (caractere de escape). Graças à utilização de 7 bits por símbolo, o GSM-7 permite incluir até 160 caracteres numa única mensagem SMS, o que o torna eficiente em termos de utilização dos recursos da rede.
Como a codificação afeta o comprimento e o custo das SMS
- No GSM-7 padrão, uma SMS pode conter até 160 caracteres sem divisão.
- Se a mensagem exceder este limite, é dividida em várias partes (Concatenated Messages), que são automaticamente reunidas do lado do destinatário numa única mensagem.
- Ao reunir as partes, uma parte dos caracteres (informação de serviço) «consome» comprimento, pelo que cada segmento seguinte contém até 153 caracteres.
- É importante ter em conta que o GSM-7 suporta um conjunto limitado de caracteres. Alguns caracteres especiais podem ocupar 2 caracteres, o que reduz o comprimento total do texto.
- Este tipo de codificação é o mais vantajoso, uma vez que permite transmitir mais texto dentro de uma única SMS.
Características e limitações do UCS-2 (codificação de 16 bits)
- Se o texto contiver caracteres que não fazem parte do conjunto GSM-7 (por exemplo, emojis ou alfabetos não latinos), é utilizada a codificação UCS-2.
- Nesse caso, o comprimento máximo de uma mensagem SMS é reduzido para 70 caracteres.
- Ao dividir a mensagem em várias partes, cada segmento após o primeiro é limitado a 67 caracteres.
- Alguns caracteres (especialmente emojis) podem ocupar mais de um espaço, o que reduz ainda mais o comprimento real da mensagem.
- A utilização do UCS-2 normalmente aumenta o custo do envio, uma vez que são necessários mais segmentos de SMS para transmitir o mesmo texto.