Кодировка символов GSM-7 – это стандарт 7-битной кодировки, используемый в сетях мобильной связи GSM для передачи текстовых SMS-сообщений. Он охватывает базовый набор латинских символов, цифр, специальных знаков и ограниченное количество дополнительных символов посредством механизма расширения (escape-символ). Благодаря использованию 7 бит на символ GSM-7 позволяет вместить до 160 символов в одном SMS-сообщении, что делает его эффективным с точки зрения использования сетевых ресурсов.
Как кодировка влияет на длину и стоимость SMS
- В стандартном GSM-7 одно SMS может содержать до 160 символов без разбиения.
- Если сообщение превышает этот лимит, оно делится на несколько частей (Concatenated Messages), которые автоматически объединяются на стороне получателя в одно сообщение.
- При объединении частей часть символов (служебная информация) «съедает» длину, поэтому каждый следующий сегмент содержит до 153 символов.
- Важно учитывать, что GSM-7 поддерживает ограниченный набор символов. Некоторые специальные знаки могут занимать 2 символа, что сокращает общую длину текста.
- Этот тип кодирования является наиболее выгодным, поскольку позволяет передать больше текста в пределах одного SMS.
Особенности и ограничения UCS-2 (16-битное кодирование)
- Если текст содержит символы, не входящие в набор GSM-7 (например, эмодзи или нелатинские алфавиты), используется кодировка UCS-2.
- В этом случае максимальная длина одного SMS сокращается до 70 символов.
- При разбиении на несколько сообщений каждый сегмент после первого ограничивается 67 символами.
- Некоторые символы (особенно эмодзи) могут занимать более одного знака, что еще больше уменьшает фактическую длину сообщения.
- Использование UCS-2 обычно повышает стоимость рассылки, поскольку для передачи того же текста требуется больше SMS-сегментов.