Телефон

0 800 307-444

Отмена
tel Позвонить msg Онлайн поддержка
Главная Документация Отрасли спецификации и стандарты GSM 03.38 Character Set

GSM 03.38 Character Set

GSM 03.38 – это стандарт кодировки, используемый в мобильных сетях для отправки SMS. Он определяет набор символов, которые можно использовать в 7-битном коде, а также правила обработки расширенных символов, влияющие на длину сообщения.

Стандарт GSM 7-bit позволяет отправлять до 160 символов в одном SMS, тогда как использование символов, выходящих за пределы этого набора, приводит к переходу на Unicode (UCS-2), уменьшая максимальную длину SMS до 70 символов.

Понимание кодировки GSM 03.38 важно при составлении текстов SMS, так как неправильное использование символов может увеличить количество отправляемых сообщений и повысить затраты на рассылку.

Основные характеристики кодировки GSM 03.38

Таблица символов GSM 7-bit

СимволыКодировка (Hex)СимволыКодировка (Hex)
@0x00SP (пробел)0x20
£0x0100x30
$0x0210x31
¥0x0320x32
è0x0430x33
é0x0540x34
ù0x0650x35
ì0x0760x36
ò0x0870x37
Ç0x0980x38
LF (новая строка)0x0A90x39
Ø0x0BA0x41
ø0x0CB0x42
CR (возврат каретки)0x0DC0x43
Å0x0ED0x44
å0x0FE0x45
Δ0x10F0x46
_0x11G0x47
Φ0x12H0x48
Γ0x13I0x49
Λ0x14J0x4A
Ω0x15K0x4B
Π0x16L0x4C
Ψ0x17M0x4D
Σ0x18N0x4E
Θ0x19O0x4F
Ξ0x1AP0x50
ESC (Escape)0x1BQ0x51
Æ0x1CR0x52
æ0x1DS0x53
ß0x1ET0x54
É0x1FU0x55

Полный список символов можно найти в официальной спецификации GSM 03.38 (ETSI TS 100 900).

Расширенные символы и escape-последовательность

Некоторые символы не входят в основной набор GSM 7-bit и требуют использования escape-последовательности (0x1B), что фактически увеличивает их длину до двух символов.

Примеры расширенных символов:

СимволКодировка (Hex)
^0x1B14
{0x1B28
}0x1B29
\0x1B2F
[0x1B3C
~0x1B3D
]0x1B3E
``

Использование этих символов уменьшает доступное количество символов в одном SMS. Например, если сообщение состоит из 160 символов и включает {, то реальное количество доступных символов уменьшится до 159.

Переход на Unicode (UCS-2) и его влияние на длину SMS

Если сообщение содержит хотя бы один символ, не входящий в GSM 7-bit, оно будет закодировано в UCS-2 (16-битная кодировка Unicode).

Пример символов, приводящих к переходу на UCS-2:

Пример:

Оптимизация текста SMS для уменьшения затрат

Чтобы избежать ненужного увеличения количества сообщений:

  1. Используйте стандартные символы GSM 7-bit, избегая Unicode.
  2. Проверяйте текст перед отправкой, чтобы исключить невидимые символы, перевод строки и нестандартные кавычки.
  3. Заменяйте специальные символы, если это возможно (например, “ → ", ’ → ').
  4. Если необходимо использовать кириллические символы, учитывайте ограничение в 70 символов в одном SMS.

Разработчикам рекомендуется проверять сообщения перед отправкой, чтобы оптимизировать их длину и избежать ненужного увеличения количества сегментов SMS.

Дополнительные ресурсы

Если у вас есть вопросы по кодировке SMS, обратитесь в техническую поддержку.