Телефон

0 800 307-444

Скасування
tel Зателефонувати msg Онлайн підтримка
Головна Документація Галузі специфікації та стандарти GSM 03.38 Character Set

GSM 03.38 Character Set

GSM 03.38 – eto standart kodirovki, ispol'zuyemyy v mobil'nykh setyakh dlya otpravki SMS. On opredelyayet nabor simvolov, kotoryye mozhno ispol'zovat' v 7-bitnom kode, a takzhe pravila obrabotki rasshirennykh simvolov, vliyayushchiye na dlinu soobshcheniya.

Standart GSM 7-bit pozvolyayet otpravlyat' do 160 simvolov v odnom SMS, togda kak ispol'zovaniye simvolov, vykhodyashchikh za predely etogo nabora, privodit k perekhodu na Unicode (UCS-2), umen'shaya maksimal'nuyu dlinu SMS do 70 simvolov.

Ponimaniye kodirovki GSM 03.38 vazhno pri sostavlenii tekstov SMS, tak kak nepravil'noye ispol'zovaniye simvolov mozhet uvelichit' kolichestvo otpravlyayemykh soobshcheniy i povysit' zatraty na rassylku.

Osnovnyye kharakteristiki kodirovki GSM 03.38

Показати більше 852 / 5 000

GSM 03.38 – це стандарт кодування, який використовується в мобільних мережах для надсилання SMS. Він визначає набір символів, які можна використовувати в 7-бітному коді, а також правила обробки розширених символів, що впливають на довжину повідомлення.

Стандарт GSM 7-bit дозволяє відправляти до 160 символів в одному SMS, тоді як використання символів, що виходять за межі цього набору, призводить до переходу на Unicode (UCS-2), зменшуючи максимальну довжину SMS до 70 символів.

Розуміння кодування GSM 03.38 важливе при складанні текстів SMS, оскільки неправильне використання символів може збільшити кількість повідомлень, що відправляються, і підвищити витрати на розсилку.

Основні характеристики кодування GSM 03.38

Таблиця символів GSM 7-bit

СимволиКодування (Hex)СимволиКодування (Hex)
@0x00SP (пробіл)0x20
£0x0100x30
$0x0210x31
¥0x0320x32
è0x0430x33
é0x0540x34
ù0x0650x35
ì0x0760x36
ò0x0870x37
Ç0x0980x38
LF (новий рядок)0x0A90x39
Ø0x0BA0x41
ø0x0CB0x42
CR (повернення каретки)0x0DC0x43
Å0x0ED0x44
å0x0FE0x45
Δ0x10F0x46
_0x11G0x47
Φ0x12H0x48
Γ0x13I0x49
Λ0x14J0x4A
Ω0x15K0x4B
Π0x16L0x4C
Ψ0x17M0x4D
Σ0x18N0x4E
Θ0x19O0x4F
Ξ0x1AP0x50
ESC (Escape)0x1BQ0x51
Æ0x1CR0x52
æ0x1DS0x53
ß0x1ET0x54
É0x1FU0x55

Повний список символів можна знайти у офіційній специфікації GSM 03.38 (ETSI TS 100 900).

Розширені символи та escape-послідовність

Деякі символи не входять до основного набору GSM 7-bit і вимагають використання escape-послідовності (0x1B), що фактично збільшує їх довжину до двох символів.

Приклади розширених символів:

СимволКодування (Hex)
^0x1B14
{0x1B28
}0x1B29
0x1B2F
[0x1B3C
~0x1B3D
]0x1B3E
``

Використання цих символів зменшує доступну кількість символів в одному SMS. Наприклад, якщо повідомлення складається з 160 символів і включає {, то реальна кількість доступних символів зменшиться до 159.

Перехід на Unicode (UCS-2) та його вплив на довжину SMS

Якщо повідомлення містить хоча б один символ, що не входить до GSM 7-bit, воно буде закодовано в UCS-2 (16-бітове кодування Unicode).

Приклад символів, які призводять до переходу на UCS-2:

Приклад:

Оптимізація тексту SMS для зменшення витрат

Щоб уникнути непотрібного збільшення кількості повідомлень:

  1. Використовуйте стандартні символи GSM 7-bit, уникаючи Unicode.
  2. Перевіряйте текст перед відправкою, щоб виключити невидимі символи, переклад рядка та нестандартні лапки.
  3. Замінюйте спеціальні символи, якщо це можливо (наприклад, “→”, '→').
  4. Якщо потрібно використовувати кирилиці, враховуйте обмеження в 70 символів в одному SMS.

Розробникам рекомендується перевіряти повідомлення перед відправкою, щоб оптимізувати їх довжину та уникнути непотрібного збільшення кількості сегментів SMS.

Додаткові ресурси

Якщо у вас є запитання щодо кодування SMS, зверніться до технічної підтримки.