Кодування символів GSM-7 – це стандарт 7-бітного кодування, який використовується в мережах мобільного зв’язку GSM для передавання текстових SMS-повідомлень. Воно охоплює базовий набір латинських символів, цифр, спеціальних знаків і обмежену кількість додаткових символів через механізм розширення (escape-символ). Завдяки використанню 7 біт на символ GSM-7 дозволяє вмістити до 160 символів в одному SMS-повідомленні, що робить його ефективним з точки зору використання мережевих ресурсів.
Як кодування впливає на довжину та вартість SMS
- У стандартному GSM-7 одне SMS може містити до 160 символів без розбиття.
- Якщо повідомлення перевищує цей ліміт, воно ділиться на кілька частин (Concatenated Messages), які автоматично об’єднуються на стороні отримувача в одне повідомлення.
- При об’єднанні частин частина символів (службова інформація) «з’їдає» довжину, тому кожен наступний сегмент містить до 153 символів.
- Важливо враховувати, що GSM-7 підтримує обмежений набір символів. Деякі спеціальні знаки можуть займати 2 символи, що скорочує загальну довжину тексту.
- Цей тип кодування є найбільш вигідним, оскільки дозволяє передати більше тексту в межах одного SMS.
Особливості та обмеження UCS-2 (16-бітне кодування)
- Якщо текст містить символи поза GSM-7 (наприклад, емодзі або нелатинські алфавіти), використовується кодування UCS-2.
- У цьому випадку максимальна довжина одного SMS зменшується до 70 символів.
- При розбитті на кілька повідомлень кожен сегмент після першого обмежується 67 символами.
- Деякі символи (особливо емодзі) можуть займати більше одного знака, що ще більше зменшує фактичну довжину повідомлення.
- Використання UCS-2 зазвичай підвищує вартість розсилки, оскільки для передачі того ж тексту потрібно більше SMS-сегментів.