Вход Регистрация
ruen

Многобайтовые кодировки, зачем нужны функции с префиксом mb в PHP

php_mb

Часто при разработке веб-приложения или сайта бывает необходимость работы с текстовыми ресурсами. Как правило, текст имеет свою кодировку, поэтому важно применять соответствующие функции. Сегодня наиболее популярная кодировка – UTF8, это многобайтовая кодировка.

Что значит многобайтовая кодировка? Это означает, что на один символ может выделяться больше чем один байт. Ведь действительно, все символы представлены байтами, чтобы закодировать символ потребуется некоторое их количество и одного может и не хватить. Особенно это касается необычных символов и букв каких-либо языков. Поэтому многобайтовые кодировки нужны, их поддержка конечно же есть в PHP.

Есть функции, которые способны самостоятельно определять кодировку текста. Также в них можно самому указать нужную кодировку при необходимости. Существует часть функций, которые начинаются с префикса mb_. Они специально предназначены для работы с текстом, mb значит многобайтовость.

Посмотрим, какие есть основные функции mb в PHP, ниже приводятся только самые используемые:

  • mb_convert_case - производит смену регистра символов в строке,
  • mb_convert_encoding - преобразует кодировку символов,
  • mb_detect_encoding - определение кодировки символов,
  • mb_internal_encoding – установка или получение внутренней кодировки скрипта,
  • mb_ord - получает кодовую точку символа,
  • mb_split - разделение строк в многобайтных кодировках, используя регулярное выражение,
  • mb_strcut - получение части строки,
  • mb_stripos - регистронезависимый поиск позиции первого вхождения одной строки в другую,
  • mb_strlen - получает длину строки,
  • mb_strpos - поиск позиции первого вхождения одной строки в другую,
  • mb_strripos - поиск последнего вхождения одной строки в другую, нечувствительный к регистру,
  • mb_strrpos - поиск позиции последнего вхождения одной строки в другую,
  • mb_strstr - находит первое вхождение подстроки в строке,
  • mb_strtolower - приведение строки к нижнему регистру,
  • mb_strtoupper - приведение строки к верхнему регистру,
  • mb_substr - возвращает часть строки.

Таким образом, для работы с текстом лучше всего использовать многобайтовые кодировки. Они позволяют правильно осуществлять операции с символами.

Комментарии (0)
Для комментирования войдите или зарегистрируйтесь.

Последние статьи

Популярные разделы

Eqsash (Инструменты)

Приложение для Android - VK LAST USER ID, отучитель от зависимости и т.д.:
Доступно в Google Play

Amessage (Общение)

Вход в веб-версию
Приложение для Android:
Доступно в Google Play

Поделиться

Подписаться

YouTube

Книги

IT-заметки - Простым языком о самом нужном (HTML, CSS, JavaScript, PHP, базы данных, Drupal, Битрикс, SEO, домены, безопасность и другое), PDF, 500 стр.