Как обрезать текст php
Перейти к содержимому

Как обрезать текст php

  • автор:

Как обрезать строку PHP

Сегодня мы рассмотрим способы обрезать строку, если известна позиция символа до или после которого нужно обрезать строку или не не известна, рассмотрим популярные функции для этого на PHP.

Если известна позиция символа

Есть несколько способов обрезать строку до определенного символа, чаще всего используют функцию substr() или mb_substr() для многобайтовых наборов символов.

mb_substr()

echo mb_substr('Тестовая строка', 0, 8);

в результате мы получим часть строки — ‘Тестовая’.

Как вы уже догадались, функция 2 и 3 аргументом принимает начало и конец строки.

Если позиция символа не известна

Допустим, нам нужно обрезать динамическую строку, в которой неизвестна позиция подстроки которую нужно обрезать, например есть строка — ‘Тестовая строка которую нужно обрезать’, давайте обрежем в ней все что до подстроки ‘Нужно’.

mb_substr() + strpos()

$string = 'Тестовая строка которую нужно обрезать'; echo substr($string, strpos($string, 'нужно'));

в результате мы получим часть строки — ‘нужно обрезать’. Тут мы нашли позицию подстроки при помощи другой функции strpos() и обрезали все что идет до нее.

Обзор популярных функций

Помимо mb_substr() есть еще ряд схожих функций, при помощи которых мы можем обрезать строку, давайте их и рассмотрим.

mb_strimwidth()

Бывают случаи, когда нам нужно не просто обрезать строку, но еще и добавить какой то текст в конец обрезанной строки, в этом нам поможет mb_strimwidth()

echo mb_strimwidth('Тестовая строка которую нужно обрезать', 0, 26, '. ');

в результате мы получим часть строки с добавлением ‘. ‘ — ‘Тестовая строка которую. ‘.

explode()

Мы также можем строку преобразовать в массив по разделителю

$string = 'Тестовая строка которую нужно обрезать'; $substring = ' нужно обрезать'; echo explode($substring, $string)[0];

в результате мы получим часть строки — ‘Тестовая строка которую’.

Заключение

И так, сегодня мы научились обрезать строки по разделителю и по позиции символа, как оказалось сделать это не так уж трудно.

Как с помощью различных функций PHP обрезать строку?

В этой статье мы рассмотрим несколько различных способов в PHP обрезать строку на определенное количество слов и символов. Большая часть функций, описанных в этой статье, используется, чтобы продемонстрировать возможности PHP для работы со строками.

Во всех наших примерах мы будем использовать следующую строку, и будем исходить из того, что нам нужно уменьшить количество символов в строке со 187 до 120 символов ( для Twitter) .

Lorem ipsum velit inceptos posuere augue amet sagittis augue sapien gravida vestra nulla non hac ac luctus imperdiet pulvinar ligula hac elit molestie vestibulum fusce porttitor lacinia.

В нашем примере мы также используем вторую строку из 55 символов, чтобы вы могли проверить возвращаемый результат на более короткой строке.

Обновлено: 2021-02-09 11:26:30 Вадим Дворников автор материала

mb_strimwidth()

mb_strimwidth() возвращает в PHP обрезанную строку по длине и добавляет конечные символы, указанные в функции. Так как это одна из основных функций PHP , ее мы рассмотрим в первую очередь. Применяется она очень просто:

/* mb_strimwidth() http://php.net/manual/en/function.mb-strimwidth.php http://www.internoetics.com/2016/02/01/shorten-strings-whole-word-character-count-php/ */ echo mb_strimwidth($string, 0, 120, '. ');

Функция рассматривает свободное пространство как символ. Но это значит, что между последним усеченным символом и конечным символом многоточием будет размещаться пробел. Вы можете обрезать строку без конечного символа, а затем добавить его отдельно. Посмотрите на следующий пример:

rtrim(mb_strimwidth($string, 0, 117)) . '. ';

Приведенный выше код добавляет многоточие не зависимо от того, была ли PHP обрезана строка до символа или нет. Чтобы исправить это, мы будем рассчитывать длину строки, и только после этого добавлять многоточие, если исходная строка действительно должна обрезаться. Например:

function internoetics_mb_strimwidth($string, $start = 0, $width = 120, $trimmarker = '. ') < $len = strlen(trim($string)); $newstring = ( ($len >120) && ($len != 0) ) ? rtrim(mb_strimwidth($string, $start, $width - strlen($trimmarker))) . $trimmarker : $string; return $newstring; > /* Использование */ echo internoetics_mb_strimwidth($string, 0, 120, $trimmarker = '. ');

При отправке сообщений в Twitter и на другие ресурсы, где символы чувствительны к регистру, каждый символ имеет значение. и эта функция в ряде случаев сэкономит вам один пробел!

mb_substr()

Функция mb substr PHP » получает часть строки «. Она возвращает подстроку на основе количества символов. Позиция обрезки отсчитывается от начала строки. Позиция первого символа равна 0 . Позиция второго символа равна 1 . И так далее.

/* mb_substr() http://php.net/manual/en/function.mb-substr.php */ echo mb_substr($string, 0, 120);

Чтобы добавить многоточие ( или любой другой конечный символ ), мы можем изменить первую функцию, которую рассматривали. Мы обрезаем строку перед добавлением $trimmarker , чтобы гарантировать, что у нас не будет добавляться в PHP обрезанной строке с конца лишний пробел.

function internoetics_mb_substr($string, $start = 0, $length = 120, $trimmarker = '. ') < $len = strlen(trim($string)); $newstring = ( ($len >$length) && ($len != 0) ) ? rtrim(mb_substr($string, $start, $length - strlen($trimmarker))) . $trimmarker : $string; return $newstring; > /* Применение */ echo internoetics_mb_substr($string, 0, 120);

mb_substr(), substr() и mb_strcut()

mb_substr() , substr() и mb_strcut() — еще несколько функций, похожих на те, которые я описал выше. Они отличаются только тем, как обрабатываются многобайтовые наборы символов ( китайский язык и т.д. ).

Если вы выводите PHP обрезанную часть строки до ближайшего слова на основе количества символов ( но без конечного многоточия ), используйте следующий код:

echo substr($string, 0, strrpos(substr( $string, 0, 35), ' ')); Изменив функцию, чтобы теперь в конце добавлялись многоточие, мы получим следующее: /* Усеченный до ближайшего слова текст, основываясь на количестве символов - substr() http://php.net/manual/en/function.substr.php */ function internoetics_string_strrpos($string, $length = 137, $trimmarker = '. ') < $len = strlen(trim($string)); $newstring = ($len >$length) ? rtrim(substr($string, 0, strrpos(substr($string, 0, $length), ' '))) . $trimmarker : $string; return $newstring; > /* Использование */ echo internoetics_string_strrpos($string);

preg_match()

Вы редко найдете тех, кто предпочитает использовать регулярные выражения, когда есть так много отличных функций PHP . Тем не менее, вот функция, которая обрезает строку до определенного символа в PHP , исходя из заданного количества знаков от начала. В отличие от других функций, описанных выше, эта функция обрезает строку до целого слова.

/* preg-match() http://php.net/manual/en/function.preg-match.php */ function internoetics_preg_string($string, $length, $trimmarker = '. ') < $strlen = strlen($string); /* mb_substr добавляет принудительный разрыв в $length, если заданное количество символов не содержит окончания слова (пробела) */ $string = trim(mb_substr($string, 0, $strlen)); if ($strlen >$length) < preg_match('/^.b/su', $string, $match); $string = trim($match['0']) . $trimmarker; > else < $string = trim($string); >return $string; > /* Применение */ echo internoetics_preg_string($string, 100, $trimmarker = '. ');

Описание функции

Функция принимает три параметра: $string , $length и $trimmarker ( многоточие или другие символы, которые добавляются в конце строки ).

Строка 7

$strlen = strlen($string);

Первое, что мы делаем, это проверяем длину PHP обрезанной строки после символа. Если строка короче, чем $length , то мы возвращаем эту строку.

Строка 9

$string = trim(mb_substr($string, 0, $strlen));

Функция mb_substr() прерывает строку в $length , если это количество символов не содержит окончания слова ( пробела ). Если мы передали строку длиною 500 символов и эта строка не содержит пробелов, то будет возвращена вся строка ( так как функция preg_match не нашла окончания слова ). На данный момент мы обрезаем строку таким образом, и возвращаем ее полностью.

Строки 10, 11, и 12

Если длина нашей строки превышает максимальную длину, определенную в качестве параметра функции, мы выполняем регулярное выражение функции preg_match() , чтобы вернуть часть строки до символа с номером $length , который определяется как конец слова ( ‘/^.b/s’ ). Знак периода означает любой символ, кроме символа новой строки ( n ). Фигурная скобка определяет диапазон, который задает, сколько символов должен PHP обрезать в строке. Таким образом означает от 1 до символа $length . Наконец, b означает, что шаблон будет соответствовать окончанию слова. Мы можем производить поиск только слов целиком по шаблону, который мы предоставили. И в конце s задает поиск всех пробелов.

Так как мы не хотим, чтобы возвращаемая строка превышала длину $length , максимальное количество символов в функции preg_match должно быть равно максимальной длине минус длина $trimmarke.r . Мы должны учитывать это.

Затем мы возвращаем либо усеченную строку, либо исходную строку, если она меньше заданной длины усечения.

strrpos()

Функция strrpos() находит позицию последнего вхождения подстроки в строке. Она возвращает позицию, на которой располагается искомая подстрока относительно начала строки. Отметим также, что первая позиция в строке имеет номер 0 — а не 1 , поэтому мы учитываем это в функции, добавляя 1 к длине строки при применении функции strrpos() .

/* strrpos() http://php.net/manual/en/function.strrpos.php */ function interneotics_short_string($string, $length, $trimmarker = '. ') < $len = strlen($string); if ($len < $length) return $string; else; $string = substr($string, 0, $length + 1 - strlen($trimmarker)); $string = trim(substr($string, 0, strrpos($string, ' ') + 1 )) . $trimmarker; return $string; >/* Использование */ echo interneotics_short_string($string, $length = 120);

wordwrap()

Использование wordwrap() — это еще один способ, с помощью которого можно в PHP обрезать строку до пробела, хотя он не очень эффективен и не является лучшим выбором (если только обстоятельства не требуют этого). Wordwrap оборачивает строку в заданное число символов с использованием символа разрыва строки. Применив функцию PHP explode() , мы можем построить массив из каждой строки текста. Мы определяем, нужен ли $trimmarker ( конечное многоточие ), запросив, пусто ли второе значение массива. Если пусто, то строка не оборачивается.

/* wordwrap() http://php.net/manual/en/function.wordwrap.php */ function internoetics_truncate_wordwrap($string, $length, $trimmarker = '. ') < $lines = explode("n", wordwrap($string, $length - strlen($trimmarker), "n", true)); $line = $lines['0']; $result = ($lines['1'] != '') ? $line . $trimmarker : $line; return $result; >/* Использование */ echo internoetics_truncate_wordwrap($string, 120, $trimmarker = '. ');

Определение для параметра cut значения true означает, что строка всегда оборачивается до или на указанном символе.

str-split()

Функция str-split() может быть использована в приведенной выше функции для преобразования строки в массив. str-split () не разбивает строку до целого слова. С ее помощью PHP обрезает последний символ в строке ровно до 120 знаков.

/* str-split() http://php.net/manual/en/function.str-split.php */ function internoetics_truncate_split($string, $length, $trimmarker = '. ') < $lines = str_split($string, $length - strlen($trimmarker)); $line = rtrim($lines['0']); $result = ($lines['1'] != '') ? $line . $trimmarker : $line; return $result; >/* Использование */ echo internoetics_truncate_split($string, 120);

Усечение по заданному количеству слов

Ниже приведен пример PHP обрезки строки по количеству символов, пробелов или слов. Это не слишком отличается от того, что мы уже делали. Затем мы сводим скорректированный массив в строку символов, максимальное количество которых задается $limit . Мы добавляем $trimmarker (. ) , если наш $limit меньше, чем количество слов в массиве.

/* Возвращаем количество слов, независимо от длины строки */ $stringz = 'one two three four five six seven eight nine ten eleven twelve thirteen fourteen'; function internoetics_truncate_words($string, $limit = 10, $trimmarker = '. ') < $count = str_word_count($string, 0); $string = explode(' ', $string, $limit + 1); array_pop($string); $string = implode(' ', $string); return ($limit < $count) ? $string . $trimmarker : $string; >/* Использование */ echo internoetics_truncate_words($stringz);

strtok()

Совместно применив strtok() и wordwrap() мы можем создать короткую, но эффективную функцию, которая будет в PHP обрезать строку до нужной длины. Как показано ниже, она не будет учитывать при усечении $length +$trimmarker . Но это удобно, если вы не слишком заботитесь о длине возвращаемой строки.

/* strtok() http://php.net/manual/en/function.strtok.php */ function internoetics_strtok($string, $width = 120) < return strtok(wordwrap($string, $width, ". n"), "n"); >/* Usage */ echo internoetics_strtok($string);

Обрезка слов в WordPress

Для возврата обрезанного слова в WordPress используется wp_trim_words. Данная функция часто применяется в сочетании с wp_strip_all_tags для очистки текста до его обработки. Конечно, есть и другие функции, которые служат для той же цели.

Заключение

Мы могли бы написать еще сотни примеров PHP обрезки строк, но когда-то нужно остановиться. Функции, приведенные в этой статье, являются частью ядра PHP , и вы можете использовать их для усечения строк. Хотя чаще всего программисты стараются избегать регулярных выражений, если другого выхода нет, вы можете прибегнуть и к их помощи.

В ряде примеров мы вернули $trimmarker, представляющий собой многоточие. При необходимости вы можете вернуть HTML-объект Ellipsis, для этого используется код …. Но лично я предпочитаю многоточие.

Скачать примеры

Скачать примеры из этой статьи вы можете здесь .

Обрезка текста и строк в php

Пользоваться ей очень просто, вот несколько примеров:

Обрезать строку на определенное (n) количество символов:

Тут все просто, указываем с какого символа хотим обрезать строку, указываем какая длина строки нам нужна, получаем вполне ожидаемый результат.
Обрезать строку на определенное (n) количество символов с конца:

Данный пример интересен тем, что в параметр length мы передаем отрицательное значение, и в таком случае функция отсчитывает указанную величину с конца строки.

ПОЛЕЗНО Разбить строку по маске

Получить определенное (n) количество символов с конца строки

Здесь в параметр start мы передаем отрицательное значение, которое и позволяет нам сделать то, что нам нужно.

Обрезать строку до первого пробела

Тут мы в параметр length передаем результат выполнения функции strpos, которая вычисляет позицию первого пробела. Строку можно бить конечно же не только по пробелу, а по любому другому символу.

Обрезать строку до последнего пробела

Работает аналогично предыдущему примеру, но только в качестве параметра length передается результат отработки функции strrpos, которая находит последнее вхождение заданного символа, в нашем случае пробела.

Как обрезать текст строки средствами PHP?

Функция substr ( $string, $start, $length ) , где $string — это переменная с текстом, $start — это символ, с которого начинается отсчёт (за первый символ берётся 0), а $length — это количество символов выделенного текста.

$text = "Example and text"; 

$first = substr($text,0,6); // Показывает 6 символов начиная с 0-ого, самого первого
echo $first; // выведет 'Example'.

$second = substr($text,8,3); // Показывает 3 символа начиная с 8-ого
echo $second; // выведет 'and'

Если не указать параметр Количество символов (2 цифра), то функция выведет все оставшиеся символы

$text = "Example and text"; 

$third = substr($text,8); // Покажет ВСЕ символы начиная с 8-ого
echo $third; // выведет 'and text'

Обрезаем Русский текст с помощью функции mb_substr PHP

Функция mb_substr выполняет те же самые задачи, что и substr, но также способна обрабатывать многобайтные кодировки. Поэтому в случае с русским текстом Вам пригодится именно mb_substr. Работает так же

$text = "Пример текста"; 

$first = mb_substr($text,0,6,'UTF-8'); // Показывает 6 символов начиная с 0-ого, самого первого
// Внимание! Указывайте кодировку исходного текста! В данном случае utf-8
echo $first; //выведет 'Пример'

$second = mb_substr($text,7,6,'UTF-8'); // Показывает 6 символов начиная с 7-ого
echo $second; // выведет 'текста'

Обратите внимание на то, что в случае с кириллицей (русский текст) лучше указывать кодировку в конце функции. В примере использован самый популярный вариант — UTF-8

Обрезаем текст с конца

Если Вы хотите обрезать текст с конца, то для этого укажем отрицательное число для переменной, обозначающей с какого символа начинается вычленение текста

$text = "Sprite and Fanta"; 

$first = substr($text,-6,5); // Показывает 5 символов начиная с 6-ого с конца
echo $first; //выведет 'Fant'

После обрезки ещё и дописываем текст

После обрезки переменной с текстом дописываем в конец дополнительный текст

$example = "Text text text text"; 

$example = substr($example,0,9); // Показывает 9 символов начиная с 0-ого, самого первого
$example .= " more. ";
echo $example; //выведет 'Text text more. '

Можно наоборот, запись сделать в начале, а потом уже обрезанный текст

$text = "Uncle "; 

$example = "George and Michael";
$example = substr($example,0,6); // Показывает 6 символов начиная с 0-ого, самого первого
$text .= $example;
echo $text; //выведет 'Uncle George'

Обрезка текста до первого пробела

$text = 'Hello world!'; 
echo substr($text, 0, strpos($text, ' ' )); // Выведет 'Hello'

Готовая функция PHP обрезки текста по Словам PHP

function cut($string, $length) $string = mb_substr($string, 0, $length,'UTF-8'); // обрезаем и работаем со всеми кодировками и указываем исходную кодировку 
$position = mb_strrpos($string, ' ', 'UTF-8'); // определение позиции последнего пробела. Именно по нему и разделяем слова
$string = mb_substr($string, 0, $position, 'UTF-8'); // Обрезаем переменную по позиции
return $string;
>

$text = 'Северная война закончилась в 1721 году';
echo cut($text, 17); // выведет 'Северная война', без части слова 'закончилась'

Можно обрезать по словам через массив.

$text = 'Microsoft был основан Биллом Гейтсом ещё в далёком 1975 году.'; 

$array = explode(" ",$text); // перерабатываем строку в массив
$array = array_slice($array,0,5); // выбираем первые 5 слов-элементов
$newtext = implode(" ",$array); // массив снова перерабатываем в строку

echo $newtext;//Выведет 'Microsoft был основан Биллом Гейтсом'

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *