zoukankan      html  css  js  c++  java
  • PHP处理字符中的emoji表情

    目录

    utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。

    判断字符串中是否含有 emoji 表情

    三个 PHP 内置函数:

    • mb_strlen
    mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )
    
    
    // 返回具有 encoding 编码的字符串 str 包含的字符数。 多字节的字符被计为 1。
    // 如果给定的 encoding 无效则返回 FALSE。
    
    • mb_substr
    string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )
    
    // 根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1。
    // mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。
    
    • strlen
    int strlen ( string $string )
    
    // 返回给定的字符串 string 的长度。
    

    函数如下:

    function haveEmojiChar($str)
    {
        $mbLen = mb_strlen($str);
        
        $strArr = [];
        for ($i = 0; $i < $mbLen; $i++) {
            $strArr[] = mb_substr($str, $i, 1, 'utf-8');
            if (strlen($strArr[$i]) >= 4) {
                return true;
            }
        }
        
        return false;
    }
    

    移除字符串中的 emoji 表情

    函数如下:

    function removeEmojiChar($str)
    {
        $mbLen = mb_strlen($str);
        
        $strArr = [];
        for ($i = 0; $i < $mbLen; $i++) {
            $mbSubstr = mb_substr($str, $i, 1, 'utf-8');
            if (strlen($mbSubstr) >= 4) {
                continue;
            }
            $strArr[] = $mbSubstr;
        }
        
        return implode('', $strArr);
    }
    

    含有 emoji 表情的字符串在 MySQL 中的储存

    1. MySQL 中使用 utf8mb4 字符集。
    2. PHP 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。
    3. 直接移除字符串中的 emoji 表情(该方法简单粗暴)
  • 相关阅读:
    手写堆排序和归并排序
    海量数据处理
    HDU 1532 --&&-- POJ1273 dinic 算法
    POJ 3159 最短路 SPFA
    POJ 1459 网络流 EK算法
    8.14比赛j题 http://acm.hust.edu.cn/vjudge/contest/view.action?cid=87813#overview
    单链表---邻接表
    poj 1273 ---&&--- hdu 1532 最大流模板
    HDU 2603 二分匹配
    UVA 796 连通图求桥
  • 原文地址:https://www.cnblogs.com/lxwphp/p/15452835.html
Copyright © 2011-2022 走看看