zoukankan      html  css  js  c++  java
  • iOS中使用正则表达式去掉HTML中的标签元素获得纯文本的方法

    content是根据网址获得的网页源码字符串

    - (NSString *)changeToString:(NSString *)content
    {
        NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|
    "
                                                                                        options:0
                                                                                          error:nil];
        
        content = [regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];         //  替换所有html和换行匹配元素为"-"
        
        regularExpretion = [NSRegularExpression regularExpressionWithPattern:@"-{1,}" options:0 error:nil] ;
        content = [regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];          //  把多个"-"匹配为一个"-"
        
        //  根据"-"分割到数组
        NSArray *arr=[NSArray array];
        content = [NSString stringWithString:content];
        arr =  [content componentsSeparatedByString:@"-"];
        NSMutableArray *marr=[NSMutableArray arrayWithArray:arr];
        [marr removeObject:@""];
        NSMutableString *string = [[NSMutableString alloc] init];
        for (int i = 0; i < arr.count; i++) {
            [string appendString:[NSString stringWithFormat:@"%@",arr[i]]];
        }
        return  string;
    }
    
  • 相关阅读:
    iOS 关于使用xib创建cell的两种初始化方式
    KVO的初级使用
    通知的初级使用
    C语言的变量 常量
    C语言的编译 链接
    1 hello word
    java 中 == 与 equals引出的字符串比较
    02PSP0级及登陆界面开发
    00软工课程引言
    06动手动脑
  • 原文地址:https://www.cnblogs.com/iyou/p/4858655.html
Copyright © 2011-2022 走看看