perl抓取文件内容 - 走看看

zoukankan html css js c++ java

perl抓取文件内容

本文用Web::Scraper抓取新浪中的文本

#!/usr/bin/perl -w
use strict;
use utf8;
use URI;
use Web::Scraper;
binmode( STDOUT, ':encoding(utf8)' );
my $url   = "http://news.sina.com.cn/c/2010-06-04/203520413927.shtml";
my $proce = scraper {
    process '.blkContainerSblk >h1',   "news[]" => "TEXT";
    process '.blkContainerSblkCon >p', "texts[]" => "TEXT";
};
my $res = $proce->scrape( URI->new($url) );
for my $result ( @{ $res->{news} } ) {
    print "$result\n";
}
for my $result ( @{ $res->{texts} } ) {
    print "$result\n";
}

查看全文

相关阅读:
短URL
Linux安装MySQL
Ubuntu中安装MySQL
安装交叉工具链arm-linux-gcc
Linux安装—IP设置
 Linux内核概述
 Bash变量
 Shell登陆
 Linux—查看远程Linux系统运行时间
 Linux—查看路由

原文地址：https://www.cnblogs.com/djcsch2001/p/2404041.html

Copyright © 2011-2022 走看看