zoukankan      html  css  js  c++  java
  • SSIS中的字符提取组件

    想想看这样一个场景:我们有一个表中,有一个字段包含了大量的文字。我们想要找到在这些文字中那些词出现的频率高,并且到底有多高?

    那么该怎么办呢?当然,你有很多其他的方法去做。我们这里介绍的是使用SSIS的字符提取组件来完成这个任务。

    1. 准备数据源

    为了做这个演示,我们使用了范例数据库(Adventureworks)的ProductDescription这个表。这里有一个列是对产品的描述的。

    image 

    2. 设计SSIS数据流任务.它大概看起来像下面这样

    image

    关于字符查找这个组件的配置,大致如下

    image

    【这里可以指定多个列】

    image

    image

    3. 运行这个数据流任务,查看结果

    image

    我们看到,HL出现次数最多,为26次。这确实看起来很酷

    本文由作者:陈希章 于 2009/6/22 16:46:28 发布在:http://www.cnblogs.com/chenxizhang/
    本文版权归作者所有,可以转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
    更多博客文章,以及作者对于博客引用方面的完整声明以及合作方面的政策,请参考以下站点:陈希章的博客中心
  • 相关阅读:
    DRF分页器
    DRF版本控制
    crrm复习
    python面试题网络编程和数据库
    python基础面试题
    前端格式
    数据库基本命令
    数据库管理系统
    线程协程和进程
    IPC通信
  • 原文地址:https://www.cnblogs.com/chenxizhang/p/1508374.html
Copyright © 2011-2022 走看看