zoukankan      html  css  js  c++  java
  • 一个操作EXCEL的C#类ExcelUtils

    近期在公司里一直从事服务类的工作,涉及到非常多excel的处理。部分工作内容是每天反复的,仅仅是每天的数据不同而已。我遇到的一个问题是客户每天发送的几种数据有些excel中的字段顺序是一致的,有些是不一致的,而对数据汇总就要一列一列的去调整,剪切,复制。粘贴,非常麻烦。

    还有类似导入、导出数据、类似的问题。

    熟悉EXCEL的人肯定知道,事实上EXCEL中为我们提供了非常多经常使用的功能,比方筛选、排序、透视表统计等。仅仅是须要手动去操作。实际这些经常使用操作全然能够用程序去替代,解放我们的双手。须要注意的是。写这样的工具要注意一些数据中的细节,或者在程序处理前,我们定义一些约定俗成的规则, 比方文件名称,比方excel表中确保每一个页都存在表头等,之后再用我们的程序取代excel去自己主动处理,这样就一键搞定。

     

    想到写这样的工具,我会想到考虑用C#、python之类的语言,简单粗暴。方便快捷,相比c/c++开发快的多。因为笔者对python GUI的部分不是非常了解。并且假设用python,每次在命令行运行,想想也非常麻烦。于是决定採用.net framework中提供对office操作的接口。採用C#语言来实现。

    用C#操作EXCEL,一种方法是将EXCEL文件作为数据源,像数据库一样的读写,能够採用odbc的方式,比如:

            #region 将Excel文件路径和页名称转换成DataTable
            /// <param name="str_path">excel文件路径</param>
            /// <param name="str_sheet">页名称</param>
            /// <returns>返回一个DataTable对象</returns>
            public static System.Data.DataTable ExcelToDT(string str_path, string str_sheet)
            {
                string str_conn = "Provider=Microsoft.ACE.OLEDB.12.0;" +
                //string str_conn = "Provider=Microsoft.Jet.OLEDB.4.0;" +
                                     "Data Source=" + str_path + ";" +
                                     "Extended Properties=Excel 8.0;";
                OleDbConnection ole_conn = new OleDbConnection(str_conn);
                ole_conn.Open();
                string str_excel = "select * from [" + str_sheet + "$]";
                OleDbDataAdapter ole_cmd = new OleDbDataAdapter(str_excel, str_conn);
                DataSet ds = new DataSet();
                ole_cmd.Fill(ds);
                return ds.Tables[0];
            }
            #endregion


     

    还有一种用Visual Studio Tools for Office API Reference ,它是执行使用 Microsoft Visual Studio生成的基于office的解决方式所必需的api。

    这里不会解说关于该api怎样使用。我将他封装成了一个类。假设你急需处理EXCEL而没有时间去了解Office API,那么能够使用这个封装好的类,相信使用起来更方便,因为时间仓促,也仅仅是实现了主要的功能。只是对于一般的处理已经足够。

    了解之前:

    确保你已经引用了Microsoft.Excel 这个com


    首先你要知道:

    1.一个ExcelUtils对象相应一个excel中的一个页,也就是说我们通常仅仅关注一个页中的二维数据,就像数据库中的一个表,或者假设你熟悉Ado.net,能够把它想象成一个DataTable,相信以后不断完好。它会变成一个DataSet,只是时间仓促,我也临时封装到这里,实现功能先~~~

    2.EXCEL中的行号和列号都是从1開始的,不是0!并且假设excel数据中有表头。那么数据部分的起始位置为2,,1为表头。


    用法,很easy:


    1.打开数据

    ExcelUtils exUtil = new ExcelUtils();
    exUtil.Open("xxxx.xlsx", "Sheet1");

    使用简单,假设你熟悉Ado,net 相信你对conn.Open()一定不会陌生,是的,我们通过例如以下代码,打开某个Excel文件的某个页

    这里我们打开"xxxx.xlsx"这个excel文件里的"Sheet1"这个页,自此exUtil就相应这个页中的二维表


    2.读写数据

    这里ExcelUtils类中提供了一些主要的excel操作方法。

     

    SetValue方法,该方法设置某单元格的值

    /// <param name="row">行号</param>
    /// <param name="col">列号</param>
    /// <param name="str_value">待写入的值</param>
    public void SetValue(int row, int col, string str_value);


    GetValue方法。与SetValue方法相相应。获取某单元格的值

    /// <param name="row">行号</param>
    /// <param name="col">列号</param>
    /// <returns>该单元格的string值</returns>
    public string GetValue(int row, int col);


    GetColNoByName方法,该方法通过字段名返回该字段所在的列号,以方便通过列号对数据进行读写

    /// <param name="colName">要查找的列名</param>
    /// <returns>找到返回序号,找不到返回-1</returns>
    public int GetColNoByName(string colName);
    



    GetCurSheetUsedRangeRowsCount方法,好吧,名字有点长~,有待该进。。。

    该方法用户获取当前页中已用的最大行号

    /// <returns>返回已用的最大行号</returns>
    public int GetCurSheetUsedRangeRowsCount();

    有时我们须要知道数据在当前页中最末尾在哪一行,然后接下来附加数据在最大行号的下一行開始写数据。例如以下图中,调用GetCurSheetUsedRangeRowsCount()将返回4。个人觉得这个比較经常使用.


     

     



    BoxToBoxWrite方法。非常好理解,拷贝一个单元格的值到还有一个单元格。这两个单元格能够在不同的excel文件里。

    /// <param name="getUtil">获取数据的ExcelUtils对象</param>
    /// <param name="g_row">获取数据的ExcelUtils对象的某单元格行号</param>
    /// <param name="g_col">获取数据的ExcelUtils对象的某单元格列号</param>
    /// <param name="setUtil">待写入数据的ExcelUtils对象</param>
    /// <param name="s_row">待写入数据的ExcelUtils对象的某单元格行号</param>
    /// <param name="s_col">待写入数据的ExcelUtils对象的某单元格列号</param>
    public static void BoxToBoxWrite(ExcelUtils getUtil, int g_row, int g_col,                                 
                                     ExcelUtils setUtil, int s_row, int s_col);



    ColToColWrite方法,将某excel中的某一字段从o_row_start到o_row_end复制到还有一个excel某字段,而且从还有一个excel的s_row_start行開始写入

    注意:假设你想从excel的已用最大行下一行開始写入,那么s_row_start通常为:  先调用GetCurSheetUsedRangeRowsCount()获取已用最大行号后 +1,表示从已用最大行下一行開始写入

    /// <param name="origUtil">源ExcelUtils对象</param>       
    /// <param name="origColName">源ExcelUtils对象中要操作的列名</param>     
    /// <param name="o_row_start">复制数据的起始行号</param>      
    /// <param name="o_row_end">复制数据的结束行号</param>     
    /// <param name="srcUtil">待写入的ExcelUtil对象</param>     
    /// <param name="srcColName">待写入的列名</param>       
    /// <param name="s_row_start">从s_row_start行開始写入</param>      
    public static void ColToColWrite(ExcelUtils origUtil, string origColName, int o_row_start, int o_row_end,    
                                     ExcelUtils srcUtil, string srcColName, int s_row_start) 


    CloseAndSave方法

    最后。相同类似Ado.net,Open之后不要忘记关闭。这里ExcelUtils对象相应一个Excel中的页,调用CloseAndSave(),之前的写入操作才会保存。

    public void CloseAndSave();

    ExcelUtils完整代码

    using System;
    using System.Collections.Generic;
    using System.Linq;
    using System.Text;
    using Microsoft.Office.Interop.Excel;
    using System.Reflection;
    using System.IO;
    namespace AutoReportDeal
    {    
        class ExcelUtils
        {    
            public Microsoft.Office.Interop.Excel.Application xlsApp = null; 
            public Microsoft.Office.Interop.Excel.Workbook workbook = null;    
            public Microsoft.Office.Interop.Excel.Worksheet worksheet = null;    
            public string str_this_path = null; 
            public string str_this_sheet = null;  
            
            #region 打开某EXCEL文件的某个页    
            /// <param name="str_path">EXCEL文件路径</param> 
            /// <param name="str_sheet">要操作的页</param>        
            public void Open(string str_path, string str_sheet)    
            {
                str_this_path = str_path; 
                str_this_sheet = str_sheet; 
                //Excel Application 
                xlsApp = new Microsoft.Office.Interop.Excel.Application();           
                //Excel Workbook           
                workbook = xlsApp.Workbooks.Open(str_path, 0, true, 5,
                                                 System.Reflection.Missing.Value, 
                                                 System.Reflection.Missing.Value,   
                                                 false, System.Reflection.Missing.Value,
                                                 System.Reflection.Missing.Value, true,
                                                 false, System.Reflection.Missing.Value,   
                                                 false, false, false);  
                //Excel Worksheet        
                worksheet = (Worksheet)workbook.Worksheets[str_sheet];   
            } 
            #endregion 
            
            #region 将值写入某单元格  
            /// <param name="row">行号</param>  
            /// <param name="col">列号</param>  
            /// <param name="str_value">待写入的值</param>  
            public void SetValue(int row, int col, string str_value)      
            {
                if (row <= 0 || col <= 0 || str_value == null)                
                    throw new Exception("參数不合法");        
                
                worksheet.Cells[row, col] = str_value;       
            }
            #endregion
            
            #region 获取当前可用页中的已用的最大行号      
            /// <returns>返回已用的最大行号</returns>
            public int GetCurSheetUsedRangeRowsCount()      
            {          
                if (xlsApp == null)               
                    throw new Exception("ExcelUtils对象尚未Open()");    
                
                int used_rng_rows = worksheet.UsedRange.Rows.Count;         
                return used_rng_rows;     
            }
            #endregion
            
            #region 查找某字段名的列号(列号从1開始)      
            /// <param name="colName">要查找的列名</param>     
            /// <returns>找到返回序号,找不到返回-1</returns>    
            public int GetColNoByName(string colName)      
            {        
                int col_used = worksheet.UsedRange.Columns.Count;       
                for (int i = 1; i <= col_used; ++i)            
                {              
                    if (GetValue(1, i).ToString().Trim() == colName)          
                        return i;           
                }       
                return -1;      
            }       
            #endregion       
            
            #region 得到某一单元格的值        
            /// <param name="row">行号</param>      
            /// <param name="col">列号</param>       
            /// <returns>该单元格的string值</returns>   
            public string GetValue(int row, int col)   
            {       
                if (row <= 0 || col <= 0)            
                    throw new Exception("參数不合法");       
                
                Range myRange = null;           
                myRange = worksheet.get_Range(worksheet.Cells[row, col], worksheet.Cells[row, col]);      
                string str = myRange.Text.ToString();         
                return str;     
            }
            #endregion      
            
            #region 将某excel当前页的某单元格的值写入到还有一个excel当前页的某单元格  
            /// <param name="getUtil">获取数据的ExcelUtils对象</param>     
            /// <param name="g_row">获取数据的ExcelUtils对象的某单元格行号</param>    
            /// <param name="g_col">获取数据的ExcelUtils对象的某单元格列号</param>    
            /// <param name="setUtil">待写入数据的ExcelUtils对象</param>     
            /// <param name="s_row">待写入数据的ExcelUtils对象的某单元格行号</param>   
            /// <param name="s_col">待写入数据的ExcelUtils对象的某单元格列号</param>    
            public static void BoxToBoxWrite(ExcelUtils getUtil, int g_row, int g_col,              
                                             ExcelUtils setUtil, int s_row, int s_col)        
            {
                if (getUtil == null || setUtil == null)
                    throw new Exception("ExcelUtils对象尚未Open()");         
                
                if (g_row <= 0 || g_col <= 0 || s_row <= 0 || s_col <= 0)         
                    throw new Exception("參数不合法");           
                
                string str_to_write = getUtil.GetValue(g_row, g_col);     
                setUtil.SetValue(s_row, s_col, str_to_write);      
            }       
            #endregion   
            
            #region 将某excel页中某列从o_row_start到o_row_end的数据写入到还有一个Excel页中,并从s_row_start行位置開始写入      
            /// <param name="origUtil">源ExcelUtils对象</param>       
            /// <param name="origColName">源ExcelUtils对象中要操作的列名</param>     
            /// <param name="o_row_start">复制数据的起始行号</param>      
            /// <param name="o_row_end">复制数据的结束行号</param>     
            /// <param name="srcUtil">待写入的ExcelUtil对象</param>     
            /// <param name="srcColName">待写入的列名</param>       
            /// <param name="s_row_start">从s_row_start行開始写入</param>      
            public static void ColToColWrite(ExcelUtils origUtil, string origColName, int o_row_start, int o_row_end,    
                                            ExcelUtils srcUtil, string srcColName, int s_row_start)    
            {           
                if (origUtil.worksheet == null || srcUtil.worksheet == null)       
                    throw new Exception("ExcelUtils对象尚未Open()");          
                
                if (origColName == null || srcColName == null || o_row_start <= 0 ||         
                    o_row_end <= 0 || s_row_start <= 0 || o_row_start > o_row_end)               
                    throw new Exception("參数不合法");           
                
                int o_col_index = origUtil.GetColNoByName(origColName);            
                if (o_col_index < 0)               
                    throw new Exception("列名不存在");           
                
                int s_col_index = srcUtil.GetColNoByName(srcColName);         
                if (s_col_index < 0)             
                    throw new Exception("列名不存在");          
                
                for (int i = o_row_start, j = s_row_start; i <= o_row_end; ++i, ++j)        
                {              
                    BoxToBoxWrite(origUtil, i, o_col_index, srcUtil, j, s_col_index);         
                } 
            }
            #endregion
            
            #region 保存并关闭        
            public void CloseAndSave()    
            {          
                xlsApp.DisplayAlerts = false;     
                xlsApp.AlertBeforeOverwriting = false;     
                
                if (File.Exists(str_this_path))        
                {
                    File.Delete(str_this_path);       
                }
                
                xlsApp.ActiveWorkbook.SaveCopyAs(str_this_path);    
                xlsApp.Quit();         
                xlsApp = null;          
                workbook = null;           
                worksheet = null;          
                str_this_path = null;     
            }
            #endregion    
        }
    }      
    时间紧急。先到这里~~

  • 相关阅读:
    设计模式-装饰器模式
    自定义 RestTemplate 异常处理 (转)
    Jackson 高级应用
    Jackson 的 基本用法
    Jackson转换为Collection、Array
    Jackson中处理map中的null key 或者null value 及实体字段中的null value
    sed
    MySQL server has gone away 异常
    nl命令
    线程池
  • 原文地址:https://www.cnblogs.com/blfshiye/p/5172040.html
Copyright © 2011-2022 走看看