zoukankan      html  css  js  c++  java
  • 又一次Linq查询优化

    项目是老项目的维护,已经三年的东西了,虽然这期间维护的时候尝试过修改查询方式以提高效率,但是领导说怕出问题,所以一直搁置了,这次,领导打算全部进行优化,做一次大的调整,我就顺便记录一下之前尝试的优化方式与这一次优化的总结。

    2009年刚出现LINQ TO SQL的时候,我们这个采购的项目就采用了这个东西,当时感觉,这个东西太好用了,而且也因为之前一直做JAVA,算是.Net的初学者,所以感觉微软的东西很容易上手,好方便啊。所以边学边就写了那个项目,做完后一直用着,有过几次修改,但没大大变动,直到后来服务器升级,我又看了一次,发现查询的时候是在是慢的可以,一个结果只有1000+的数据,查询到显示竟然用了15秒以上,这真的是难以忍受。

    此时对LINQ TO SQL也有了一定的了解,也知道了一些方法如何优化,但是,受众们没提出我们也懒的修改,也怕修改出问题,就放着不动,现在他们也说太慢了,我们也觉得,是时候修改一下了,毕竟那套东西实在是难看之极,不是说界面,而是后台实现的代码,这次先拿一个页面开刀。

    这个页面是采购单独页面,关联了一个项目表和一个价格表,查询的时候用到了项目表用来显示项目名称,当年用了这样的查询方式:

     1 var matches = from t in db.tRequestInfo
    2 where
    3 (pmbool ? t.tProjectInfo.PMUserID == pmid : true) &&
    4 (ProjectNameText.Text != "" && ProjectNameText.Text != null ? t.tProjectInfo.ProjectName.Contains(ProjectNameText.Text) : true) &&
    5 (RequestNoText.Text != "" && RequestNoText.Text != null ? t.RequestNo.Contains(RequestNoText.Text) : true) &&
    6 (FillDateChk.Checked ? (Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateStart.Text.Trim())) >= 0 && Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateEnd.Text.Trim())) <= 0) : true) &&
    7 (CheckStatChk.Checked ? t.State == false : true)
    8 group t by new
    9 {
    10 t.RequestNo
    11 }
    12 into p
    13 select new
    14 {
    15 OrderID = p.First().ID,
    16 RequestNo = p.Key.RequestNo,
    17 Url = HttpUtility.UrlEncode(p.Key.RequestNo),
    18 ProjectName = p.First().tProjectInfo.ProjectName,
    19 FillDate = p.First().FillDate,
    20 State = p.First().State ? "<font color=grey>未生成价格确认单</font>" : "<font color=green>已生成价格确认单</font>"
    21 };
    22 if (matches.Count() > 0)
    23 {
    24 Msg.Text = "总共有【<font color=\"red\">" + matches.Count() + "</font>】条记录。";
    25 }
    26 else
    27 {
    28 Msg.Text = "未查询到任何数据,请确认查询条件是否正确。";
    29 }
    30 RequestData.DataSource = matches.OrderByDescending(t => t.OrderID);
    31 RequestData.DataBind();

    上面让我觉得最BT的是时间比较多方式,因为那个时候用了第三方的控件,而且当时的领导把数据库中日期字段设计成了nVarchar类型的,所以,我就找出了那么个比较大方式,当时就这样实现了查询功能。其实就连上面的语句都还是后来修改过了的。在绑定的时候使用OrderByDescending方式排序是因为在上上面LINQ语句中的排序会因为GroupBy的关系失效。

    上面的查询我保存成了一个方法ShowRequestList()来调用,protected void Page_Load(object sender, EventArgs e)中调用了此方法用来默认显示。前台使用的GridView显示的数据,因为是.Net3.5的项目,所以我想,大多数都是使用这样的方式吧。

    后来发现慢的要死,就找问题出在哪,后来了解到,是因为matches.Count()方法的调用,因为每调用一次,就到数据库中查询一次,所以上面的语句,调用了两次的Count方法,下面还排序然后绑定了一次,所以,查询了三次。

    这样的话肯定会影响速度啊。领导前天告诉我们,使用微软的性能测试工具发现慢的问题还出现在调用DataBind方法的时候,我查了一下,因为调用DataBind方法其实后是将结果集使用IEnumeable方式循环,调用MoveNext来绑定到前台的GridView。没调用一次MoveNext也会进行一次查询。但是这个不好控制。所以,经过这样的查询方式,慢是必须的了。

    那么我进行了第一次的优化,众所周知,SQL中Group BY语句的效率是非常低的,LINQ中也一样,所以能不用尽量不要用,那么我就不用;我想到了去重,虽然字段很多,但是我只用到了RequestNo、ProjectName、FillDate、和State这几个字段,OrderID是用来排序的,前台的数据显示并没有用到,所以去掉OrderID,只剩下这四个字段,那么我就是用去重功能,经过验证,确实可行:

     1 using (PMSDBDataContext db = new PMSDBDataContext())
    2 {
    3 var matches = (from t in db.tRequestInfo
    4 where
    5 (pmbool ? t.tProjectInfo.PMUserID == pmid : true) &&
    6 (ProjectNameText.Text != "" && ProjectNameText.Text != null ? t.tProjectInfo.ProjectName.Contains(ProjectNameText.Text) : true) &&
    7 (RequestNoText.Text != "" && RequestNoText.Text != null ? t.RequestNo.Contains(RequestNoText.Text) : true) &&
    8 (FillDateChk.Checked ? (Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateStart.Text.Trim())) >= 0 && Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateEnd.Text.Trim())) <= 0) : true) &&
    9 (CheckStatChk.Checked ? t.State == false : true)
    10 select new
    11 {
    12 RequestNo = t.RequestNo,
    13 Url = HttpUtility.UrlEncode(t.RequestNo),
    14 ProjectName = t.tProjectInfo.ProjectName,
    15 FillDate = t.FillDate,
    16 State = t.State ? "<font color=grey>未生成价格确认单</font>" : "<font color=green>已生成价格确认单</font>"
    17 }).Distinct();
    18 int? count = matches.Count();
    19 if (count.HasValue)
    20 {
    21 Msg.Text = "总共有【<font color=\"red\">" + count.Value + "</font>】条记录。";
    22 RequestData.DataSource = matches;
    23 RequestData.DataBind();
    24 }
    25 else
    26 {
    27 Msg.Text = "未查询到任何数据,请确认查询条件是否正确。";
    28 }
    29 }

    将Count方法的值使用一个变量保存,避免再次调用,速度快了很多,但是我想,应该还可以继续优化掉一些。我有想到DataBind会影响到性能,因为我使用的是GridView自带的分页,所以有一个事件,要写成如下形式:

    1     protected void RequestData_PageIndexChanging(object sender, GridViewPageEventArgs e)
    2 {
    3 RequestData.PageIndex = e.NewPageIndex;
    4 RequestData.DataBind();
    5 }

    这里面还做了一次绑定,因为如果不写,那么前台点分页要点两次才会分页,有说把Page_Load方法中的ShowRequtstList放到Pre_Render中好像是这么写的,但我觉得应该不是这样的。于是又各种查资料,无果,很郁闷,因为都说是使用这样的方法:将新页面给空间,然后重新绑定,更有甚者会在这重新调用一次ShowRequestList方法来进行绑定,本来效率就慢,在增加一套查询,难怪会慢死。所以我打算去掉RequestData.DataBind()。于是我就去掉了,不可否认的是,分页的确掉了,但是也要点两次,无意中我想到,当时为了页面不刷新,我使用过.Net自带的Ajax来进行局部刷新,可是后来我发现GridView自带无刷新分页。我就想如果使用自带的无刷新分页会不会好些?于是咱就来尝试吧,到aspx页面将GridView的EnableSortingAndPagingCallbacks属性设置为True。果然,问题解决了,这是一个偶然,将EnableSortingAndPagingCallbacks设置为True就能解决GridView点两次分页的问题。这样,分页方法中就不需要DataBind了:

    1     protected void RequestData_PageIndexChanging(object sender, GridViewPageEventArgs e)
    2 {
    3 RequestData.PageIndex = e.NewPageIndex;
    4 }

    性能稍微又提升了一些。还能进行什么样的提升呢。我想到了搜索按钮,搜索按钮的Click时间中也调用了一次ShowRequestList方法,这样会不会造成,页面刷新调用的一次ShowRequestList方法,Click中也调用了ShowRequestList,等于调用了两次,那么就吧Click中的ShowRequestList删掉,什么都不写,一试,嗯,同样可以查询,一点都不影响。

    但是还是觉得别扭,因为这句:

    (FillDateChk.Checked ? (Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateStart.Text.Trim())) >= 0 && Convert.ToDateTime(t.FillDate.Trim()).CompareTo(Convert.ToDateTime(FillDateEnd.Text.Trim())) <= 0) : true) &&

    这个是我最纠结的。不过也解决了,改成了这样:

    (Convert.ToDateTime(t.FillDate) >= FillDateStart.Value) && (Convert.ToDateTime(t.FillDate) <= FillDateEnd.Value)

    只是按照时间搜索的话很少,而且页面上FillDateChk而True的时候才使用时间查询,但是写在LINQ语句中,肯定是会被转换成SQL语句的。使用db.GetCommand(matches).CommandText查看生成的SQL语句就会发现,这个GetCommand是我昨天刚学来的。显示LINQ转换的SQL语句。

    那么我想能不能动态的拼接SQL语句,找了很多这样的内容。但是都说用到了反射,性能会下降,能不用尽量不用。可是微软不会有了LINQ连这样动态的创建LINQ都不支持吧,性能还要下降。于是去翻CSDN和MSDN,不错,终于让我在一个角落里找到了一个方式。LINQTOSQL是延迟加载的。所以LINQ是可以拼接的,于是就改成了这样的写法:

    using (PMSDBDataContext db = new PMSDBDataContext())
    {
    var query = from t in db.tRequestInfo select t;
    do
    {
    //判断是否是项目经理
    if (pmbool)
    {
    query = query.Where(t => t.tProjectInfo.PMUserID == pmid);
    }
    //判断是否要通过项目名称查询
    if (!string.IsNullOrEmpty(ProjectNameText.Text))
    {
    query = query.Where(t => t.tProjectInfo.ProjectName.Contains(ProjectNameText.Text));
    }
    //判断是否要通过单号查询
    if (!string.IsNullOrEmpty(RequestNoText.Text))
    {
    query = query.Where(t => t.RequestNo.Contains(RequestNoText.Text));
    }
    //判断是否勾选已生成价格确认单的采购单
    if (CheckStatChk.Checked)
    {
    query = query.Where(t => t.State == false);
    }
    //判断是否要通过日期查询
    if (FillDateChk.Checked)
    {
    query = query.Where(t => (Convert.ToDateTime(t.FillDate) >= FillDateStart.Value) && (Convert.ToDateTime(t.FillDate) <= FillDateEnd.Value));
    }
    } while (false);
    //查询并生成新的匿名方法并去重并排序
    var matches = query.Select(t => new
    {
    RequestNo = t.RequestNo,
    Url = HttpUtility.UrlEncode(t.RequestNo),
    ProjectName = t.tProjectInfo.ProjectName,
    FillDate = t.FillDate,
    State = t.State ? "<font color=grey>未生成价格确认单</font>" : "<font color=green>已生成价格确认单</font>"
    }).Distinct().
    OrderByDescending(t => Convert.ToDateTime(t.FillDate));
    //并判断结果集中是否有数据
    int? count = matches.Count();
    if (count.HasValue)
    {
    Msg.Text = "总共有【<font color=\"red\">" + count.Value + "</font>】条记录。";
    RequestData.DataSource = matches;
    RequestData.DataBind();
    }
    else
    {
    Msg.Text = "未查询到任何数据,请确认查询条件是否正确。";
    }
    }

    太好了!速度又提升了,很兴奋。可是这个时候还是没解决MoveNext的时候一直在查询的问题,我知道其实延迟加载的技术更好,但是我觉得这个地方并不需要,现在需要的是速度!越快越好。所以,手动的去掉延迟加载,很容易,只加一个地方:

     1 //查询并生成新的匿名方法并去重并排序
    2 var matches = query.Select(t => new
    3 {
    4 RequestNo = t.RequestNo,
    5 Url = HttpUtility.UrlEncode(t.RequestNo),
    6 ProjectName = t.tProjectInfo.ProjectName,
    7 FillDate = t.FillDate,
    8 State = t.State ? "<font color=grey>未生成价格确认单</font>" : "<font color=green>已生成价格确认单</font>"
    9 }).Distinct().
    10 OrderByDescending(t => Convert.ToDateTime(t.FillDate)).ToArray();//在此处ToList()会提升很大的查询速度,是否有其他影响未知,也是取消了延迟加载

    在这个地方ToArray就已经将结果集查出来了,所以MoveNext的时候就不用一直查询了,速度也就上去了。我也尝试了ToList,但是使用性能测试工具得出的结果是ToArray会更快,这个我就不清楚为什么了,如果哪位知道,请赐教,谢谢。

     20111216,今天又做了一下小的调整,这两天回复的不少,提了很多方法,很感谢你们,只是有时候好的方法会因为项目上的限制无法发挥,就我上面这样的修改,领导也认为修改太大,但是今天我又稍微的修了了一下,将LINQTOSQL的查询时间控制在100毫秒以内。我的机器小于70,很稳定的速度了,原来写的查询慢的原因,一个是因为使用了GroupBy,还有今天也发现Distinct也慢,即使是使用存储过程的方式。这次就将代码调整成为这样:

     1 using (PMSDBDataContext db = new PMSDBDataContext())
    2 {
    3 var query = db.tRequestInfo.Select(t => new { t.RequestNo, Url = HttpUtility.UrlEncode(t.RequestNo), PMUserID = t.tProjectInfo.PMUserID, ProjectName = t.tProjectInfo.ProjectName, t.State, GenerateState = t.State ? "<font color=grey>未生成价格确认单</font>" : "<font color=green>已生成价格确认单</font>", t.FillDate });
    4 do
    5 {
    6 //判断是否是项目经理
    7 if (pmbool)
    8 {
    9 query = query.Where(t => t.PMUserID == pmid);
    10 }
    11 //判断是否要通过项目名称查询
    12 if (!string.IsNullOrEmpty(ProjectNameText.Text))
    13 {
    14 query = query.Where(t => t.ProjectName.Contains(ProjectNameText.Text));
    15 }
    16 //判断是否要通过单号查询
    17 if (!string.IsNullOrEmpty(RequestNoText.Text))
    18 {
    19 query = query.Where(t => t.RequestNo.Contains(RequestNoText.Text));
    20 }
    21 //判断是否勾选已生成价格确认单的采购单
    22 if (CheckStatChk.Checked)
    23 {
    24 query = query.Where(t => t.State == false);
    25 }
    26 //判断是否要通过日期查询
    27 if (FillDateChk.Checked)
    28 {
    29 query = query.Where(t => (Convert.ToDateTime(t.FillDate) >= FillDateStart.Value) && (Convert.ToDateTime(t.FillDate) <= FillDateEnd.Value));
    30 }
    31 } while (false);
    32 var matches = query.ToList().Distinct().OrderByDescending(t => Convert.ToDateTime(t.FillDate)).ToArray();
    33 int? count = matches.Count();
    34 if (count.HasValue){...}
    35 }

    主要是第32行当地方,先进行ToArray在进行Distinct和OrderByDescending,由于会出现“数据源不支持服务端的数据分页”所以在后面还要加一个ToArray。


    这个就这样了,要说方式好,按照下面回复的那些前辈来说,并不好,但是,对于那些只使用LINQTOSQL方式的人来说,能给你们一点借鉴的东西,就行了;

    我想,虽然不是好的方案,但是还是对人们有点帮助的吧。

    更多内容请访问:http://luacloud.com/2011/another-linq-query-optimization.html



  • 相关阅读:
    windows服务的默认启动类型和登录帐户
    oracle通过sql随机取表中的10条记录
    oracle如何四舍五入?
    Sql Server数据库自增长字段标识列的插入或更新修改操作办法
    将一个表中的数据导入到另一张表中
    设计模式已经陨落了?
    LINQ架构简单描述
    Asp.Net 验证控件
    .Net 三层架构开发初步
    C++编程思想
  • 原文地址:https://www.cnblogs.com/luacloud/p/2288854.html
Copyright © 2011-2022 走看看