zoukankan      html  css  js  c++  java
  • 阿里巴巴为什么要禁止使用存储过程?

    作者:杨洋的围脖啊
    segmentfault.com/a/1190000011138993

    之所以有这个题目,我既不是故意吸引眼球,也不想在本文对存储过程进行教科书般论述。《阿里巴巴Java开发手册》是这样规定的:

    再结合我最近项目中遇到的存储过程问题,所以今天我打算来聊一聊这个问题。需要这份最新完整手册的去关注微信公众号Java技术栈在后台回复手册获取。

    这事儿要从去年在武汉出差时一位同事的发问说起,问题是这样的:

    我觉得存储过程挺好用的,你为什么不建议用呢?

    当时我好似胸有万言,但终究没用一个实在的例子回答同事,只是从结论上大侃一通,代码相对于SQL,复用、扩展、通用性都要更强。想必同事并不信服。

    现在想来,我最近正碰到的问题,算是一个可以回答同事的例子吧。

    最近项目中有个新需求,需要校验一个用户是否有Job,Certification,Disclosure这三个业务数据。

    翻看了代码发现,系统的用户个人页面的C#代码调用了三个存储过程,去抓取用户的Job,Certification,Disclosure数据。

    我的新需求,自然需要复用这三个存储过程,否则:

    若每一处都写一次抓取数据的业务逻辑代码,若业务逻辑发生变化,难以追查和维护所有读取Job,Certification,Disclosure的SQL。

    如果我在C#代码中调用这已有的三个存储过程,事情本该非常快就能结束。我也是这么做的。

    但code reviewer认为,我的需求中,并不需要Job,Certification,Disclosure这三个业务对象的数据。我只是需要给定用户是否有Job,Certification,Disclosure而已。

    所以我应将是否有无Job,Certification,Disclosure的判断逻辑写在数据库,最终通过网络从数据库传到web服务器的仅是true或false,节省网络流量,这样最好不过了。

    也对。除开网络性能,从接口设计的角度讲,接口的传入和返回值,都应是你本身需要的数据,不应带有大量不需要或者需要caller去预处理的数据。从接口语义表达就可知调用的目的,这样代码可读性也会有大大提高。

    那就动手改。但没想到的是问题来了。

    为了讲述问题,我简化代码,假设系统现有的存储过程如下:

    CREATE PROCEDURE [dbo].[GetJobs]
    (
       @PersonId int,
       @OrganizaitionId int
    )
    AS
    BEGIN
       SELECT JobId,JobName,JobType FROM Job WHERE PersonId = @PersonId AND OrganizaitionId = @OrganizaitionId
    END
    

    我在新的存储过程中调用它,我需要获得该person的jobs的数量,即GetJobs返回结果集的count。

    为了实现这一目的,首先想到的是使用临时表,将返回结果集存入临时表,再对其进行count(*)的计数操作:

    CREATE PROCEDURE [dbo].[MyProc]
    (
    @PersonId int,
    @OrganizaitionId int,
    )
    AS
    BEGIN
    CREATE TABLE #Temp(
    PersonId int,
    OrganizaitionId int
    )
    
    INSERT INTO #Temp EXEC dbo.GetJobs
    @PersonId = @PersonId,
    @ParentOrgId = @ParentOrgId
    
    SELECT COUNT(*) FROM#Temp
    END
    

    这种办法简单有效,但它存在严重的维护问题。未来如果被调用的存储过程的返回结果集字段有变动,那么MyProc中的临时表结构也需要随之变化。这是令人难以接受的。

    那么将MyProc中的INSERT INTO换为SELECT INTO呢?很遗憾,答案是不行。SQL本身并不支持这种用法。

    给现有存储过程GetJobs加output参数?本例中因为GetJobs已被其他多处代码或SQL scripts调用,所以对现有现有存储过程进行改动会有不小风险。

    我搜遍网络,一位MS MVP的大神的文章几乎总结了所有存储过程之间传递数据的方法: How to Share Data between Stored Procedures。他在文章中也无可奈何地说道

    Keep in mind that compared to languages such as C# and Java, Transact-SQL is poorly equipped for code reuse, why solutions in T‑SQL to reuse code are clumsier.

    最终我没能找到一种满意的办法,无奈之下我在新写的存储过程中将查询Jobs的语句写一了次。

    存储过程在很多场景时有其优势,比如性能。但对于业务逻辑的通用方法,非常不推荐将其写在存储过程中,代码复用、扩展与客户端语言比,相差甚远。也许终究能实现,但代价与风险比客户端语言要高,得不偿失。

    天知道还有没有机会和那位前同事再讨论这一话题呢。需要这份最新完整手册的去关注微信公众号Java技术栈在后台回复手册获取。

    推荐去我的博客阅读更多:

    1.Java JVM、集合、多线程、新特性系列教程

    2.Spring MVC、Spring Boot、Spring Cloud 系列教程

    3.Maven、Git、Eclipse、Intellij IDEA 系列工具教程

    4.Java、后端、架构、阿里巴巴等大厂最新面试题

    觉得不错,别忘了点赞+转发哦!

  • 相关阅读:
    正则表达式
    c#文件流
    css
    Flash笔记 快捷键
    .Net截取指定长度的汉字,其余用...表示的方法
    远程修改最新消息管理系统(JQuery版)
    远程修改最新消息管理系统
    kubernetes 1.6 集群实践 (一)
    创建kafak集群
    创建zookeeper集群
  • 原文地址:https://www.cnblogs.com/javastack/p/12889549.html
Copyright © 2011-2022 走看看