zoukankan      html  css  js  c++  java
  • Implementing a builder: Zero and Yield

    原文地址:http://fsharpforfunandprofit.com/posts/computation-expressions-builder-part1/

    前面介绍了bind和continuation,以及包装类型的使用,现在我们已经准备讲述“builder”类型的一系列的方法了。

    如果你看过MSDN documentation,你会发现“builder”类型的方法不仅仅是Bind和Return,还有其他方法如Delay和Zero,这两个方法是干啥用的?这正是本篇以及以后几篇讲述的主题。

    计划

    为了论证如何创建一个builder类,我们将创建一个自定义工作流,它使用所有可能的builder类方法。

    但是比起从头开始,没有上下文就解释那些builder类方法是什么意思,我们不如采用自底向上的方式,从一个简单的工作流开始,并在需要解决某个问题或者错误的时候添加有关的方法,这样会更加自然些。在这个过程中,你将逐渐理解F#在细节上如何处理computation expression的。

    对这个过程做一个提纲

    1. 首先看一看,作为一个基本工作流,哪些方法是必需的。我们将介绍Zero,Yield,Combine和For
    2. 然后,我们将讨论如何延迟执行代码,即,只在需要的时候计算值。我们介绍Delay和Run,然后看延迟计算的具体实现。
    3. 最后,我们讨论剩下的方法:While,Using和异常处理。

    开始前

    在我们开始创建工作流之前,有几点说明

    computation expressions文档说明

    也许你已经注意到,MSDN文档中关于computation expressions的说明是非常简陋的,尽管它并非不准确,但是仍然容易会误导初学者。例如,builder类方法的签名比看上去更加灵活,这有助于实现一些特性(features),你在工作中如果不随时查阅文档说明,那这些特性则很不明显。后面我们会给出一个例子说明。

    如果你需要更详细的文档说明,那么我将推荐两个源。如果想更为详细地纵览computation expressions背后的概念,有一个很好的资源,是由Tomas Petricek和Don Syme写的论文"The F# Expression Zoo"。如果需要最新的准确的科技文档,可以阅读F# language specification,它有一章节是关于computation expressions的。

    包装类型和未包装类型

    当想去理解文档中的函数签名,记住一点,我们通常把未包装类型记为'T,包装类型记为M<'T>。这样以后当看到Return方法的签名为'T -> M<'T>,它表示Return方法有一个未包装类型的输入参数,输出参数是要给包装类型。

    跟这个系列的前面几篇文章相同,我将继续使用“未包装”和“包装”来描述这些类型之间的关系,但是我们接下去的讨论中可能会稍作改变,使用其他术语,如“computation type”代替“wrapped type”。我希望当碰到这个称呼改变时,我们对这个作改变的理由是清楚的并能理解。

    当然,在我的例子中,我将尽量让事情简单,比如使用

    let! x = ...wrapped type value...

    但是,这其实是一个过分简化的表达式,也可以准确的说,“x”可以是任意模式而不仅是一个值,“wrapped type value”可以是一个表达式,这个表达式能计算得到一个包装类型。MSDN文档使用这种更加精确的方法,它在定义中使用“模式”和“表达式”,如

    let! pattern = expr in cexpr

    以下是maybe工作流中使用模式和表达式的一些例子,其中,Option是包装类型,

    // let! pattern = expr in cexpr
    maybe {
        let! x,y = Some(1,2) 
        let! head::tail = Some( [1;2;3] )
        // etc
        }

    之前说过,我将继续使用这种非常简单的例子,不会对已经很复杂的主题再添加更多复杂的东西。

    实现builder类(或者不是builder类)的特殊方法

    MSDN文档说明了,每个特殊操作(如for..in,或yield)是如何被转换成builder类中的一个或多个方法调用的。

    虽然没有一对一的对应关系(特殊操作与builder类方法),但是通常地,为了支持特殊操作的语法,你必须实现builder类中的一个对应的方法,否则编译器无法通过编译。

    另一方面,你不必实现每个方法,如果不需要支持某个语法的话。例如,通过实现Bind和Return两个方法,我们就已经实现了maybe工作流。如果我们不需要使用Delay,Use等等,我们就不必实现这些方法。

    为了能够看到如果不实现必需的方法,将会发生什么,让我们尝试在maybe工作流中石油for..in..do语法,如下

    maybe { for i in [1;2;3] do i }

    我们将会获得一个编译错误

    This control construct may only be used if the computation expression builder defines a 'For' method

    有时候会获得隐晦的错误,除非你知道后台进行了什么操作。例如,如果忘记在工作流中加Return操作,如下

    maybe { 1 }

    那你会获得编辑错误

    This control construct may only be used if the computation expression builder defines a 'Zero' method

    你可能会问:Zero方法是什么?为什么需要这个方法?答案下面会给出。

    带"!"和不带"!"的操作

    显然,很多特殊操作是成对出现的,即带"!"和不带"!"符号。例如,let 和 let! (发音为 let-bang),return 和 return!,yield和yield!等等。

    区别其实很简单。当实现不带"!"的操作时,右边总是非包装类型,而带"!"的操作右边总是包装类型。

    例如,使用maybe工作流,其中Option是包装类型,我们可以比较下面代码的语法的不同

    let x = 1           // 1 is an "unwrapped" type
    let! x = (Some 1)   // Some 1 is a "wrapped" type
    return 1            // 1 is an "unwrapped" type
    return! (Some 1)    // Some 1 is a "wrapped" type
    yield 1             // 1 is an "unwrapped" type
    yield! (Some 1)     // Some 1 is a "wrapped" type

    带"!"的对工作流组合非常重要,因为包装类型可以是另一个相同类型的computation expression的结果

    let! x = maybe {...)       // "maybe" returns a "wrapped" type
    
    // bind another workflow of the same type using let!
    let! aMaybe = maybe {...)  // create a "wrapped" type
    return aMaybe             // return it
    
    // bind two child asyncs inside a parent async using let!
    let processUri uri = async {
        let! html = webClient.AsyncDownloadString(uri)
        let! links = extractLinks html
        ... etc ...
        }

    以上代码中,webClinet.AsyncDownloadString(uri) 与 extractLinks html 结果为一个包装类型,故可以放在let!操作的右边。

    深入——创建一个工作流的最小实现

    让我们开始吧!我们开始创建一个maybe工作流的最小版本(我们将重命名它为“trace”),实现上面说过的每一个方法,可以让我们知道有了这些实现会发生什么。以后,我们就使用这个工作流作为我们的试验台。

    给出trace工作流的第一个版本

    type TraceBuilder() =
        member this.Bind(m, f) = 
            match m with 
            | None -> 
                printfn "Binding with None. Exiting."
            | Some a -> 
                printfn "Binding with Some(%A). Continuing" a
            Option.bind f m
    
        member this.Return(x) = 
            printfn "Returning a unwrapped %A as an option" x
            Some x
    
        member this.ReturnFrom(m) = 
            printfn "Returning an option (%A) directly" m
            m
    
    // make an instance of the workflow 
    let trace = new TraceBuilder()

    这里的代码没有什么新的内容,都是之前见过的。

    现在让我们运行一些示例代码

    trace { 
        return 1
        } |> printfn "Result 1: %A" 
    
    trace { 
        return! Some 2
        } |> printfn "Result 2: %A" 
    
    trace { 
        let! x = Some 1
        let! y = Some 2
        return x + y
        } |> printfn "Result 3: %A" 
    
    trace { 
        let! x = None
        let! y = Some 1
        return x + y
        } |> printfn "Result 4: %A" 

    一切都应该如期工作,尤其,你应该能够看到第四个例子中使用了None,这导致接下来的两行(let! y = ... return x+y)代码被跳过执行,整个表达式的结果是None。

    介绍"do!"

    我们的表达式支持let!,但是do!是什么?

    在正常F#中,do就像let,除了do表达式不返回值(即,返回unit值)。

    在computation expression中,do!也非常类似let!,传入一个包装类型到Bind方法中,但是do!的结果值是unit,所以传给Bind方法的是一个unit的包装类型。

    以下是使用trace工作流的简单例子

    trace { 
        do! Some (printfn "...expression that returns unit")
        do! Some (printfn "...another expression that returns unit")
        let! x = Some (1)
        return x
        } |> printfn "Result from do: %A"

    输出结果为

    ...expression that returns unit
    Binding with Some(<null>). Continuing
    ...another expression that returns unit
    Binding with Some(<null>). Continuing
    Binding with Some(1). Continuing
    Returning a unwrapped 1 as an option
    Result from do: Some 1

    介绍"Zero"

    最小的工作流会是什么样子?如果什么都不做,如下代码

    trace { 
        } |> printfn "Result for empty: %A" 

    我们会获得一个错误

    This value is not a function and cannot be applied

    想一下,在工作流中没有任何东西,这也没什么意义,毕竟本来的目的就是链接表达式的。

    接着,如果在工作流中添加一个简单的不带let!或者return的表达式呢?

    trace { 
        printfn "hello world"
        } |> printfn "Result for simple expression: %A"

    于是,将会获得如下错误

    This control construct may only be used if the computation expression builder defines a 'Zero' method

    所以你知道了什么需要Zero方法了吧?答案就是在这种情况下,没有显式返回任何东西,而computation expression整体必须返回一个包装值。那应该返回什么呢?

    事实上,只要没有显式给出computation expression的返回值,就会发生上面这种情况,比如你写if..then表达式但少了else从句,就会发生同样的状况。

    trace { 
        if false then return 1
        } |> printfn "Result for if without else: %A" 

    在正常的F#代码中,“if..then"语句不带“else”的会产生一个unit类型的结果,但是在computation expression中,返回值必须是一个包装类型,而编译器不知道这个包装值是什么。

    办法就是告诉编译器该使用什么——这就是Zero方法的目的。

    Zero应该使用什么值?

    那Zero应该使用什么值呢?这依赖于你创建的是什么工作流。

    以下几点说明也许会有帮助:

    •  工作流是否有“成功”或者“失败”的概念?如果是,则为Zero使用“失败”的结果值。例如,在我们的trace工作流中,我们使用None表示失败,所以我们可以使用None作为Zero的值
    • 工作流是否是顺序执行?也就是,在工作流中,一步一步的执行,包括一些在后台的处理。在一般的F#代码中,有显式返回的表达式可能会计算得到unit,所以这里类似处理,即Zero是unit的包装版本。例如,在一个option-based 工作流中,我们可能使用Some()来表示Zero(顺便一提,这跟Return()是相同的)。
    • 工作流是否主要关心数据结构的操作?如果是,Zero应该是“空”数据结构。例如,在一个“list builder”工作流中,我们将使用空列表作为Zero值。
    • 在组合包装类型时Zero值也扮演着重要的作用。

    一个Zero的实现

    让我们扩展一下我们的测试代码,使用一个返回None的Zero方法,如下

    type TraceBuilder() =
        member this.Zero () =
            printfn "Zero"
            None
    let trace = new TraceBuilder()
    
    trace {
            printfn "hello world"
            } |> printfn "Result for simple expression: %A"
    
    trace {
            if false then return 1
            | |> printfn "Return for if without else clause: %A"

    通过以上测试代码我们很清楚地看到,Zero在后台被默默的调用。整个表达式的返回值为None。注意:None可能被打印成<null>。

    是否总是需要Zero?

    记住,不要求必须有Zero,除非它在工作流的上下文中有意义。例如,seq不允许有Zero,而async则可以

    let s = seq {printfn "zero" }    // Error
    let a = async {printfn "zero" }  // OK

     介绍“Yield”

    C#中有“yield”语句,其作用是提前返回一个可枚举类型,以后通过迭代器在需要用到可枚举类型的元素时才获取元素值。

    F# computation expressions中也有一个“yield”语句,它是干嘛的呢?

    让我们尝试一下

    trace { 
        yield 1
        } |> printfn "Result for yield: %A"

    运行这段代码会获得一个错误

    This control construct may only be used if the computation expression builder defines a 'Yield' method

    这里不奇怪。那“yield”方法的实现是什么样的呢?MSDN文档给出了它的签名'T -> M<'T>,跟Return方法签名相同,即包装一个非包装类型。

    所以,我们类似Return方法来实现Yield方法,并测试这个表达式

    type TraceBuilder() =
        // other members as before
    
        member this.Yield(x) = 
            printfn "Yield an unwrapped %A as an option" x
            Some x
    
    // make a new instance        
    let trace = new TraceBuilder()
    
    // test
    trace { 
        yield 1
        } |> printfn "Result for yield: %A" 

    此时,这个工作流可以工作,看起来yield可以是return的替代品。

    当然还有一个YieldFrom方法,它对应ReturnFrom方法。YieldFrom的行为类似,产生一个包装类型

    那下面将YieldFrom加入builder类方法

    type TraceBuilder() =
        // other members as before
    
        member this.YieldFrom(m) = 
            printfn "Yield an option (%A) directly" m
            m
    
    // make a new instance        
    let trace = new TraceBuilder()
    
    // test
    trace { 
        yield! Some 1
        } |> printfn "Result for yield!: %A" 

    此时,可能会想:如果return和yield几乎相同,那为何要存在这两个关键字呢?答案是,实现其中一个方法可以让我们使用某个语法,而实现另一个则不能使用这个语法。例如,seq表达式允许yield但是不允许return,而async允许return但不允许yield,如下面代码片段

    let s = seq {yield 1}    // OK
    let s = seq {return 1}   // error
    
    let a = async {return 1} // OK
    let a = async {yield 1}  // error

    事实上,你可以实现让return与yield方法之间存在一些差别,那样就能达到某种目的,比如使用return停止(return)后面的computation expression的计算,而yield则不会。

    更一般地,yield应该用在sequence/enumeration的场景,而return通常一次作用在一个表达式。(我们将在下一篇中看到如何多次使用yield。)

    复习“For”

    我们在上一篇中讨论了for..in..do语法,现在再来回顾一下“list builder”并向其中添加一些其他的方法。我们已经知道如何对一个列表定义Bind和Return方法了,故这里只要实现其他的方法定义。

    Zero方法只返回一个空列表。

    Yield方法实现与Return相同。

    For方法实现与Bind相同。

    type ListBuilder() =
        member this.Bind(m, f) = 
            m |> List.collect f
    
        member this.Zero() = 
            printfn "Zero"
            []
    
        member this.Return(x) = 
            printfn "Return an unwrapped %A as a list" x
            [x]
    
        member this.Yield(x) = 
            printfn "Yield an unwrapped %A as a list" x
            [x]
            
        member this.For(m,f) =
            printfn "For %A" m
            this.Bind(m,f)
    
    // make an instance of the workflow                
    let listbuilder = new ListBuilder()

    下面是使用let!的代码

    listbuilder { 
        let! x = [1..3]
        let! y = [10;20;30]
        return x + y
        } |> printfn "Result: %A"

    下面是使用for的代码

    listbuilder { 
        for x in [1..3] do
        for y in [10;20;30] do
        return x + y
        } |> printfn "Result: %A" 

    可以看到这两段代码的输出结果相同

    总结

    本篇我们看到了对一个简单的computation expression,如何实现它的基本的方法。

    重申几点:

    对简单的表达式来说,不必实现所有的方法。

    • 带“!”的语句,表达式右边是包装类型
    • 不带“!”的表达式右边是非包装类型
    • 如果想让一个工作流不显式返回值,则必须实现Zero
    • Yield与Return基本相同,但是Yield应该在sequence/enumeration语义中使用
    • 在一些简单的场景中For与Bind基本相同

    下一篇,我们将看到当组合多个值时会发生什么。

  • 相关阅读:
    python加载csv数据
    Android项目依赖库管理方式简介
    Android PhotoView基本功能实现
    Android ListView的header footer设置visibility gone不起作用
    [干货][EMIT]千行代码实现代理式AOP+属性的自动装配
    Emit实现DataRow转化成强类型的T
    有关docker新版的icc、iptables的一个巨坑
    Mac神器Iterm2的Shell Integration的用法和注意事项
    生成ssl证书文件
    python3 module中__init__.py的需要注意的地方
  • 原文地址:https://www.cnblogs.com/sjjsxl/p/5005701.html
Copyright © 2011-2022 走看看