写这篇文章,是缘于我以前写过的一个程序,将COBOL语言转换为PL1语言。
这两种语言都是大型计算机(IBM OS390等等)用的古老语言。
由于项目原因,这些Sample都不能直接贴到这里来。
语言之间的转换,例如VB和C#,由于同属于NET平台,他们之间的转换还是非常方便的。请大家明确一点,语言之间转换是否方便,不是取决于他们看上去怎么样,而是内部编译器的机理。VB和C#看上去差很多,不过,由于CIL是一样的,所以,转换起来很方便。至于怎么转换,我猜测很多工具可能是直接在CIL层面做的。有一套通过CIL转为C#,VB的程序。所以,转换之前需要我们的DLL,EXE,这样可以获得CIL,然后在转换为各种NET系的程序。
PL1和COBOL之间的转换由于在数据内存分配上面的不同,不是那么容易的。我就来谈谈转换工具的思想。
大概分两步走,第一步是抽取第一种语言的命令树。这个可以使用JavaCC这个工具来做,我这里是手工做的。
将数据的设定里面,所有的数据信息放在数组里面。由于COBOL和PL1都是树状的数据结构,其实是一颗颗的小的树。
命令的话,也是放在命令树里面。IF里面有PERFORM的话,在IF的树里面放入PERFORM的子节点。
有一些XML的东西可以用来方便的存储树。
第二步就是将这些树里面的东西,遵循变换规则,进行变换。
这步需要大量的专业知识,以及对于语言特点的把握。
有很多语言的特性是非常难处理的,例如数组在内存中的存放方法等等。还有就是某些语言特有的东西。
这里的话,我们可以适当进行一下妥协。很多东西,只要结果对,也就没有必要死板的一一对应了。