原始的日志信息如下:
RunspaceId : d3dbe55b-b0c2-48ef-8f49-0f30ebd553aa ObjectModified : test CmdletName : New-Mailbox CmdletParameters : {ResetPasswordOnNextLogon, Alias, Password, UserPrincipalName, Database, SamAccountName, LastName, Organizat ionalUnit, Initials, FirstName, Name} ModifiedProperties : {} Caller : TEst.Admin Succeeded : True Error : RunDate : 2014/3/24 10:01:49 OriginatingServer : TEST(15.00.0775.022) Identity : RgAAAABRB0jEnPi7SZ46Wv3WKUahBwAfCsv7xh/zT66wYhIbLojWAAAAb1GrAABdb7eQEuSqQ5aHAWignShgAAAAACmAAAAJ IsValid : True
现需要将以上文本以:为分隔提取后面的值信息,因为开发的通用日志解析工具是通过正则来提取数据的,这样就需要把这个数据块中特征通过正则表示出来,然后提取特征之后的数据,研究了大半天后来终于给写出来了,好费劲,正则不熟啊,记录一下:
(?:RunspaceId : )(?<RunspaceId>[sS]*) (?:ObjectModified : )(?<ObjectModified>[sS]*) (?:CmdletName : )(?<CmdletName>[sS]*) (?:CmdletParameters : )(?<CmdletParameters>[sS]*) (?:ModifiedProperties : )(?<ModifiedProperties>[sS]*) (?:Caller : )(?<Caller>[sS]*) (?:Succeeded : )(?<Succeeded>[sS]*) (?:Error : )(?<Error>[sS]*) (?:RunDate : )(?<RunDate>[sS]*) (?:OriginatingServer : )(?<OriginatingServer>[sS]*) (?:Identity : )(?<Identity>[sS]*) (?:IsValid : )(?<IsValid>.*)
最终通过正则的组名去获取匹配上的信息就可以了。
(?:pattern) |
匹配 pattern 但不捕获该匹配的子表达式,即它是一个非捕获匹配,不存储供以后使用的匹配。这对于用“or”字符 (|) 组合模式部件的情况很有用。例如,'industr(?:y|ies) 是比 'industry|industries' 更经济的表达式。 |