zoukankan      html  css  js  c++  java
  • Excel随机生成数据2

    200万耗时大约 10秒以内,输出结果到txt文件。

    1. Sub GetPassword() 'by kagawa
    2.     Dim i&, j&, k&, l&, m&, n&, r&, s$, s1$, s2$, t$, c1&, c2&, cnt&, tms#
    3.     tms = Timer
    4.     
    5.     m = ActiveCell
    6.     If m = 0 Then m = 2 * 10 ^ 6
    7.     n = 6
    8.     
    9.     s = "ABC2DEF3HJK4LM5NPQ7RST8UVW9XYZ" '原始字符 特意把数字打散均匀插入字母中
    10.     s1 = "2345789" '仅数字
    11.     s2 = "ABCDEFHJKLMNPQRSTUVWXYZ" '仅字母
    12.     l = Len(s)
    13.     l1 = Len(s1)
    14.     l2 = Len(s2)
    15.     
    16.     ReDim arr(1 To l) As Boolean '记录数值位置的数组 以便后面检查是否含有数字
    17.     For i = 1 To l
    18.         If IsNumeric(Mid(s, i, 1)) Then arr(i) = True
    19.     Next
    20.     
    21.     ReDim brr&(1 To n - 1) '密码前5位的对应序号基值 方便今后调用 节省计算时间
    22.     For i = 1 To n - 1
    23.         k = k + l ^ (i - 1)
    24.         brr(i) = l ^ (i - 1)
    25.     Next
    26.     ReDim crr$(1 To k * l) '定义记录前5位字符的相应序号的数组 便于排除重复
    27.     
    28.     t = "VN" & String(n, " ") '生成需要长度的空白字符
    29.     Open ActiveWorkbook.Path & "Password.txt" For Output As #1 '打开Txt记录文件
    30.     Randomize '随机种子初始化 以便每次宏运行时得到不同的随机序列
    31.     For i = 1 To m '生成指定个数=m的密码
    32.         Do
    33.             c1 = 0: c2 = 0: k = 0 '记录初始化 c1=含数字 c2=含字母 k=前5位序号
    34.             For j = 1 To n - 1
    35.                 r = Int(Rnd * l) + 1 '取得随机字符
    36.                 k = k + r * brr(j)     '计算累计序号
    37.                 If arr(r) Then c1 = 1 Else c2 = 1 '检查记录是否含数字或字母
    38.                 Mid(t, j + 2, 1) = Mid(s, r, 1) '指定位置替换成该随机字符
    39.             Next
    40.             
    41.             If c1 + c2 = 2 Then '如果数值和字符都含有了
    42.                 r = Int(Rnd * l) + 1 '那就可以任意取值
    43.                 Mid(t, j + 2, 1) = Mid(s, r, 1)
    44.             Else
    45.                 If c1 = 0 Then '如果不含数字
    46.                     r = Int(Rnd * l1) + 1 '那最后一个加入数字
    47.                     Mid(t, j + 2, 1) = Mid(s1, r, 1)
    48.                 Else '如果不含字母
    49.                     r = Int(Rnd * l2) + 1 '最后一个加入字母
    50.                     Mid(t, j + 2, 1) = Mid(s2, r, 1)
    51.                 End If
    52.             End If
    53.             
    54.             If crr(k) = "" Then '如果前5位序号不重复记录为空
    55.                 crr(k) = t '记录本次有效结果 以便今后检查重复
    56.                 Print #1, t '记录到txt文件
    57.                 Exit Do '退出本次计算
    58.             Else '如果该序号已有记录
    59.                 If InStr(crr(k), t) = 0 Then 则进一步检查是否相同 如果不同则有效
    60.                     crr(k) = crr(k) & "," & t '记录中加入新的结果以便今后检查重复
    61.                     Print #1, t '记录到txt文件
    62.                     Exit Do '退出本次计算
    63.                 Else
    64.                     cnt = cnt + 1 '统计重复次数
    65.                 End If
    66.             End If
    67.         Loop
    68.     Next
    69.     Close #1 '关闭txt文件
    70.     ActiveCell.Offset(, 1) = Format(Timer - tms, "0.000")
    71.     ActiveCell.Offset(, 2) = cnt
    72.     ActiveCell.Offset(1).Activate
    73.     MsgBox Format(Timer - tms, "0.000s ") & cnt & " / " & m
    74. End Sub

    生成200万不重复密码的【字典嵌套算法】,突破了字典方法在数量巨大是必然死机的障碍。
    但实际速度仍然比较慢,比我的数组防止重复法要慢3-5倍。

    1. Sub test5()
    2.     Dim d, i&, m&, s, t$, t1$, t2$, cnt&, tms#
    3.     tms = Timer
    4.     
    5.     m = ActiveCell: If m = 0 Then m = 2 * 10 ^ 6
    6.     
    7. '    s = Split("2 3 4 5 7 8 9 A B C D E F H J K L M N P Q R S T U V W X Y Z")
    8.     s = Split("A B C 2 D E F 3 H J K 4 L M 5 N P Q 7 R S T 8 U V W 9 X Y Z")
    9.     
    10.     Open ActiveWorkbook.Path & "Password.txt" For Output As #1
    11.     Set d = CreateObject("Scripting.Dictionary")
    12.     Randomize
    13.     Do
    14.         t1 = ""
    15.         For i = 1 To 2
    16.             t1 = t1 & s(Int(Rnd * 30))
    17.         Next
    18.         If Not d.Exists(t1) Then Set d(t1) = CreateObject("Scripting.Dictionary")
    19.         '仅取前2位字符作为key加入字典、并设置每一个New key作为嵌套的字典。
    20.         Do
    21.             t2 = ""
    22.             For i = 1 To 4
    23.                 t2 = t2 & s(Int(Rnd * 30))
    24.             Next
    25.             If Not d(t1).Exists(t2) Then '后四位在字典中比对 如果不重复则
    26.                 t = "VN" & t1 & t2 '把密码拼接出来
    27.                 If t Like "*[0-9]*" Then '确认含数字
    28.                     If t Like "VN*[A-Z]*" Then '确认含字母
    29.                         d(t1)(t2) = "" '该密码有效 加入嵌套字典 排除今后重复
    30.                         Print #1, t '输出结果到txt文件
    31.                         cnt = cnt + 1 '有效统计+1
    32.                         Exit Do
    33.                     End If
    34.                 End If
    35.             End If
    36.         Loop
    37.     Loop Until cnt = m '达到目标数如 200万后退出
    38.     Close #1 '关闭txt文件
    39.     ActiveCell.Offset(, 1) = Format(Timer - tms, "0.000")
    40.        ActiveCell.Offset(1).Activate
    41.     MsgBox Format(Timer - tms, "0.000s ") & m
    42.     '下面是统计各个嵌套字典的关键词数量。
    43.     krr = d.keys
    44.     For i = 0 To d.Count - 1
    45.         Cells(i + 2, 5) = d(krr(i)).Count
    46.     Next
    47.     Set d = Nothing
    48. End Sub
    1. Sub test()
    2.     Dim d, i&, m&, s, t$
    3.     Randomize
    4.     m=200000 '建议不超过20万 超过则字典运算速度大幅度降低。
    5.     s = Split("A B C 2 D E F 3 H J K 4 L M 5 N P Q 7 R S T 8 U V W 9 X Y Z") '按我的序列速度较快
    6.     Set d = CreateObject("Scripting.Dictionary")
    7.     t = "VN" & String(6, " ") '生成密码模板
    8.     Do
    9.         For i = 3 To 8
    10.             Mid(t, i, 1) = s(Int(Rnd * 30)) '直接替换速度更快
    11.         Next
    12.         If t Like "*[0-9]*" Then If t Like "VN*[A-Z]*" Then d(t) = "" '检查数字字母都含有时加入字典
    13.     Loop Until d.Count = m '确认字典中不重复项达到m值时退出Do循环
    14. '    [a1].Resize(m) = Application.Transpose(d.keys) '输出结果 注意仅65536以下可以用Transpose
    15.     Set d = Nothing
    16. End Sub
  • 相关阅读:
    .NET 4.0 System.Threading.Tasks学习笔记
    c#初学-多线程中lock用法的经典实例
    Spring3 Schedule Task之注解实现 (两次起动Schedule Task 的解决方案)
    支持向量机中的函数距离的理解
    Sqlserver 2016 R Service环境安装的各种错误(坑)解决办法
    Sql server的Merge语句,源表中如果有重复数据会导致执行报错
    对IIS7经典模式和集成模式的理解(转载)
    VisualStudio编译项目时,提示bin目录和obj目录下的文件不能写的错误处理的解决办法
    SQL Server 全文索引介绍(转载)
    sql server全文索引使用中的小坑 (转载)
  • 原文地址:https://www.cnblogs.com/shengs/p/4592774.html
Copyright © 2011-2022 走看看