zoukankan      html  css  js  c++  java
  • 程序员取名:用大数据分析一下宝宝取名时最容易重复的名字

    大学同学要给孩子起名字,利用工作条件做的统计,非常有意思。经同意后分享给大家。

      算算时间不早了,该给我们家**起名字了,于是今天中午利用大数据的优势,做了个无聊的统计。

      我抽取了2010年1月1日以后出生的30万小朋友的姓名。

      首先,竟然发现男女比例为18:13,可想而知未来男宝宝找对象该有多么困难。其中,姓名为两个字的小盆友有2.5万人,三个字的小盆友有28.1万人,四个字的小盆友有2000多人。四个字的小盆友大部分都是父姓+母姓+两个字的名字。应该说,三个字的小盆友占了绝大多数,竟达到了91%。

      四个字的小盆友就算了,我对两个字和三个字的小盆友按照男女性别不同又做了一次划分,统计结果显示:

      1、两字名的男宝宝第二个字出现频率最高的前五名分别为“睿”(2.59%)、“浩”(2.56%)、“博”(1.82%)、“瑞”(1.80%)、“昊”(1.78%),也就是说,男宝宝叫hao或者叫rui的占了很大比例。

      2、两字名的女宝宝第二个字出现频率最高的前五名分别是“悦”(2.94%)、“妍”(2.45%)、“涵”(2.07%)、“玥”(1.53%)、“蕊”(1.42%),也就是说,女宝宝叫yue的占有相当大的比例。

      3、三字名的男宝宝第二个字出现频率最高的前五名分别是“子”(5.93%)、“梓”(3.41%)、“浩”(3.32%)、“宇”(3.07%)、“俊”(2.50%),这一算不得了,竟然有接近十分之一的三字名男宝宝叫什么zi什么。

      4、三字名的男宝宝第三个字出现频率最高的前五名分别是“轩”(6.04%)、“宇”(5.16%)、“泽”(2.84%)、“杰”(2.49%)、“豪”(2.19%),这一算也吓了一跳,竟然超过十分之一的三字名男宝宝叫什么什么轩或者什么什么宇。

      随后,我又用颤抖的手统计了一下三字名女宝宝的名字,结果更是令我感到震惊:

      5、三字名的女宝宝第二个字出现频率最高的前五名分别是“雨”(5.11%)、“梓”(3.69%)、“欣”(3.61%)、“子”(3.58%)、“思”(3.52%),也就是说,三字名女宝宝的中间字是这五个字的比例竟然高达五分之一!

      6、三字名的女宝宝第三个字出现频率最高的前五名分别是“涵”(6.75%)、“萱”(3.63%)、“怡”(3.18%)、“彤”(2.66%)、 “琪”(2.65%),同样的,这前五名也占了三字名女宝宝的近五分之一人数!其中,叫“涵”的女宝宝比例竟然高达6.75%,真是令人震惊。

      本来到这里已经统计结束了,后来发现还有一种更加变态的统计,当我按下运行按钮,出来结果之后,我彻底的惊呆了:

      7、三字名男宝宝的名字前六名分别是“浩宇”(0.90%)、“子轩”(0.73%)、“浩然”(0.59%)、“雨泽”(0.55%)、“宇轩”(0.55%)、“子涵”(0.51%)。

      8、三字名女宝宝的名字前六名分别是“欣怡”(0.79%)、“子涵”(0.69%)、“梓涵”(0.59%)、“雨涵”(0.51%)、“可馨”(0.46%)、“诗涵”(0.45%)。

      这样算下来,我真的是吓了一大跳,叫“子涵”或“梓涵”的小盆友,竟然比例如此之高!那么,你们家小孩的名字是不是在以上行列呢?

      而且,大众化的名字很明显地带有时代的气息,与我们这一代的大众化名字多是“峰”、“鹏”、“艳”等等,这在10后小盆友名字中排在了30名以后的位置。而10后小盆友的大众名“轩”、“涵”、“浩”等等则更像是古装电视剧或游戏中的人物名字。难道10后的小盆友真的是父母练级打怪掉出来的么?

      这次统计引起了我的深思,连宝宝的姓名都会随着时代的发展而变化,而事实上或许大多数父母并不曾想到要给孩子起一个大众化的名字,避开了当年大众化的“峰”、“鹏”、“艳”、“丽”,但恰恰是这样的思路,却造成了一个新的时代的大众化潮流。

    注* 此文在天涯、水木均有转载,原文出处、作者已经不可考,欢迎告知。

  • 相关阅读:
    2.12 使用@DataProvider
    2.11 webdriver中使用 FileUtils ()
    Xcode8 添加PCH文件
    The app icon set "AppIcon" has an unassigned child告警
    Launch Image
    iOS App图标和启动画面尺寸
    iPhone屏幕尺寸、分辨率及适配
    Xcode下载失败 使用已购项目页面再试一次
    could not find developer disk image
    NSDate与 NSString 、long long类型的相互转化
  • 原文地址:https://www.cnblogs.com/Hcjer/p/4018395.html
Copyright © 2011-2022 走看看