zoukankan      html  css  js  c++  java
  • 读书笔记2013第16本:《删除:大数据取舍之道》

    这本书是看《大数据时代》后加入到待读书单中的,我想看看作者是如何从数GB的照片中只保留最有用的几MB的照片的,后来找到了kindle版的电子书,就读来试试,说实话,这本书写得是相当的啰嗦,来回地重复“遗忘”和“记忆”这两个词,不断地强调人类默认的状态是遗忘,而不是记忆。对于这种书的办法,利用快速阅读技巧,我也读得飞快,也把书名所说的“删除”技巧,大段大段地略过,只记下了零星的有点启发的句子。对于研究“数据隐私问题”的专家可以慢慢地理解他的观点吧。

    对于人类而言,遗忘一直是常态,而到了现在这个时代,记忆变为了常态,大量的东西都有了数字痕迹,想要遗忘反而并不太容易了。数字技术已经让社会失去了遗忘的能力,取而代之的则是完善的记忆。

    当你在当今的网络上留下了一句流言蜚语,而这句话却一直保留得比你的寿命还长,你还敢随便发表观点吗?你留在网络上的电子足迹将有可能在某一天对你造成伤害。你的博客、微博、评论或者一个网名可能都会都对你造成伤害,包括这篇短短的读书笔记?

    书中说到:很可能会出现一种第三方设备,它们不仅能够获得我们在何地的完整数字化记忆,还能够获得我们在何时,以及如何与我们身边的东西进行互动的数字化记忆。这难道不是指穿戴式的手环或是手表吗?

    完善的数字化记忆,可能会让我们失去一项人类重要的能力----坚定地生活在当下的能力如果我们没有遗忘的能力,那么每当面临抉择时我们往往都会回忆起我们过去所有的选择,这可能将会使我们犹豫不决。

    在大数据时代,还要想办法让某些信息有遗忘的功能。作者在最后一章提出了几点想法,但现在看来还不容易做到。

    让事情记忆下来的历史演变,从口头相传、绘画、文本、书籍,到了现在的数字信息。以前的各种信息在多次复制后都会有噪音的加入或质量的损失,而现在的数字时代却避免了噪声的加入,几百万次下次后,仍是那个文件,那个精确的文件。

    一旦一个人已经分享了信息,这个人就基本上失去了对该信息的控制。

    信息提取时可能会断章取义,因为在信息提取的过程中,很多信息去掉了语境,或者改变了语境,虽然花上足够的时间可能会找到某段话的源头,但在大数据时代,想找到一条信息的源头将变得不再可能。

     数字痕迹使“一个人的生命拥有某种意义”,因为使用了数字存储器,就算有一天我们去世了,我们的思想、情感和经验依然不会遗失,仍然能被子孙后代所运用。借助这些,我们能够继续活着,逃脱了被遗忘的命运。

    如今遗忘已经变得昂贵而又困难,记忆反而便宜又容易。U盘的容量越来越大,而价格越来越便宜!

    保留过去详细邮件或日志也有坏处:当你查询某个人的信息时,结果查到了很久以前的一个不愉快的经历,本来这件事已经在你的头脑里几乎不存在了。但这些外部刺激,却帮我们重新激活了那些原已淡忘的负面记忆。

    给定过去的一个时间点,让人类去想想那天发生的事情是非常困难的(但对于重大的事件是个例外,例如911),所以时间对于人类而言,是一个非常难以掌握的记忆维度。

    作者提出了一个观点,为了让数字系统有遗忘的功能,要给文件存储系统设定一个存储期限,到时该文件将自行销毁。

    看到DRM系统,查了一下,英文全称Digital Rights Management, 是指数字版权管理,但好像不太成功。

    在大数据时代,一些大公司看来也有脆弱的一面,google保存了大量的信息,但如果google滥用个人信息,一旦你失去了对google的信任,这将是他们的末日。从本书中了解到,原来google从2008开始只保存9个月的用户搜索记录,以后要对信息进行模糊化处理。

     

  • 相关阅读:
    U盘安装Ubuntu 10.4 Server
    MySQL操作使用
    Fedora17安装MySQL及配置
    笔记:重构
    Java 并发之线程安全
    Java 并发之共享对象
    UTF8 与 UTF16 编码
    matplotlib 初使用
    用 ggplot2 在同一个图上画多条颜色不同的线
    完成情况(一)
  • 原文地址:https://www.cnblogs.com/speeding/p/3416044.html
Copyright © 2011-2022 走看看