2020-2021-1学期 20202404《网络空间安全专业导论》第七周学习总结
这三章 是本书的第六部分——应用层。应用层的重点是用计算机解决真实世界的问题。
第12章 信息系统
12.1 信息管理
信息系统一般被定义为帮助我们组织和分析数据的软件。
将数据转换为信息需要原始数据,并且需要将它们转化为有用的形式。为了让数据有用,它们可能被分类、聚类或者转化为不同的形式,这都是信息系统的任务。任何应用程序都是管理数据的。三种最流行的一般应用信息系统是电子表格、数据库管理系统和电子商务。
基于可扩展的公式的电子表格是一个进行基本数据分析的方便的工具,这些工具定义了数据之间的关系。数据库管理系统是面向管理大量常常被搜索的数据,并将其组织成相应的分段。我们需要知道电子表格和数据库管理系统的实用性和通用性。
信息管理:帮组我们组织和分析数据的软件。
12.2 电子制表软件
电子制表软件:允许用户用单元格组织和分析数据的程序。
单元格:电子数据表中用于存放数据或公式的元素。
12.2.1 电子数据表公式
电子数据表的好处在于易于修改和易于扩展。公式都是以等号(=)开头的,由此可以判断哪一个单元格存放的是要计算的公式。
电子数据表是动态的。
电子数据表中的公式可以利用标准符号的基本数学运算,也可以利用软件内置的电子数据表函数。
电子数据表函数:电子制表软件提供的可用于公式的计算函数。
范围:用端点指定的一组连续单元格。
12.2.2 循环引用
电子数据表的公式中可以有循环引用,即这种引用是不可能求解的,因为一个公式的结果最终是基于另一个公式的。
循环引用:在计算结果是要错误地彼此依赖的一组公式。
12.2.3 电子数据表分析
电子数据表有多功能性,电子数据表分析可以应用于多个领域。电子数据表的动态特性还提供了进行模拟假设分析的强大功能
模拟假设分析:修改电子数据表中表示假设的值,以观察假设的变化对相关的数据有什么影响。
12.3 数据库管理系统
数据库可以简单定义为结构化的数据集合,数据库管理系统是一组软件和数据的组合,由物理数据库(存放数据的文件的集合)、数据库引擎(支持对数据库内容的访问和修改的软件)、数据库模式(存储在数据库中的数据的逻辑结构的规约)三部分构成。
数据库引擎与专用的数据库语言交互,这种语言允许用户指定数据的结构、添加修改和删除数据,查询数据库以获取指定的数据结构。
数据库模式提供了数据库中的数据的逻辑视图,独立于数据的物理存储方式。逻辑模式展示了数据项之间的关系。
数据库:结构化的数据集合。
数据库管理系统:由物理数据库,数据库引擎和数据模式构成的软件和数据的结合。
查询:从数据库检索数据的请求。
模式:数据库中数据的逻辑结构的规约。
12.3.1 关系模型
多年以来,关系模型都在流行的数据库管理模型中占统治地位。在关系DBMS中,用表组织数据项和它们之间的关系。表是记录的集合。记录是相关字段的集合。数据库表的每个字段都包含一个数据值。表中的每个记录都包含相同的字段。
数据库表中的记录又叫数据库对象或实体。记录中的字段有时又叫做数据库对象的属性。通常,表中会有一个或多个字段被标识为键字段。
关系模型:用表组织数据和数据之间的关系的数据库模型。
表:数据库记录的集合。
记录(或对象、实体):构成一个数据库实体的相关的字段的集合)。
字段(或属性):数据库记录中的一个值。
键:在表的所有记录中唯一标识一个数据库记录的一个或多个字段。
12.3.2 关系
12.3.3 结构化查询语言
结构化查询语言(SQL)是一种用于管理关系数据库的综合型数据库语言,它包括指定数据库模式的语句和添加、修改及删除数据库内容的语句。
12.3.3.1 查询
12.3.3.2 修改数据库的内容
12.3.4 数据库设计
一种常用的设计关系数据库的方法叫作实体关系(ER)建模。ER建模的主要工具是ER图,ER图用图形化的形式捕捉重要的记录类型、属性和关系。
实体关系(ER)建模:设计关系数据库的常用方法。
ER图:ER模型的图形化表示。
基数约束:在ER图中,一次可以存在于实体间的关系数量。
一对一 一对多 多对多
12.4 电子商务
电子商务:使用万维网买卖物品及服务的过程。
12.5 大数据
大数据指的是数据集在非常巨大和复杂的情况下,至今讨论过的信息系统无法处理他们。大数据有很多好处,但是也有敏感的个人信息,所以要正确利用。
大数据:不能够用传统管理办法处理的大数据集。
第13章 人工智能
13.1 思维机
计算机虽然擅长计算,但是根本不擅长智能的任务。人工智能就是研究对人类思想建模和应用人工智能的计算机系统的学科。
人工智能:研究对人类思维建模和应用人类智能的计算机系统的学科。
13.1.1 图灵测试
图灵测试:一种行为方法,用于判断一个计算机系统是否是智能的。
通过图灵测试的计算机具有弱等价性,即两个系统(人和计算机)在结果(输出)上是等价的,但实现这种结果的方式不同。
强等价性说明两个系统使用的是相同的内部过程来生成结果。
弱等价性:两个系统基于其结果的等价性。
强等价性:两个系统基于其结果和实现这种结果的处理方法的等价性。
13.1.2 AI问题的各个方面
知识表示、专家系统、神经网络、自然语言处理、机器人学。
13.2 知识表示
13.2.1 语义网
语义网借用了许多概念,包括继承和实例化。继承关系说明一个对象是另一个对象更具体的版本。实例化是一个真正的对象和这种对象的说明之间的关系。
语义网是表示大量信息的强有力而通用的方式。
语义网:表示对象之间关系的知识表示法。
13.2.2 检索树
检索树是表示游戏中所有可能的移动的结构。
在这其中广度优先发趋向于生成最好的结果。
检索树:表示对抗性情况(如博弈)中所有选择的结构。
深度优先法:优先沿着树的的路径向下检索,而不是优先横着检索每层的检索法。
广度检索法:优先横向检索树的每层,而不是优先向下检索特定路径的检索法。
13.3 专家系统
基于知识的系统是嵌入并使用一套特定信息(有组织的数据)的软件系统,可以从中提取和处理特定的片段。术语专家系统和基于知识的系统一般是通用的,不过专家系统通常嵌入的是一个特定领域的知识,对这个领域专业人员的专门技术进行了建模。当用户面临特定的问题时会咨询专家系统。专家系统的规则集合又叫做它的知识库。推理机是专家系统的一部分,决定了如何执行规则以及从而会得到什么结论。
基于知识的系统:使用特定信息集合的软件。
专家系统:基于人类专家的知识的软件系统。
基于规则的系统:基于一套if-then规则的软件系统。
推理机:处理规则以得出结论的软件。
13.4 神经网络
人工神经网络:尝试模拟人体神经网络的计算机知识表示法。
13.4.1 生物神经网络
13.4.2 人工神经网络
元素的有效权是人工神经元中输入值和相应的权的乘积之和。
人工神经网络中建立的路径是每个处理元素的函数。每个处理元素的输出将根据输入信号、权和阈值而改变,不过输入信号只是其他元素的输出信号,因此改变单个处理元素的权和阈值就可以影响神经网络的处理。调节神经网络中的权和阈值的过程叫作训练。
有效权:人工神经元中输入值和相应的权的乘积之和。
训练:调整神经网络中的权和阈值以实现想要的结果的过程。
13.5 自然语言处理
首先了解人机语音交互过程中的三种基本处理类型:
语音识别:用计算机来识别人类讲的话。
自然语言理解:用计算机对人类传达的信息做出合理的解释。
语音合成:用计算机制造出人类的语音。
自然语音:人们用于交流的语言。
这些问题的共同点都在于针对的都是自然语言。
13.5.1 语音合成
语音合成有两种基本的解决方法——动态语音合成和录制语音。人类的语音可以被划分为特定的声音单元——音素。
音素:任何指定的语言中的基本声音单元的集合。
13.5.2 语音识别
语音可以被录制成声波纹,绘制了讲特定单词时声音频率的变化。
声波纹:表示人声随着时间推移的频率变化的图。
13.5.3 自然语言理解
因为自然语言可能会有词法二义性和句法二义性或者指代二义性,所以加大了难度。
词法二义性:由于单词具有多种含义而造成的二义性。
句法二义性:由于句子的构造方式有多种而造成的二义性。
指代二义性:由于代词可以指代多个对象而造成的二义性。
13.6 机器人学
13.6.1 感知-规划-执行范型
感知→世界建模→规划→控制→执行
13.6.2 包孕体系结构
新的范型不再一次模拟整个机器人世界,而是赋予它一套简单的行为,每一种行为与它所需的一部分机器人世界关联在一起。
13.6.3 物理部件
机器人是由传感器、执行器和计算部件构成的。机器人移动所需的三种最常用系统是轮子、履带和机械腿。
第14章 模拟、图形学、游戏和其他应用
14.1 什么是模拟
模拟是研究复杂系统的有力工具,所谓模拟,就是设计复杂系统的模型以及为观察结果而对其进行实验性操作。
模型:真实系统的抽象,是系统中对象和管理这些对象相互作用的规则的表示。
14.1.1 复杂系统
最适合模拟的系统是动态的、交互式的和复杂的系统。
14.1.2 模型
模型是真实系统的抽象,是系统中的对象和管理这些对象相互作用的规则的表示。
14.1.3 构造模型
有两种不同的模拟类型,为每种类型选择特征或特征集合的过程不同。这两种类型的区别在于表示时间的方式,一个采用的是连续变量,另一个采用的是离散事件。
14.1.3.1 连续模拟
连续模拟把时间看作是连续的,用一组反映特征集合中的关系的微分方程表示时间的变化。(可以数学表达)
14.1.3.2 离散事件模拟
离散事件模拟由实体、属性和事件构成。
14.2 特殊模型
计算生物学:一个通过计算机、应用数学以及统计学的知识解决生物学问题的交叉性学科。
14.2.1 排队系统
14.2.1.1 请等待
预测平均等待时间,可以改变服务器数量、到达时间分布情况和服务时间,从而分析平均等待时间已确定什么是合理的折中。
14.2.1.2 一个示例
14.2.1.3 其他类型的队列
两个FIFO队列,一个用于较短的服务时间,一个用于较长的服务时间。
14.2.2 气象模型
高速的并行计算机才能在合理的时间内计算出来他们。
14.2.2.1 天气预报
计算机模型输出的是预测的将来的变量值,这些值的含义是由预报员决定的。
14.2.2.2 飓风跟踪
浮动模型。
14.2.2.3 专用模型
气象模型可以改变成专用模型。
14.2.3 计算生物学
计算生物学是一种通过计算机、应用数学以及统计学的知识解决生物学问题的交叉性学科。计算生物学整合了许多其他领域的知识:
生物信息学
计算生物建模
计算基因组
分子建模
蛋白质结构预测
14.2.4 其他模型
14.2.5 必要的计算能力
14.3 计算机图形学
我们大体上可以将计算机图形描述成计算机屏幕上的像素值的设置。计算机图形学在计算机科学的许多领域都扮演者一定的角色。最常见的应用是现代操作系统中的图形用户界面。
14.3.1 光的工作原理
要生成真实的图像,计算机必须计算,以模拟光和物体之间的交互、各种纹理的物体的不规则表面以及光线强度随位置在阴影中的变化。
14.3.2 物体形状
计算机图形学只处理物体的表面。
14.3.3 光模拟
利用照明模型来确定整个物体的外观的处理叫做明暗处理模型或者明暗处理。
创建图像过程叫做绘制。第二种方法叫做光线跟踪。
14.3.4 复杂对象的建模
14.3.5 让物体动起来
“动画片的原理”
14.4 游戏
计算机游戏:是一种引入真实世界玩家作为参与者的对某个虚拟世界的计算机模拟。
14.4.1 游戏的历史
游戏玩法:玩家在游戏过程中交互与体验的类型。
14.4.2 创建虚拟世界
游戏引擎:创造计算机游戏的软件系统。