林俊丞2020/11/25
学习内容:《计算机科学导论》第12、13、14章
第12章 信息系统
12.1 信息管理
我们通常把数据定义为原始事实,信息表示组织起来帮助我们回答问题以及解决问题的数据。
信息系统(information system):帮助我们组织和分析数据的软件。
三种最流行的一般应用信息系统是电子表格、数据库管理系统和电子商务。
数据库管理系统是面向管理大量常常被搜索的数据,并将其组织成相应的片段。
12.2 电子制表软件
电子制表软件(spreadsheet):允许用户用单元格组织和分析数据的程序。
单元格(cell):电子数据表中用于存放数据或公式的元素。
通常,电子数据表有一个合理的最大行数,大多数电子制表程序会把多个表格组合在一个大的交互系统中。
基于可拓展的公式的电子表格是一个进行基本数据分析的方便的工具,这些公式定义了数据之间的关系。
12.2.1 电子数据表公式
许多电子制表软件的公式都是以等号(=)开头的。
电子数据表是动态的,能对变化立即做出响应。
电子数据表函数(spreadsheet function):电子制表软件提供的可用于公式的计算函数。
范围(range):用端点指定的一组连续格。
12.2.3 循环引用
循环引用(circular reference):在计算结果时要错误地彼此依赖的一组公式。
注意!循环引用是一种错误类型,电子制表软件通常能探测出这些问题并提示错误信息。
12.2.3 电子数据表分析
模拟假设分析(what-if analysis):修改电子数据表中表示假设的值,以观察假设的变化对相关数据有什么影响。
特色:电子表格可视化
12.3 数据库管理系统
数据库(database):结构化的数据集合。
数据库管理系统(database management system):由物理数据库、数据库引擎和数据库模式构成的软件和数据的集合。
数据库引擎与专用的数据库语言交互。
查询(query):从数据库检索数据的请求。
模式(schema):数据库中数据的逻辑结构的规约。
12.3.1 关系模型
关系模型(relational model):用表组织数据和数据之间的关系的数据库模型。
表(table):数据库记录的集合。
记录(或对象、实体)(record(or object,entity)):构成一个数据库实体的相关的字段的集合。
字段(或属性)(field(or attribute)):数据库记录中的一个值。
数据库表中的记录又叫数据库对象或实体。记录中的字段有时又叫作数据库对象的属性。
键(key):在表的所有记录中唯一标识一个数据库记录的一个或多个字段。
12.3.2 关系
记录表示的是独立的数据库对象,记录的字段是这些对象的属性。可以创建一个记录来表示对象之间的关系,包括记录中的属性关系。
12.3.3 结构化查询语言
结构化查询语言(Structured Query Language,SQL):用于管理和查询数据的综合性关系数据库语言。
1.查询
2.修改数据库的内容
12.3.4 数据库设计
实体关系(ER)建模(Entity-Relationship(ER)modeling):设计关系数据库的常用方法。
ER图(ER diagram):ER模型的图形化表示。
基数约束(cardinality constraint):在ER图中,一次可以存在于实体间的关系数量。
12.4 电子商务
电子商务(electronic commerce):使用万维网买卖物品及服务的过程。
12.5 大数据
大数据(big data):不能够使用传统管理方法(如电子表格和数据库)处理的大数据集。
第13章 人工智能
13.1 思维机
人工智能(Artificial Intelligence,AI):研究对人类思想建模和应用人类智能的计算机系统的学科。
13.1.1 图灵测试
图灵测试(Turing test):一种行为方法,用于判断一个计算机系统是否智能。
这个测试的假设是如果计算机能够瞒过足够多的人,那么就可以把它看作是智能的。
通过图灵测试的计算机具有弱等价性,有的AI研究人员断言,只有实现了强等价性,才可能存在真正的人工智能。
弱等价性(weak equivalence):两个系统基于其结果的等价性。
强等价性(strong equivalence):两个系统基于其结果和实现这种结果的处理方法的等价性。
纽约的慈善家Hugh Loebner组织了首次正式的图灵测试。
Loebner奖(Loebner prize):正式的图灵测试,每年举行一次。
聊天机器人(chatbot):用于执行人机对话的程序。
13.1.2 问题等各个方面
- 知识表示
- 专家系统
- 神经网络
- 自然语言处理
- 机器人学
13.2 知识表示
13.2.1 语义网
语义网(semantic network):表示对象之间关系的知识表示法。
13.2.2 检索树
检索树(search tree):表示对抗性情况(如博弈)中的所有选择的结构。
书中举简化版的Nim游戏的检索树的例子。
深度优先法(depth-first approach):优先沿着树的路径向下检索,而不是优先横向检索每层的检索法。
广度优先法(breadth-first approach):优先横向检索树的每层,而不是优先向下检索特定路径的检索法。
13.3 专家系统
基于知识的系统(knowledge-based system):使用特定信息集合的软件。
专家系统(expert system):基于人类专家的知识的软件系统。
专家系统使用一套规则来指导处理。
基于规则的系统(rule-based system):基于一套if-then规则的软件系统。
推理机(inference engine):处理规则以得出结论的软件。
优点:面向目标、非常有效。
13.4 神经网络
人工神经网络(artificial neural network):尝试模拟人体神经网络的计算机知识表示法。
13.4.1 生物神经网络
生物神经网络
13.4.2 人工神经网络
人工神经网络中的每个处理元素都类似于一个生物神经元。
有效权(effective weight):人工神经元中输入值和相应的权值的乘积之和。
每一个元素都有一个数字阈值,元素的有效权将与这个阈值进行比较。如果有效值大于阈值,这个元素将生成1。如果有效权小于等于阈值,该元素将生成0。
训练(training):调整神经网络中的权和阈值以实现想要的结果的过程。
13.5 自然语言处理
人机语音交互过程中的三种基本处理类型:
- 语音识别
- 自然语言理解
- 语音合成
语音识别(voice recognition):用计算机来识别人类所讲的话。
自然语言理解(natural language comprehension):用计算机对人类传达的信息做出合理的解释。
语音合成(voice synthesis):用计算机制造出人类的语音。
计算机首先必须识别出独立的单词,其次理解这些单词的含义,最后(确定了答案后)生成组成响应的单词。
自然语言(natural language):人们用于交流的语言,如英语。
13.5.1 语音合成
两种基本解决方法——动态语音合成和录制语言。
音素(phoneme):任何指定的语言中的基本声音单元的集合。
13.5.2 语音识别
声波纹(voiceprint):表示人声随着时间的推移的频率变化的图。
13.5.3 自然语言理解
词法二义性(lexical ambiguity):由于单词具有多个含义而造成的二义性。
句法二义性(syntactic ambiguity):由于句子的构造方式有多种而造成的二义性
指代二义性(referential ambiguity):由于代词可以指代多个对象而造成的二义性。
13.6 机器人学
机器人学是研究机器人的科学,可以把机器人分为两大类——固定机器人和可移动机器人。
13.6.1 感知-规划-执行范型
13.6.2 包孕体系结构
13.6.3 物理部件
机器人是由传感器、执行器和计算部件(一个微处理器)构成的。
第14章 模拟、图形学、游戏和其他应用
14.1 什么是模拟
模拟(simulation):设计复杂系统的模型并为观察结果而对该模型进行实验。
14.1.1 复杂系统
最适合模拟的系统是动态的、交互式的和复杂的系统。
14.1.2 模型
模型(model):真实系统的抽象,是系统中的对象和管理这些对象相互作用的规则的表示。
14.1.3 构造模型
1.连续模拟
2.离散事件模拟
14.2 特殊模型
14.2.1 排队系统
1.请等待
2.一个示例
3.其他类型的队列
14.2.2 气象模型
1.天气预报
2.飓风跟踪
3.专用模型
14.2.3 计算生物学
计算生物学(computational biology):一种通过计算机、应用数学以及统计学的知识解决生物学问题的交叉性学科。
14.2.4 其他模型
14.2.5 必要的计算能力
14.3 计算机图形学
14.3.1 光的工作原理
14.3.2 物体形状
14.3.3 光模拟
14.3.4 复杂对象的建模
14.3.5 让物体动起来
14.4 游戏
计算机游戏(computer gaming):计算机模拟的虚拟世界。
14.4.1 游戏的历史
游戏玩法(gameplay):玩家在游戏过程中交互与体验的类型。
14.4.2 创建虚拟世界
游戏引擎(game engine):创造计算机游戏的软件系统。
14.4.3 游戏设计与开发
14.4.4 游戏编程
小结
本部分内容依旧偏向理论研究,实际可操作部分较少,多读即理解。