一、操作数据库(以SQLite3为例)
SQLite3 可使用 sqlite3 模块与 Python 进行集成。sqlite3 模块是由 Gerhard Haring 编写的。它提供了一个与 PEP 249 描述的 DB-API 2.0 规范兼容的 SQL 接口。我们不需要单独安装该模块,因为 Python 2.5.x 以上版本默认自带了该模块。
为了使用 sqlite3 模块,首先必须创建一个表示数据库的连接对象,然后可以有选择地创建光标对象,这将帮助执行所有的 SQL 语句。
API |
描述 |
sqlite3.connect(database [,timeout ,other optional arguments]) |
该 API 打开一个到 SQLite 数据库文件 database 的链接。您可以使用 ":memory:" 来在 RAM 中打开一个到 database 的数据库连接,而不是在磁盘上打开。如果数据库成功打开,则返回一个连接对象。 当一个数据库被多个连接访问,且其中一个修改了数据库,此时 SQLite 数据库被锁定,直到事务提交。timeout 参数表示连接等待锁定的持续时间,直到发生异常断开连接。timeout 参数默认是 5.0(5 秒)。 如果给定的数据库名称 filename 不存在,则该调用将创建一个数据库。如果您不想在当前目录中创建数据库,那么您可以指定带有路径的文件名,这样您就能在任意地方创建数据库。 |
connection.cursor([cursorClass]) |
该例程创建一个 cursor,将在 Python 数据库编程中用到。该方法接受一个单一的可选的参数 cursorClass。如果提供了该参数,则它必须是一个扩展自 sqlite3.Cursor 的自定义的 cursor 类。 |
cursor.execute(sql [, optional parameters]) |
该例程执行一个 SQL 语句。该 SQL 语句可以被参数化(即使用占位符代替 SQL 文本)。sqlite3 模块支持两种类型的占位符:问号和命名占位符(命名样式)。 例如:cursor.execute("insert into people values (?, ?)", (who, age)) |
connection.execute(sql [, optional parameters]) |
该例程是上面执行的由光标(cursor)对象提供的方法的快捷方式,它通过调用光标(cursor)方法创建了一个中间的光标对象,然后通过给定的参数调用光标的 execute 方法。 |
cursor.executemany(sql, seq_of_parameters) |
该例程对 seq_of_parameters 中的所有参数或映射执行一个 SQL 命令。 |
connection.executemany(sql[, parameters]) |
该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executemany 方法。 |
cursor.executescript(sql_script) |
该例程一旦接收到脚本,会执行多个 SQL 语句。它首先执行 COMMIT 语句,然后执行作为参数传入的 SQL 脚本。所有的 SQL 语句应该用分号(;)分隔。 |
connection.executescript(sql_script) |
该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executescript 方法。 |
connection.total_changes() |
该例程返回自数据库连接打开以来被修改、插入或删除的数据库总行数。 |
connection.commit() |
该方法提交当前的事务。如果您未调用该方法,那么自您上一次调用 commit() 以来所做的任何动作对其他数据库连接来说是不可见的。 |
connection.rollback() |
该方法回滚自上一次调用 commit() 以来对数据库所做的更改。 |
connection.close() |
该方法关闭数据库连接。请注意,这不会自动调用 commit()。如果您之前未调用 commit() 方法,就直接关闭数据库连接,您所做的所有更改将全部丢失! |
cursor.fetchone() |
该方法获取查询结果集中的下一行,返回一个单一的序列,当没有更多可用的数据时,则返回 None。 |
cursor.fetchmany([size=cursor.arraysize]) |
该方法获取查询结果集中的下一行组,返回一个列表。当没有更多的可用的行时,则返回一个空的列表。该方法尝试获取由 size 参数指定的尽可能多的行。 |
cursor.fetchall() |
该例程获取查询结果集中所有(剩余)的行,返回一个列表。当没有可用的行时,则返回一个空的列表。 |
接下来演示一些关于数据库的基础操作
• 连接数据库
下面操作是连接到一个现有的数据库,如果数据库不存在,则它会被创建,最后将返回一个数据库对象。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 5 print("Opened database successfully")
如果数据库成功创建,那么会显示此语句:
Open database successfully
• 创建表
下面操作是在先前创建的数据库中创建一个表。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 print("Opened database successfully") 5 c = conn.cursor() 6 c.execute('''CREATE TABLE COMPANY 7 (ID INT PRIMARY KEY NOT NULL, 8 NAME TEXT NOT NULL, 9 AGE INT NOT NULL, 10 ADDRESS CHAR(50), 11 SALARY REAL);''') 12 print("Table created successfully") 13 conn.commit() 14 conn.close()
• INSERT操作
下面操作是在先前创建的表中创建记录。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 c = conn.cursor() 5 print("Opened database successfully") 6 7 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) 8 VALUES (1, 'Paul', 32, 'California', 20000.00 )"); 9 10 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) 11 VALUES (2, 'Allen', 25, 'Texas', 15000.00 )"); 12 13 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) 14 VALUES (3, 'Teddy', 23, 'Norway', 20000.00 )"); 15 16 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) 17 VALUES (4, 'Mark', 25, 'Rich-Mond ', 65000.00 )"); 18 19 conn.commit() 20 print("Records created successfully") 21 conn.close()
• SELECT操作
下面操作是获取先前创建表的数据并显示。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 c = conn.cursor() 5 print("Opened database successfully") 6 7 cursor = c.execute("SELECT id, name, address, salary from COMPANY") 8 for row in cursor: 9 print("ID = ", row[0]) 10 print("NAME = ", row[1]) 11 print("ADDRESS = ", row[2]) 12 print("SALARY = ", row[3], " ") 13 14 print("Operation done successfully") 15 conn.close()
效果如下:
• UPDATE操作
下面操作是使用UPDATE语句更新任何记录,然后从表中获取并显示更新的记录。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 c = conn.cursor() 5 print("Opened database successfully") 6 7 c.execute("UPDATE COMPANY set SALARY = 25000.00 where ID=1") 8 conn.commit() 9 print("Total number of rows updated :", conn.total_changes) 10 11 cursor = conn.execute("SELECT id, name, address, salary from COMPANY") 12 for row in cursor: 13 print("ID = ", row[0]) 14 print("NAME = ", row[1]) 15 print("ADDRESS = ", row[2]) 16 print("SALARY = ", row[3], " ") 17 18 print("Operation done successfully") 19 conn.close()
效果如下:
• DELETE操作
下面操作是使用DELETE语句删除任何记录,然后从表中获取并显示剩余的记录。
1 import sqlite3 2 3 conn = sqlite3.connect('test.db') 4 c = conn.cursor() 5 print("Opened database successfully") 6 7 c.execute("DELETE from COMPANY where ID=2;") 8 conn.commit() 9 print("Total number of rows deleted :", conn.total_changes) 10 11 cursor = conn.execute("SELECT id, name, address, salary from COMPANY") 12 for row in cursor: 13 print("ID = ", row[0]) 14 print("NAME = ", row[1]) 15 print("ADDRESS = ", row[2]) 16 print("SALARY = ", row[3], " ") 17 18 print("Operation done successfully") 19 conn.close()
效果如下:
二、实例操作(2015大学排名)
根据上周作业,制作了2015年大学排名的csv文件,下面的操作都将基于该csv文件进行。
• 将csv文件写入数据库
代码如下:
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri May 31 12:33:56 2019 4 5 @author: Regan_White_Lin 12 6 """ 7 8 import pandas 9 import sqlite3 10 conn= sqlite3.connect("2015大学排名(12).db") 11 k = pandas.read_csv('2015中国大学排名爬虫.csv',encoding='gbk') 12 k.to_sql('University', conn, if_exists='append', index=False) 13 print('success') 14 conn = sqlite3.connect('2015大学排名(12).db') 15 cur = conn.cursor() 16 cur.execute('SELECT * FROM University') 17 li = cur.fetchall() 18 i=0 19 for line in li: 20 i+=1 21 for item in line: 22 print(item, end=' ') 23 print() 24 if i==192: 25 break 26 conn.close()
输出结果:
数据较多,在此便不一一展示了。
• 查询本校排名及得分
代码如下:
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri May 31 12:54:03 2019 4 5 @author: Regan_White_Lin 12 6 """ 7 8 import sqlite3 9 conn= sqlite3.connect("2015大学排名(12).db") 10 cur = conn.cursor() 11 cur.execute('SELECT * FROM University') 12 li = cur.fetchall() #返回所有查询结果 13 for line in li: 14 if "广东技术师范大学" in line: 15 print(line) 16 break 17 else: 18 print("查无该校数据") 19 conn.close()
输出结果:
后来我自己自行在该csv文件中寻找“广东技术师范大学”,发现真的没有排名(非常难受),为了确定是真的没有而非程序本身问题,我再查询了一下中山大学,得到的结果是这样的:
看来程序本身没有问题,确实可以查找学校数据。
• 查询并显示广东省学校的排名及得分
代码如下:
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri May 31 13:07:46 2019 4 5 @author: Regan_White_Lin 12 6 """ 7 8 import sqlite3 9 conn= sqlite3.connect("2015大学排名(12).db") 10 cur = conn.cursor() 11 cur.execute('SELECT * FROM University') 12 li = cur.fetchall() #返回所有查询结果 13 for line in li: 14 if "广东" in line: 15 print("{} {} {} {}".format(line[0],line[1],line[2],line[5])) 16 conn.close()
输出结果:
三、对广东省内大学的排名
在上面,我们已经输出了广东省内大学的名单,但是它们的排序方式仍然是原始的综合排名,而我们想要让名单根据某一特定方式排序(即根据各项数据进行权重分配,权重大的优先排序,次者次排序以此类推),首先将得到的名单先输出为csv文件格式,再将它写入数据库的一个新表中。
代码(输出为csv格式文件)如下:
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri May 31 13:07:46 2019 4 5 @author: Regan_White_Lin 12 6 """ 7 8 import sqlite3 9 import pandas 10 def saveAsCsv(filename, tabel_list): 11 FormData = pandas.DataFrame(tabel_list) 12 FormData.columns = ["排名","学校名称","省市","总分","生源质量","培养结果","人才培养得分"] 13 FormData.to_csv(filename,encoding="gbk") 14 15 conn= sqlite3.connect("2015大学排名(12).db") 16 cur = conn.cursor() 17 cur.execute('SELECT * FROM University') 18 li = cur.fetchall() 19 #返回所有查询结果 20 list=[] 21 for line in li: 22 if "广东" in line: 23 list.append(line) 24 print("{} {} {} {}".format(line[0],line[1],line[2],line[5])) 25 saveAsCsv("2015广东大学排名爬虫.csv", list) 26 conn.close()
代码(将数据写入数据库的新表)如下:
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri May 31 12:33:56 2019 4 5 @author: Regan_White_Lin 12 6 """ 7 8 import pandas 9 import sqlite3 10 conn= sqlite3.connect("2015大学排名(12).db") 11 k = pandas.read_csv('2015广东大学排名爬虫.csv',encoding='gbk') 12 k.to_sql('Guangdong', conn, if_exists='append', index=False) 13 print('success') 14 conn = sqlite3.connect('2015大学排名(12).db') 15 cur = conn.cursor() 16 cur.execute('SELECT * FROM Guangdong') 17 li = cur.fetchall() 18 i=0 19 for line in li: 20 i+=1 21 for item in line: 22 print(item, end=' ') 23 print() 24 if i==10: 25 break 26 conn.close()
效果如下:
根据培养结果,从高到低排序结果如下: