zoukankan      html  css  js  c++  java
  • 自己设计大学排名-数据库实践

    一、操作数据库(以SQLite3为例) :  

    SQLite3 可使用 sqlite3 模块与 Python 进行集成。它提供了一个与 PEP 249 描述的 DB-API 2.0 规范兼容的 SQL 接口。我们不需要单独安装该模块,因为 Python 2.5.x 以上版本默认自带了该模块。 为了使用 sqlite3 模块,首先必须创建一个表示数据库的连接对象,然后可以有选择地创建光标对象,这将帮助执行所有 的 SQL 语句

    API

    描述

    sqlite3.connect(database [,timeout ,other optional arguments])

    该 API 打开一个到 SQLite 数据库文件 database 的链接。您可以使用 ":memory:" 来在 RAM 中打开一个到 database 的数据库连接,而不是在磁盘上打开。如果数据库成功打开,则返回一个连接对象。

    当一个数据库被多个连接访问,且其中一个修改了数据库,此时 SQLite 数据库被锁定,直到事务提交。timeout 参数表示连接等待锁定的持续时间,直到发生异常断开连接。timeout 参数默认是 5.0(5 秒)。

    如果给定的数据库名称 filename 不存在,则该调用将创建一个数据库。如果您不想在当前目录中创建数据库,那么您可以指定带有路径的文件名,这样您就能在任意地方创建数据库。

    connection.cursor([cursorClass])

    该例程创建一个 cursor,将在 Python 数据库编程中用到。该方法接受一个单一的可选的参数 cursorClass。如果提供了该参数,则它必须是一个扩展自 sqlite3.Cursor 的自定义的 cursor 类。

    cursor.execute(sql [, optional parameters])

    该例程执行一个 SQL 语句。该 SQL 语句可以被参数化(即使用占位符代替 SQL 文本)。sqlite3 模块支持两种类型的占位符:问号和命名占位符(命名样式)。

    例如:cursor.execute("insert into people values (?, ?)", (who, age))

    connection.execute(sql [, optional parameters])

    该例程是上面执行的由光标(cursor)对象提供的方法的快捷方式,它通过调用光标(cursor)方法创建了一个中间的光标对象,然后通过给定的参数调用光标的 execute 方法。

    cursor.executemany(sql, seq_of_parameters)

    该例程对 seq_of_parameters 中的所有参数或映射执行一个 SQL 命令。

    connection.executemany(sql[, parameters])

    该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executemany 方法。

    cursor.executescript(sql_script)

    该例程一旦接收到脚本,会执行多个 SQL 语句。它首先执行 COMMIT 语句,然后执行作为参数传入的 SQL 脚本。所有的 SQL 语句应该用分号(;)分隔。

    connection.executescript(sql_script)

    该例程是一个由调用光标(cursor)方法创建的中间的光标对象的快捷方式,然后通过给定的参数调用光标的 executescript 方法。

    connection.total_changes()

    该例程返回自数据库连接打开以来被修改、插入或删除的数据库总行数。

    connection.commit()

    该方法提交当前的事务。如果您未调用该方法,那么自您上一次调用 commit() 以来所做的任何动作对其他数据库连接来说是不可见的。

    connection.rollback()

    该方法回滚自上一次调用 commit() 以来对数据库所做的更改。

    connection.close()

    该方法关闭数据库连接。请注意,这不会自动调用 commit()。如果您之前未调用 commit() 方法,就直接关闭数据库连接,您所做的所有更改将全部丢失!

    cursor.fetchone()

    该方法获取查询结果集中的下一行,返回一个单一的序列,当没有更多可用的数据时,则返回 None。

    cursor.fetchmany([size=cursor.arraysize])

    该方法获取查询结果集中的下一行组,返回一个列表。当没有更多的可用的行时,则返回一个空的列表。该方法尝试获取由 size 参数指定的尽可能多的行。

    cursor.fetchall()

    该例程获取查询结果集中所有(剩余)的行,返回一个列表。当没有可用的行时,则返回一个空的列表。

     二,数据库实践:

    根据上周作业,制作了2015年大学排名的csv文件,下面的操作都将基于该csv文件进行。

      •    将csv文件写入数据库

        代码如下:

     1 import pandas
     2 import sqlite3
     3 conn= sqlite3.connect("2015大学排名(12).db")
     4 k = pandas.read_csv('2015中国大学排名爬虫.csv',encoding='gbk')
     5 k.to_sql('University', conn, if_exists='append', index=False)
     6 print('success')
     7 conn = sqlite3.connect('2015大学排名(12).db')
     8 cur = conn.cursor()
     9 cur.execute('SELECT * FROM University')
    10 li = cur.fetchall()  
    11 i=0              
    12 for line in li:
    13     i+=1
    14     for item in line:
    15         print(item, end=' ')
    16         print()
    17         if i==192:
    18             break
    19         conn.close()

    输出结果:

    •    查询本校排名及得分

        代码如下:

     1 import sqlite3
     2 conn= sqlite3.connect("2015大学排名(12).db")
     3 cur = conn.cursor()
     4 cur.execute('SELECT * FROM University')
     5 li = cur.fetchall()                  #返回所有查询结果
     6 for line in li:
     7     if "广东技术师范大学" in line:
     8         print(line)
     9         break
    10     else11     print("查无该校数据")
    12 conn.close()

    结果:

     为什么会出现这种情况了,因为很显然在我们之前爬的软件排名的csv文件里面根本就没有“广东技术师范大学”

    •    查询并显示广东省学校的排名及得分

    代码如下:

    
    
     1 # -*- coding: utf-8 -*-
     2 """
     3 Created on Tue Jun 23 14:58:33 2020
     4 
     5 @author: 49594
     6 """
     7 
     8 import sqlite3
     9 conn= sqlite3.connect("2015大学排名(12).db")
    10 cur = conn.cursor()
    11 cur.execute('SELECT * FROM University')
    12 li = cur.fetchall()                  #返回所有查询结果
    13 for line in li:
    14     if "广东" in line:
    15         print("{} {} {} {}".format(line[0],line[1],line[2],line[5]))
    16 conn.close()

    结果如下所示:

    三、对广东省内大学的排名

      在上面,我们已经输出了广东省内大学的名单,但是它们的排序方式仍然是原始的综合排名,而我们想要让名单根据某一特定方式排序(即根据各项数据进行权重分配,权重大的优先排序,次者次排序以此类推),首先将得到的名单先输出为csv文件格式,再将它写入数据库的一个新表中。

    代码(输出为csv格式文件)如下:

     1 # -*- coding: utf-8 -*-
     2 """
     3 Created on Tue Jun 23 14:58:33 2020
     4 
     5 @author: 49594
     6 """
     7 
     8 import sqlite3
     9 import pandas
    10 def saveAsCsv(filename, tabel_list):
    11     FormData = pandas.DataFrame(tabel_list)
    12     FormData.columns = ["排名","学校名称","省市","总分","生源质量","培养结果","人才培养得分"]
    13     FormData.to_csv(filename,encoding="gbk")
    14 
    15 conn= sqlite3.connect("2015大学排名(12).db")
    16 cur = conn.cursor()
    17 cur.execute('SELECT * FROM University')
    18 li = cur.fetchall()
    19             #返回所有查询结果
    20 list=[]
    21 for line in li:
    22     if "广东" in line:
    23         list.append(line)
    24         print("{} {} {} {}".format(line[0],line[1],line[2],line[5]))
    25 saveAsCsv("2015广东大学排名爬虫.csv", list)
    26 conn.close()

    代码(将数据写入数据库的新表)如下:

     1 import pandas
     2 import sqlite3
     3 conn= sqlite3.connect("2015大学排名(12).db")
     4 k = pandas.read_csv('2015广东大学排名爬虫.csv',encoding='gbk')
     5 k.to_sql('Guangdong', conn, if_exists='append', index=False)
     6 print('success')
     7 conn = sqlite3.connect('2015大学排名(12).db')
     8 cur = conn.cursor()
     9 cur.execute('SELECT * FROM Guangdong')
    10 li = cur.fetchall()
    11 i=0
    12 for line in li:
    13     i+=1
    14     for item in line:
    15         print(item, end=' ')
    16     print()
    17     if i==10:
    18         break
    19 conn.close()

    结果如下:

     根据培养结果排名:

  • 相关阅读:
    爬取网易云音乐歌手和id
    【兼容调试】cffi library '_openssl' has no function, constant or global variable named 'Cryptography_HAS
    python如何去掉字符串‘xa0’
    python 中json和字符串互相转换
    vip视频播放
    一行Python代码画心型
    Java语言编写MD5加密方法,Jmeter如何给字符串MD5加密
    转载:oracle RAC集群启动和关闭
    转载:oracle 11g ADG实施手册(亲测,已成功部署多次)
    如何上传本地文件到github又如何删除自己的github仓库
  • 原文地址:https://www.cnblogs.com/zzalovelyq/p/13182187.html
Copyright © 2011-2022 走看看