gitbook/Python自动化办公实战课/docs/357161.md
2022-09-03 22:05:03 +08:00

17 KiB
Raw Blame History

21SQLite文本数据库如何进行数据管理

你好,我是尹会生。

你在办公中一定遇到过需要数据持久化的问题。数据持久化简单来说就是当你关闭程序的时候数据依然可以完整地保存在电脑中。你可能会想到用文本文件、Excel来存储这些数据文本呢没有办法按列读写数据Excel呢支持的默认API无法进行复杂查询。所以我今天要给你介绍一个功能强大但编写代码又简单的数据库SQLite。

你可以用SQLite存储结构化的数据把程序的处理结果保存到电脑中便于下次或使用新的程序对这些数据进行访问。

用SQLite存储结构化的数据包括增删改查这些操作。所以今天这节课我就教你怎么来使用函数封装SQL语句实现数据的读取和写入下一节课我们再来学习如何通过类实现复杂的SQL语句的封装以及如何更新和删除数据。

在讲解这些之前考虑到SQLite在持久化数据存储的重要性我想要先给你介绍SQLite的优势。

使用SQLite代替文本和Excel有哪些优势

也许你对SQLite这个名字还很陌生但其实你早就在手机、智能电视、机顶盒等电子设备中用到过它了比如手机上的通讯录就是使用SQLite存储联系人的。

SQLite中存储的内容是结构化数据像是通讯录、企业ERP数据、财务数据等这些存储和排列很有规律的数据就被称作结构化数据。类似Excel的格式一样分为“行”和“列”。以存储通讯录为例每一列会提前指定好哪一列存放姓名、哪那一列存放电话号码而每一行就是一个联系人的姓名和电话的具体记录。

在自动化办公中你可以把结构化数据存放到SQLite中它的处理速度和文件体积上要比文本文件和Excel更有优势。它会比文本文件的处理速度更快比Excel需要的空间更少。甚至有人将SQLite应用到了每天点击量在10万次的网站上足见它的稳定和高效的处理效率。

SQLite和你听说过的大型数据库Oracle、MySQL数据库不同它更多是面向办公场景和移动设备的所以它有大型数据库的稳定、高效、支持SQL语言的特性但是也要比大型数据库学习起来更加简单。

正是由于它拥有数据库的特性所以从SQLite中查找数据要比从文本文件中更快。而且它的数据还满足数据库必需的“增删改查”但不支持设置字体、字号所以存储一条数据所使用的空间会比Excel更小。这些特性叠加起来就刚好形成了SQLite的特有优势

  1. 数据查询速度快;
  2. 存放数据的空间占用少;
  3. 实现了一般数据库能够支持的基于SQL语言的增删改查。

总结来说就是如果你需要存放结构化的数据而且只关注数据读取的效率不关注数据的样式而且还需要编程语言来进行数据访问的话使用SQLite要比文本文件、Excel更适合你的办公场景。

我为你介绍了SQLite这么多好处那赶快带着你把它用起来吧。

为SQLite建立数据表

要想使用SQLite数据库光有文件还不够你还要为它建立数据表类似你新建了一个Excel工作簿的文件与此同时你还要建立一个工作表把数据写在工作表上 再将多张工作表放在工作簿上面。

因此要想实现对数据库的操作我也需要为SQLite创建一张工作表接下来我就用一个创建手机通讯录数据表的脚本为你演示一下我是如何为SQLite数据库创建它的“工作表”的。

SQLite建立数据表的一般流程

为了能够让你更具体地学习数据表是怎样创建和使用的我先把创建数据表的代码写出来给你对照代码我来为你讲解SQLite建立数据表的流程。

import sqlite3
import pathlib

# 数据库文件的路径和文件名称
dir = pathlib.PurePath(__file__).parent
db = pathlib.PurePath(dir, "contents.db")

# 创建连接
conn = sqlite3.connect(db)

# 创建游标
cur = conn.cursor()

# 定义要执行的SQL语句
sql = '''CREATE TABLE address_book(
        id INT PRIMARY KEY NOT NULL,
        name TEXT NOT NULL,
        phone INT NOT NULL
       )'''

# 执行SQL
try:
    cur.execute(sql)
    print("创建成功")
except Exception as e:
    print("创建失败")
    print(f"失败原因是:{e}")
finally:
    # 关闭游标
    cur.close()
    # 关闭连接
    conn.close()


这段代码实现了连接SQLite数据库并创建通讯录数据表的功能。要想使用SQLite数据库你需要掌握四个步骤我来带你依次学习。

第一步,连接数据库文件。

连接数据库文件有两种情况数据库文件不存在和数据库文件已经存在。如果数据库文件不存在那么第一次连接时就会建立一个空的数据库文件你需要注意的是创建时要确保Python程序对操作数据库文件的目录有写入权限否则会因权限不足而创建失败。另一种情况如果数据库文件已经存在则会直接打开数据库文件相应的数据库文件中已经建立的表和数据也可以直接进行操作。

我在代码中演示的是数据库文件不存在的情况。为了便于你观察数据库是否被创建成功,我在代码中使用了之前学习过的“file”变量将数据库文件contents.db和脚本放在了相同的目录。

第二步,创建游标。

游标它的官方定义叫做操作行指针。它是第一次接触数据库的人最难理解的概念其实你可以想象一下当你只能按行操作Excel时你可以一次选中一行也可以一次选中多行。而游标就是记录你当前选中的到底是哪一行。

在计算机中记录当前选中的行,是需要占用内存的,因此,你必须先声明一个游标对象,利用这一对象申请计算机内存来记录你当前的行数,用于后续对选中行继续操作。

创建游标的函数是cursor(),创建之后,一般会将它赋值给一个变量,后续操作可以利用变量来再次引用创建好的游标。

第三步执行SQL语句。

SQL语句是和SQLite数据库“打交道”的主要形式你需要通过SQL语句来操纵数据库。在上面的代码中我就在代码的15行定义了一个创建表的SQL语句在代码的第23行通过“excute()”函数运行该语句运行之后就可以为SQLite创建表了。

第四步,关闭游标和连接。

当你完成对数据库的操作后,就需要手动关闭游标和连接,来正确退出数据库,这样可以避免在内存中数据还未来得及写入磁盘时,由于突然关闭进程导致数据丢失。

以上四个步骤是创建数据表的基本操作也是SQLite乃至其他数据库使用SQL语句的通用步骤你需要记住这种模式这样你在使用Python来操作各种数据库时保证数据的持久化。

我在代码中还使用了一个小技巧,叫做异常捕获。通过异常捕获你可以在程序运行过程出现问题时,及时对问题进行处理。

捕获异常就像是你在森里中捕猎,猎物就是森林中你无法预知什么时候会出现的小动物。而捕获它们的方法,就是在猎物必经之路上设置陷阱。如果没有出现猎物,一切照常;如果出现了猎物,就会被陷阱捕获到。

例如我在代码中设置的陷阱就是“try”语句块当这一语句块中的“excute()”在执行时如果出错那么它后面的语句不会再继续执行而是直接转向except语句。并且你会得到你的“猎物”--产生异常的原因“Exception”类。你可以像我一样将它重新命名为“e”并输出到终端帮你定位这一错误产生的原因。

相信你还记得我在讲操作SQLite四个必要步骤时提到的最后一个步骤你不能因为出现错误而“忘记”关闭游标和数据库所以在“try”“except”语句中还有一个和它们配合使用的“finally”语句它的作用是无论是否抛出异常“finally”语句块下的代码都会被执行。

你看增加了异常处理的数据库处理流程就要比原始的代码更加健壮。因此我建议你在进行数据库操作时务必要为执行SQL语句的部分增加异常处理因为它关系到你的数据是否能够安全的被保存到硬盘中。

建立数据表的SQL语句

在你了解了SQLite的一般流程之后我再为你讲解一下建立数据表的SQL语句。

SQL语句类似你使用“open()”函数打开文件之后对文件内容执行的各种操作。根据不同的标准它有不同的语法格式。SQLite能够支持的是大部分的SQL92标准触发器和可写视图不被支持因此你可以使用符合SQL92标准的语句创建、删除表并对数据进行增删改查的基本操作。

创建一张数据表使用的SQL语句是“CREATE TABLE 表名称 (包括表的字段、字段类型和约束条件)。我还是以创建通讯录的表为例:

 CREATE TABLE address_book(
        id INT PRIMARY KEY NOT NULL,
        name TEXT NOT NULL,
        phone INT NOT NULL
        )

这条语句的“address_book”是表名称它有三个字段也可以称作是三列数据分别为id、name和phone。而每个字段都由字段名称、字段类型和可选的约束条件三部分组成。

  1. 字段名称,是用于操作表时方便进行列操作的名字。
  2. 字段类型会限制你对该字段写入数据的类型如果类型不正确会报错或被填入空值。SQLite能支持的类型非常多我在示例中使用了最常见的整数和字符串其他类型你可以通过官方文档来了解。
  3. 约束条件是对该列强制执行的规则。例如我使用了“NOT NULL”约束确保在数据写入时该字段不能为空值。同时我还使用了“PRIMARY KEY”确保了字段唯一性确保该字段的值不会重复。更多的约束条件你同样可以根据官方文档来了解。

通过创建SQLite的数据表我为你讲解了操作SQLite的基本流程中已经用到的SQL语句以及如何使用异常捕获来使程序更加健壮特别是像操作数据的程序你要保证它在运行时出现的任何错误能在第一时间发现这样才可以尽可能保证你的数据完整。

为了对数据实现操作,你还要在掌握创建表的基础上实现数据的增删改查,而其中的写入和查询是实际工作场景中对数据库最多的操作,接下来我就来带你学习一下写入和查询操作需要用到的SQL语句。

使用SQL实现对SQLite的写入和查询

对一个数据库的各种操作查询一般会占到70%,而且大部分对数据的修改操作其实都隐含着查询。所以说查询是数据库中最重要的操作也不为过。

对SQLite数据库的表实现写入和查询分别要使用“INSERT”和“SELECT” SQL语句接下来我还是以通讯录的数据表为例先为你插入通讯录汇总的联系人然后通过查询的“SELECT”语句取出表中的联系人信息通过这样的例子来给你演示一下怎么为SQLite数据库进行数据的写入和查询。

数据的写入

首先我为通讯录添加一个联系人Tom它的实现代码如下

import sqlite3
import pathlib

# 数据库文件的路径和文件名称
dir = pathlib.PurePath(__file__).parent
db = pathlib.PurePath(dir, "contents.db")

# 创建连接
conn = sqlite3.connect(db)

# 创建游标
cur = conn.cursor()

# 定义要执行的SQL语句
sql1 = '''INSERT INTO address_book
          VALUES (?, ?, ?)'''
v =  (1, "Tom", 12377778888)

# 执行SQL
try:
    cur.execute(sql1, v)
    conn.commit()

except Exception as e:
    print(f"失败原因是:{e}")

finally:
    # 关闭游标
    cur.close()
    # 关闭连接
    conn.close()


通过执行这段代码你可以给通讯录增加一个用户“Tom”以及他的电话号码“12377778888”。在这段数据写入的代码中有两点需要你注意分别是SQL语句和数据的拆分以及写入后的提交功能。

SQL语句和数据的拆分是指用于写入数据的SQL语句“INSERT”语句与真正要写入表中的数据需要保存在不同的变量中。当它们在真正执行SQL语句的那一刻才会由excute ()函数进行合并。

写入两个变量的好处在于数据往往是经过计算或用户输入得到的而SQL语句是可以复用的把数值脱离SQL语句可以更方便地在Python中进行处理。所以我也建议你在进行数据写入时都采用这种拆分数据和SQL语句的方法这样会比一条SQL语句中既包含INSERT语句又包含数据灵活性上要提高很多。

另一个需要注意的是在执行SQL语句写入表之后需要使用commit()函数进行数据提交。这是SQLite的事务机制导致的因为使用事务可以避免数据不一致的情况。

事务其实是个比较大的话题也是一个比较系统的工程要想把事务的细节讲清楚那就能写一本书了。不过由于SQLite没有支持较为完整的事务以及办公自动化场景所以今天这节课我就不展开为你讲解事务的概念了这也并不影响你对今天这节课的理解。

数据的查询

在实现了数据写入之后我们继续来看一下如何使用SQL实现数据的读取。从SQLite读取数据的代码如下

import sqlite3
import pathlib

# 数据库文件的路径和文件名称
dir = pathlib.PurePath(__file__).parent
db = pathlib.PurePath(dir, "contents.db")

# 创建连接
conn = sqlite3.connect(db)

# 创建游标
cur = conn.cursor()

# 定义要执行的SQL语句
sql2 = '''SELECT phone FROM address_book WHERE name = "Tom" ''' 

# 执行SQL
try:
    result = cur.execute(sql2)
    print(result.fetchone())

except Exception as e:
    print(f"失败原因是:{e}")

finally:
    # 关闭游标
    cur.close()
    # 关闭连接
    conn.close()


这段代码使用了“SELECT”SQL语句实现了联系人“Tom”的手机号码读取。“SELECT”语句执行后会把结果放到“result”变量中。由于取出的结果是一个对象因此还需要通过fetchone() 函数,把对象中的一行取出,得到用户的手机号码。

那在这一查找流程中我们要重点关注的就是“SELECT”语句它是实现读取内容的语句。在任何一个数据库中它都是最常用的SQL语句。我们从它的结构开始分析。

SELECT phone FROM address_book WHERE name = "Tom" 

这条语句的执行顺序和书写顺序是不同的它的执行顺序是从“FROM”到“WHERE”再到“SELECT”关键字。它们三个的含义分别是

  1. FROM从一张表中查找数据用于来指定查询的表。
  2. WHERE表示查询的条件是什么。在这个例子中查询条件是name字段的值为“Tom”字符串。
  3. SELECT显示哪一列。在这个例子中只显示phone这一字段的值。

“SELECT”语句按照代码中的顺序实现了电话号码的查找。当然了这只是个非常简单的查找而你在工作中肯定会遇到更加复杂的查找我也会在下一讲教你怎样使用Python来为更加复杂的查询编写高效的代码。如果你想要更加深入的学习SELECT语句可以参考官方文档

官方文档中会有“SELECT”中其他语句的执行顺序和功能介绍并且还采用了流程图方式来为你介绍它的子句之间是如何进行组合的。如下图

小结

最后让我来为你总结一下在本讲中我使用了SQLite数据库为你讲解了数据库对比文本文件和Excel的优势它在存储结构化数据方面已经作为了业界的标准解决方案。

想要用好SQLite你还要掌握数据库的四个操作步骤那就是

  1. 连接数据库文件
  2. 创建游标
  3. 执行SQL语句
  4. 关闭游标和连接

这四个步骤是实现一切数据库操作的基础在掌握四个操作步骤的基础上实现数据操作的SQL语句包括增删改查四种操作在本讲中我为你讲解了如何使用SQL实现SQLite的读写下一讲将为你讲解更加复杂的SQL语句以及修改和删除的SQL语句。

查找和写入作为最常用的SQL语句是需要你重点掌握的。除了存储通讯录数据像是我们从网络批量下载的数据以及工作中的员工信息表等数据都可以采用SQLite存放。它将是以后你存储结构化数据最实用的工具。

思考题

按照惯例我为你出一道思考题如果使用SELECT语句查询到的结果不止一条使用fetchone()函数得到的是什么样的呢?你能否通过官方文档再找到获得多条查询结果的函数呢?

欢迎把你的想法和思考写在留言区,我们一起交流讨论。如果这节课在数据保存上帮你提高了办公效率,那也欢迎你把课程分享给你的朋友或同事,我们一起做职场上的效率人。