更新时间:2022-07-11 来源:黑马程序员 浏览量:
大多数情况下,海量的数据是使用数据库进行存储的,这主要是依赖于数据库的数据结构化、数据共享性、独立性等特点。因此,在实际生产环境中,绝大多数数据都是存储在数据库中。Pandas支持MySQL、Oracle、SQLite等主流数据库的读写操作。
为了高效地对数据库中的数据进行读取,这里需要引入SQLAlchemy。SQLALchemy是使用Python编写的一款开源软件,它提供的SQL工具包和对象映射工具能够高效地访问数据库。在使用SQLAlchemy时需要使用相应的连接工具包,比如MySQL需要安装mysqlconnector,Oracle则需要安装cx_oracle。
Pandas的io.sql模块中提供了常用的读写数据库函数,具体如下。
1.read_sql_table():读取的整张数据表中的数据转换成DataFrame对象。
2.read_sql_query():将SQL语句读取的结果转换成DataFrame对象。
3.read_sql():上述两个函数的结合,既可以读数据表也可以读SQL语句。
4.to_sql():将数据写入到SQL数据库中。
上述列举了各个函数的具体功能。其中,read_sql_table()函数与read_sql_query()函数都可以将读取的数据转换为DataFrame对象,前者表示将整张表的数据转换成DataFrame,后者则表示将执行SQL语句的结果转换为DataFrame对象。
注意:在连接MySQL数据库时,这里使用的是mysqlconnector驱动,如果当前的Python环境中没有该模块,则需要使用pip install mysql-connector命令安装该模块。