[toc]
将DataFrame保存为MySQL
要将pandas DataFrame保存到MySQL数据库中,可以使用Python的SQLAlchemy库来实现。下面是一系列的步骤来完成这个过程:
- 安装所需的库:确保已经安装了pandas、SQLAlchemy和MySQL驱动程序(如pymysql)。
- 导入所需的库:在代码中导入必要的库。
1
2import pandas as pd
from sqlalchemy import create_engine- 创建一个MySQL连接:使用SQLAlchemy创建一个MySQL连接。你需要根据你的数据库设置来修改下面的代码。确保将
username
、password
、localhost
、port
和database_name
替换为你自己的MySQL连接参数。
1
engine = create_engine('mysql+pymysql://username:password@localhost:port/database_name')
- 将DataFrame保存到数据库:使用
to_sql
函数将DataFrame保存到数据库中。确保将df
替换成你要保存的DataFrame,table_name
替换成你想要在数据库中创建的表的名称。if_exists
参数可以设置为以下几个选项之一: - “fail”:如果表已经存在,则抛出一个异常(默认) - “replace”:如果表已经存在,则替换掉原有的表 - “append”:如果表已经存在,则将数据追加到表中index
参数设置为False
可以在保存数据时避免将DataFrame的索引作为一个额外的列。
1
df.to_sql('table_name', con=engine, if_exists='replace', index=False)
- 整体的代码示例如下:
1
2
3
4
5
6
7
8import pandas as pd
from sqlalchemy import create_engine
# 创建一个MySQL连接
engine = create_engine('mysql+pymysql://username:password@localhost:port/database_name')
# 将DataFrame保存到数据库
df.to_sql('table_name', con=engine, if_exists='replace', index=False)
DataFrame 基本操作
1 | import pandas as pd |
DataFrame.plot
1 | data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], |
DataFrame表格(列)拼接
concat
1 | concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False,copy=True) |
- 部分参数说明:
axis:拼接轴方向,默认为0,沿行拼接;若为1,沿列拼接
join:默认外联’outer’,拼接另一轴所有的label,缺失值用NaN填充;内联’inner’,只拼接另一轴相同的label;
join_axes: 指定需要拼接的轴的labels,可在join既不内联又不外联的时候使用
ignore_index:对index进行重新排序
keys:多重索引
1 | import pandas as pd |