




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第pandas学习之txt与sql文件的基本操作指南目录前言1.导入txt文件2.导入sql文件2.1安装依赖库pymysql3.小结总结
前言
Pandas是python的一个数据分析包,是基于NumPy的一种工具提供了大量数据结构和函数,可以很方便的处理结构化数据,常见数据结构有:
Series:一维数组,与Numpy中的一维array类似。
DataFrame:二维的表格型数据结构,可以将DataFrame理解为Series的容器
Time-Series:以时间为索引的Series
Panel:三维的数组,可以理解为DataFrame的容器
1.导入txt文件
本文所使用到的test.txt的内容如下:
使用read_table()方法导入txt文件
importpandasaspd
df=pd.read_table(r'C:\Users\admin\Desktop\test.txt')
print(df)
result:
我是李华。今天本来留下班里十几个人做大扫除结果他们都跑了,只留下了我一个人干完了所有活。回家的路上真不巧又下了雨,
0雨太大把我自行车前轮胎上的辐条都冲走了,我非常生气。为了报复今天发生的一切,我骑着钢圈回到...
1并把教室里的椅子都扔了出去。
该方法是将利用分隔符分开的文件导入DataFrame的通用函数。不仅可以导入.txt文件,也可以导入.csv文件。
df=pd.read_table(r'C:\Users\admin\Desktop\中文\数据分析测试表.csv')
print(df)
result:
区域,省份,城市
0东北,辽宁,大连
1西北,陕西,西安
2华南,广东,深圳
3华北,北京,北京
4华中,湖北,武汉
read_table()方法的其他参数用法和read_csv()方法基本一致,再此不再赘述。
2.导入sql文件
2.1安装依赖库pymysql
python连接MySQL要用到pymysql,需要手动进行安装。
importpandasaspd
importpymysql
con=pymysql.connect(host='127.0.0.1',#数据库地址,本机为127.0.0.1或localhost
user='root',#用户名
password='123456',#密码
db='test',#数据库名
charset='utf-8')#数据库编码,一般为utf-8
sql="select*fromemployees"
df=pd.read_sql(sql,con)
print(df)
此时报错
修改charset='utf8'后错误解决:
con=pymysql.connect(host='127.0.0.1',#数据库地址,本机为127.0.0.1或localhost
user='root',#用户名
password='123456',#密码
db='test',#数据库名
charset='utf8')#数据库编码,一般为utf-8
sql="select*fromemployees"
df=pd.read_sql(sql,con)
print(df)
result:
eIDNAMEsexbirthjobsfirJobhiredate
01张三男1990-06-21教师2005-06-202009-08-26
12鲁怀德男2004-06-29工人2025-08-012025-01-06
23赵燕妮女1994-07-06售货员2004-09-212025-05-23
这里提供数据库查询结果作为比对:
注:python使用pymysql与MySQL交互时,编码方式只能写成utf8,不要习惯性地写成utf-8
3.小结
导入数据主要用到pandas里的read_x()方法,x表示待导入文件的格式
除了之前介绍的导入.xlsx文件的read_excel(),导入.csv文件的read_csv(),导入txt的read_table(),导入sql文件的read_sql()之外,
还有一些其他方法在此列出。这些使用到的不多,在此不做深入说明,。后面如有使用到再进行更新。
pd.read_xml()
pd.read_
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中科学核心知识点解析
- 工程项目推进中的时间管理诀窍试题及答案
- 水利水电工程社会影响力试题及答案
- 2023 年注册会计师《会计》(8 月 25 日第一场)考试及答案解析
- 2024水利水电工程设备管理考题试题及答案
- 移动通信基站设备维护与支持合同
- 智能化物流管理服务合同
- 农村生态农业技术合作框架协议
- 工程经济实务与决策试题及答案
- 物业智能管理系统推广合作协议
- 母婴保健卫生技术人员职责
- (2025)中国汉字听写大赛全部试题库及答案
- 前程无忧测试题库28个题答案
- 无伞空投技术研究进展及国外准备阶段分析
- 上海家政服务合同样本
- 全国农牧渔业丰收奖奖励制度
- 黑龙江省哈尔滨市第四十七中学2024-2025学年八年级下学期3月月考地理试题(含答案)
- 《电力建设工程施工安全管理导则》(nbt10096-2018)
- 垃圾场应急预案
- 医院医疗服务收费自查自纠制度
- 低压电缆破损修补方案
评论
0/150
提交评论