11ABCD

你的位置: 11ABCD > jav 国产 >
jav 国产
天天影院网址 为什么Pandas是最流行的Python数据分析库?
发布日期:2024-09-07 16:33    点击次数:126

天天影院网址 为什么Pandas是最流行的Python数据分析库?

本文将从Python生态、Pandas历史配景、Pandas中枢语法、Pandas学习资源四个方面去聊一聊Pandas天天影院网址,渴望能带给全球极少启发。

一、Python生态里的Pandas

五月份TIOBE编程谈话排名榜,Python追上Java又回到第二的位置。Python如斯受宥恕一方面成绩于它珍视纯粹的编程玄学,另一方面是因为雄伟的第三方库生态。

要说杀手级的库,很难排出个先后轨则,因为python的明星库很是多,在各个畛域都算得上一鸣惊人。

比如web框架-Django、深度学习框架-TensorFlow、当然谈话处置框架-NLTK、图像处置库-PIL、爬虫库-requests、图形界面框架-PyQt、可视化库-Matplotlib、科学计较库-Numpy、数据分析库-Pandas......

上头大部分库我都用过,用的最多也最顺遂的是Pandas,可以说这是一个生态上最齐全、功能上最雄伟、体验上最浅显的数据分析库,称为编程界的Excel也不为过。

二、十项万能的Pandas

Pandas出身于2008年,它的竖立者是Wes McKinney,一个量化金融分析工程师。

因为疲于嘱托芜乱的财务数据,Wes McKinney便自学Python,并竖立了Pandas。大神等于这样纵情,莫得,就创造。

为什么叫作Pandas,其实这是“Python data analysis”的简写,同期也养殖自计量经济学术语“panel data”(面板数据)。

是以说Pandas的出身是为了分析金融财务数据,诚然当今它依然应用在各个畛域了。

2008: Pandas厚爱竖立并发布 2009:Pandas成为开源名堂 2012: 《愚弄Python进行数据分析》出书 2015: Pandas 成为 NumFOCUS 补助的名堂

Pandas能作念什么呢?

它可以匡助你任意探索数据,对数据进行读取、导入、导出、邻接、归并、分组、插入、拆分、透视、索引、切分、调养等,以及可视化展示、复杂统计、数据库交互、web爬取等。

同期Pandas还可以使用复杂的自界说函数处置数据,并与numpy、matplotlib、sklearn、pyspark、sklearn等繁密科学计较库交互。

Pandas有一个伟大的目的,即成为任何谈话中可用的最雄伟、最活泼的开源数据分析器具。

让咱们期待下。

三、Pandas中枢语法

1. 数据类型

Pandas的基本数据类型是dataframe和series两种,也等于行和列的姿首,dataframe是多行多列,series是单列多行。

要是在jupyter notebook内部使用pandas,那么数据展示的姿首像excel表相同,有行字段和列字段,还有值。

2. 读取数据

pandas守旧读取和输出多种数据类型,包括但不限于csv、txt、xlsx、json、html、sql、parquet、sas、spss、stata、hdf5

读取一般通过read_*函数末端,输出通过to_*函数末端。

image

image

3. 遴荐数据子集

导入数据后,一般要对数据进行清洗,咱们会遴荐部分数据使用天天影院网址,也等于子集。

在pandas中遴荐数据子集很是约略,通过筛选行和列字段的值末端。

具体末端如下:

4. 数据可视化

不要认为pandas仅仅个数据处置器具,它还可以匡助你作念可视化图表,何况能高度集成matplotlib。

你可以用pandas的plot门径画图散点图、柱状图、折线图等多样主流图表。

5. 创建新列

随机需要通过函数漂流旧列创建一个新的字段列,pandas也能稳操契约的末端

image

6. 分组计较

在sql中会用到group by这个门径,用来对某个或多个列进行分组,计较其他列的统计值。

pandas也有这样的功能,何况和sql的用法访佛。

image

7. 数据归并

数据处置中时常会遭受将多个表归并成一个表的情况,许多东谈主会翻开多个excel表,然后手动复制粘贴,这样就很低效。

pandas提供了merge、join、concat等门径用来归并或邻接多张表。

小结

pandas还稀有以千计的雄伟函数,能末端多样骚操作。

python也还有裂缝累累的矿藏库,等着全球去探索

三、Pandas学习资源

要是说学习Pandas最佳的教程是什么,那毫无疑问是官方文档,从小白到高东谈主,它都给你安排的妥妥的,这个背面详备先容。

底下我会从初学、进阶、训练四个三面给你们保举相应的教程和资源。

1. 初学教程

十分钟初学Pandas(英文版)

这是Pandas官网特意为生手写的初学指令,能够就几千字,包括对Pandas的简要先容,和一些基本的功能函数。

主要的现实有:数据的创建、稽查、筛选、拼接、邻接、分组、变形、可视化等等。

何况这个小册子包含了许多代码示例,要是你能齐全过一遍,初学Pandas基本没啥问题。

中语版似乎也有,但翻译的准确性全球我方识别盘问下。

愚弄Pandas进行数据分析

这本书毋庸了说了,可能是你初学python数据分析的第一册书,它的作家是Pandas库的中枢竖立者,也等于说这本书很是于是Pandas的官方出书教程。

为什么它合适初学pandas,因为整本书的编排是从数据分析的角度切入的,轮回渐进将pandas对数据的处置讲的很透顶。

诚然这本书也存在常识点过于破碎,翻译不到位的问题,但全体来说是本好书。

w3schools pandas tutorial

w3school的pandas文档, 逻辑相比了了,亦然从数据分析角度去讲pandas。

动漫里番

Learn Pandas Tutorials

数据科学平台kaggle提供的pandas初学教程,共六大节涵盖了pandas数据处置多样门径。

joyful-pandas

国内小伙伴写的Pandas条记,挺详备的,全球可以去下载名堂里的notebook,放到我方电脑里训练。

2. 进阶教程

pandas用户指南

这是pandas官网的教程,很是详备,主要从数据处置的角度先容相应的pandas函数,方便用户查阅。

要是你的英文还可以,也可爱阅读时代文档,我是提议花时期把这份指南看一遍,合作训练。

我把通盘pandas文档下载下来,发现足足有3000多页。

pandas api检索

官网的pandas api集合,也等于pandas通盘函数门径的使用轨则,是字典式的教程,提议多查查。

pandas-cookbook

这是一个开源文档,作家不光先容了Pandas的基本语法,还给出了多半的数据案例,让你在分析数据的流程中正经pandas多样操作。

Python Data Science Handbook

数据科学合集,不光有pandas,还有ipython、numpy、matplotlib、sklearn,这些都是久了学习pandas不成空匮的器具。

3. 训练资源

Pandas训练集

github上一个训练名堂,针对pandas每个功能都有对应的信得过数据训练。

101个Pandas训练

一位海外博主挂念的100多个pandas训练题,很是全面。

datacamp

小结

pandas的教程主要如故以英文为主,国内翻译的质地错杂不都天天影院网址,如故提议你在初学后多去看英文文档,这是第一手辛苦,亦然最靠谱的。