python数据分析过程例如_第1页
python数据分析过程例如_第2页
python数据分析过程例如_第3页
python数据分析过程例如_第4页
python数据分析过程例如_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——python数据分析过程例如引言

几年后发生了。在使用SAS工作超过5年后,我决定走出自己的舒适区。作为一个数据科学家,我寻觅其他有用的工具的旅程开始了!幸运的是,没过多久我就决定,Python作为我的开胃菜。

我总是有一个编写代码的倾向。这次我做的是我真正喜欢的。代码。原来,写代码是如此简单!

我一周内学会了Python基础。并且,从那时起,我不仅深度摸索了这门语言,而且也帮助了大量人学习这门语言。Python是一种通用语言。但是,多年来,具有强大的社区支持,这一语言已经有了专门的数据分析和预计模型库。

由于Python缺乏数据科学的资源,我决定写这篇教程来帮助别人更快地学习Python。在本教程中,我们将讲授一点关于如何使用Python进行数据分析的信息,咀嚼它,直到我们觉得舒适并可以自己去实践。

目录

1.数据分析的Python基础

o为什么学Python用来数据分析

oPython2.7v/s3.4

o怎样安装Python

o在Python上运行一些简单程序

2.Python的库和数据结构

oPython的数据结构

oPython的迭代和条件结构

oPython库

3.在Python中使用Pandas进行摸索性分析

o序列和数据框的简介

o分析Vidhya数据集——贷款的预计问题

4.在Python中使用Pandas进行数据再加工5.使用Python中建立预计模型

o规律回归

o决策树

o随机森林

让我们开始吧

1.数据分析的Python基础

为什么学Python用来数据分析

好多人都有兴趣选择Python作为数据分析语言。这一段时间以来,我有比较过SAS和R。这里有一些原因来支持学习Python:

?

开源——免费安装

?极好的在线社区

?很简单学习

?可以成为一种通用的语言,用于基于Web的分析产品数据科学和生产中。

不用说,它依旧有几个缺点:

?

它是一种解释性的语言,而不是编译的语言,因此可能占用更多的CPU时间。然而,由于它节省了程序员的时间(由于学习的便利),它可能依旧是一个很好的选择。

Python2.7v/s3.4

这是关于Python的一个最具争议的话题。你可能总是不能避免遇到,特别是假使你是一个初学者。这里没有正确/错误的选择。它完全取决于具体状况和你的需要。我会尝试给你一些建议,以帮助你做出明智的选择。

为什么选择Python2.7

1.极好的社区支持!这是你在初期需要的东西。Python2发行于2000年末,已经被

使用超过15年。

2.好多第三方库!虽然大量库已经提供了3.X的支持,但依旧有大量的模块只工作在

2.X。假使你计划将Python用于具体的应用,如Web开发这种高度依靠外部模块的,你选择2.7可能会更好。

3.3.X版本的一些特性有向后兼容性,可以使用2.7版本。

为什么选择Python3.4

1.更整齐和更快!Python开发者修正了一些固有的问题和小缺点,以此为未来建立

一个强大的基础。这些可能不是很相关,但最终会很重要。

2.这是未来!2.7是2.X族发布的最终一个版本,并且最终每个人都要转移到3.X版

本。Python3在过去5年已经发布的稳定版本,并将继续。

没有明确的赢家,但我想,底线是,你应当专注于学习Python语言。版本之间的转换应当只是一个时间问题。敬请期待,不久的将来一个专门对比Python2.X和3X的文章!

怎样安装Python

有两种方法安装Python

?

你可以直接从项目网站下载Python,然后单独安装你想要的组件和库

?或者,你可以下载并安装一个包,它附带了预装的库。我建议您下载Anaconda。另一种选择是EnthoughtCanopyExpress。

其次种方法提供了一个避免麻烦的安装,因此我会推荐给初学者。这种方法是你必需等待整个包进行升级,即使你只是对一个单一的库的最新版本感兴趣。它应当不重要,直到和除非,直到和除非,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论