资源共享 | PYTHON初学者教程

行业资讯 admin 发布时间:2024-04-30 浏览:34 次

该教程可帮助同学开始学习使用Python。

通过示例学习Python的一步一步的实用指南。Python是一种开源语言,被广泛用作通用编程的高级编程语言。它在数据科学世界中获得了高度的普及。随着数据科学领域日益增长,IBM近期预测,到2020年,数据科学专业人士的需求将增长25%以上。在编程语言指数的PyPL受欢迎程度中,Python以14%的份额排名第二。在高级分析和预测分析市场中,它被列为高级分析的3大编程语言之一。

目录

Python入门

Python 2.7与3.6

数据科学Python

如何安装Python?

Spyder快捷键

Python中的基本程序

比较,逻辑和分配运算符

数据结构和条件语句

Python数据结构

Python条件语句

Python库

流行包装清单(与R比较)

热门的python命令

如何导入包

使用熊猫的数据操作

熊猫数据结构 - 系列和数据帧

重要熊猫功能(vs. R功能)

示例 - 熊猫数据分析

数据科学与Python

逻辑回归

决策树

随机森林

网格搜索 - 超参数调整

交叉验证

预处理步骤

Python 2.7 vs 3.6

Google收录了数以千计的有关此主题的文章。一些博主反对,有些赞成2.7。如果您过滤搜索条件并仅查找最近的文章(2016年晚些时候),您会发现大多数博主都赞成使用Python 3.6。看到以下原因支持Python 3.6。

1. Python 2.7的正式结束日期是2020年。之后,社区不会有任何支持。学习2.7如果你今天学习没有任何意义。

2. Python 3.6支持顶部360蟒蛇包的95%,几乎100%用于数据科学的顶级包。Python 3.6中的新 功能更清洁,更快。这是一种未来的语言。它解决了Python 2系列版本的主要问题。Python 3在2008年首次发布。已经9年发布了强大的Python 3系列版本。

你应该去Python 3.6。在学习Python方面,Python 2.7和3.6没有什么重大差异。通过一些调整,从Python 3移动到Python 2并不难。你的重点应该是学习Python作为一种语言

数据科学Python

Python广泛应用于各种软件工程任务,如网站开发,云架构,后端等。它在数据科学领域同样受欢迎。在高级分析世界中,R与Python之间已有多次辩论。有一些领域,例如用于统计分析的图书馆数量,其中R胜过Python,但Python正在快速追赶。随着大数据和数据科学的普及,Python已经成为数据科学家的第一个编程语言。

学习Python有几个原因。其中一些如下 - 

Python在自动化预测模型的各个步骤中运行良好。 

Python具有机器学习,自然语言处理,深度学习,大数据和人工智能等功能强大的强大库。 

当涉及在生产中部署机器学习模型时,Python胜过R。

它可以轻松地与大数据框架(如Spark和Hadoop)集成。

Python具有很好的在线社区支持。

你知道这些网站是用Python开发的吗?

YouTube的

Instagram的

书签交易

Dropbox的

Disqus

如何安装Python有两种方法可以下载和安装Python

下载Anaconda。它附带Python软件以及预装的流行各种库。

从其官方网站下载Python。您必须手动安装库。

推荐: 推荐下载anaconda 。它节省了大量的时间学习和编码Python

编程环境

Anaconda配有两个流行的IDE:

Jupyter(Ipython)笔记本

Spyder的

Jupyter(Ipython)notebook

Jupyter相当于R中有了Markdown。当您需要向其他人介绍您的工作或需要创建一步一步的项目报告,因为它可以组合代码,输出,单词和图形,这很有用。

Spyder。就像Python的RStudio。它给出了编写python代码是用户友好的环境。如果您是SAS用户,则可以将其视为SAS Enterprise Guide / SAS Studio。它附带一个语法编辑器,您可以在其中编写程序。它有一个控制台来检查每一行代码。在“变量浏览器”下,您可以访问创建的数据文件和功能。

我强烈推荐Spyder!

Spyder快捷键

以下是一些有用的spyder快捷键的列表,使您更有效率。

按F5运行整个脚本

按F9运行选择或行 

Ctrl + 1来评论/取消注释

转到功能前面,然后按Ctrl + I查看功能的文档

运行%reset -f清理工作区

Ctrl +左键单击对象以查看源代码 

Ctrl + Enter执行当前单元格。

Shift + Enter执行当前单元格,并将光标移动到下一个单元格

具有示例的算术运算符列表

案例1

#Basics

x = 10

y = 3

print("10 divided by 3 is", x/y)

print("remainder after 10 divided by 3 is", x%y)

结果:

10 divided by 3 is 3.33

remainder after 10 divided by 3 is 1

案例2

x = 100

x > 80 and x <=95

x > 35 or x < 60x > 80 and x <=95

Out[45]: Falsex > 35 or x < 60

Out[46]: True

赋值运算符用于为声明的变量赋值,例如 x += 25 表示 x = x +25

.

x = 100

y = 10

x += y

print(x)print(x)

110

在这种情况下, x+=y 表示 x=x+y, 这里 x = 100 + 10.

类似地, 你也可以用  x-=y, x*=y 和 x /=y

Python的数据结构

在每一种编程语言中,了解数据结构是非常重要的。下面是Python中使用的一些数据结构。

1. List-列表它是多个值的序列。它允许我们存储不同类型的数据,如整数,浮点数,字符串等。请参见下面的列表示例。第一个是只包含整数的整数列表。第二个是仅包含字符串值的字符串列表。第三个是包含整数,字符串和浮点值的混合列表。

x = [1, 2, 3, 4, 5]

y = [‘A’, ‘O’, ‘G’, ‘M’]

z = [‘A’, 4, 5.1, ‘M’]

获取列表项

我们可以使用索引提取列表项。索引从0开始,以(元素数-1)结束。

x = [1, 2, 3, 4, 5]

x[0]

x[1]

x[4]

x[-1]

x[-2]x[0]

Out[68]: 1

x[1]

Out[69]: 2

x[4]

Out[70]: 5

x[-1]

Out[71]: 5

x[-2]

Out[72]: 4

x[0] 从列表中选择第一个元素。负号告诉Python从右到左搜索列表项。x [-1]

从列表中选择最后一个元素。

您可以使用以下方法从列表中选择多个元素

x[:3] 返回 [1, 2, 3]

2. Tuple-元组

组元组是一个类似于列表的意义,它是一系列元素。列表和元组之间的区别如下 :

创建一个元组不能更改,而列表可以修改。

通过在括号( )中放置逗号分隔值创建元组。而列表是在方括号[ ]内创建的

例子

K = (1,2,3)

City = (北京,上海,广州)

在元组中实现循环

for i in City:

    print(i)北京

上海

广州

Functions-函数

像 print( ),你可以创建自己的自定义函数。它也称为用户定义的功能。它可以帮助您自动化重复任务,并以更简单的方式调用可重用的代码。

规则定义功能

函数以def关键字开始,后跟函数名和()

函数体以冒号(:)开始,缩进

关键字返回结束函数并 给出先前表达式的值。

def sum_fun(a, b):

    result = a + b

    return result z = sum_fun(10, 15)

结果 :

 z = 25

假设如果没有为参数b指定值,则希望python假定为0作为默认值。

def sum_fun(a, b=0

):

    result = a + b

    return result

z = sum_fun(10)

在上述功能中,如果没有为参数b提供值,则将b设置为0。这并不意味着没有其他值可以在这里设置。它也可以用作z = sum_fun(10, 15)

条件语句(if else)条件语句通常用于编码。它是IF ELSE语句。它可以像:“如果一个条件成立,然后执行一些,否则执行别的”

注意: if和else语句以冒号结尾

示例

k = 27

if k%5 == 0:

  print(Multiple of 5)

else:

  print(Not a Multiple of 5)

结果: 可以被5整除

用于数据分析和可视化的流行python包的多个Python中的一些领先包以及R中的等效库如下所示:

pandas。用于数据操纵和数据争吵。了解和探索数据的功能集合。它是R中的dplyr和reshape2包的对应物。

NumPy。用于数值计算。它是一个用于高效数组计算的包。它允许我们在一行中的整个列或表上进行一些操作。它大致近似于R中的Rcpp包,消除了R中慢速的限制。

Scipy。对于数学和科学功能,如积分,插值,信号处理,线性代数,统计等,它建立在Numpy上。

Scikit-learn。机器学习算法的集合。它建立在Numpy和Scipy上。它可以使用glm,knn,randomForest,rpart,e1071包执行R中可以完成的所有技术  。

Matplotlib。 用于数据可视化。它是Python中图形的主要包装。它相当于R中的ggplot2包。

Statsmodels。 用于统计和预测建模。它包含各种功能来探索数据并生成描述性和预测性分析。它允许用户运行描述性统计信息,估算缺失值的方法,统计测试,并将表格输出为HTML格式。

pandasql。 它允许SQL用户在Python中编写SQL查询。对于喜欢编写SQL查询来操纵数据的人来说,这是非常有用的。

1

2

-

3

添加客服微信,备注“加群”,进入硕博交流群

在线咨询

点击这里给我发消息售前咨询专员

点击这里给我发消息售后服务专员

在线咨询

免费通话

24h咨询:400-888-8888


如您有问题,可以咨询我们的24H咨询电话!

免费通话

微信扫一扫

微信联系
返回顶部