资源共享 | PYTHON初学者教程
该教程可帮助同学开始学习使用Python。
通过示例学习Python的一步一步的实用指南。Python是一种开源语言,被广泛用作通用编程的高级编程语言。它在数据科学世界中获得了高度的普及。随着数据科学领域日益增长,IBM近期预测,到2020年,数据科学专业人士的需求将增长25%以上。在编程语言指数的PyPL受欢迎程度中,Python以14%的份额排名第二。在高级分析和预测分析市场中,它被列为高级分析的3大编程语言之一。
目录
Python入门
Python 2.7与3.6
数据科学Python
如何安装Python?
Spyder快捷键
Python中的基本程序
比较,逻辑和分配运算符
数据结构和条件语句
Python数据结构
Python条件语句
Python库
流行包装清单(与R比较)
热门的python命令
如何导入包
使用熊猫的数据操作
熊猫数据结构 - 系列和数据帧
重要熊猫功能(vs. R功能)
示例 - 熊猫数据分析
数据科学与Python
逻辑回归
决策树
随机森林
网格搜索 - 超参数调整
交叉验证
预处理步骤
Python 2.7 vs 3.6
Google收录了数以千计的有关此主题的文章。一些博主反对,有些赞成2.7。如果您过滤搜索条件并仅查找最近的文章(2016年晚些时候),您会发现大多数博主都赞成使用Python 3.6。看到以下原因支持Python 3.6。
1. Python 2.7的正式结束日期是2020年。之后,社区不会有任何支持。学习2.7如果你今天学习没有任何意义。
2. Python 3.6支持顶部360蟒蛇包的95%,几乎100%用于数据科学的顶级包。Python 3.6中的新 功能更清洁,更快。这是一种未来的语言。它解决了Python 2系列版本的主要问题。Python 3在2008年首次发布。已经9年发布了强大的Python 3系列版本。你应该去Python 3.6。在学习Python方面,Python 2.7和3.6没有什么重大差异。通过一些调整,从Python 3移动到Python 2并不难。你的重点应该是学习Python作为一种语言
数据科学Python
Python广泛应用于各种软件工程任务,如网站开发,云架构,后端等。它在数据科学领域同样受欢迎。在高级分析世界中,R与Python之间已有多次辩论。有一些领域,例如用于统计分析的图书馆数量,其中R胜过Python,但Python正在快速追赶。随着大数据和数据科学的普及,Python已经成为数据科学家的第一个编程语言。
学习Python有几个原因。其中一些如下 -
Python在自动化预测模型的各个步骤中运行良好。
Python具有机器学习,自然语言处理,深度学习,大数据和人工智能等功能强大的强大库。
当涉及在生产中部署机器学习模型时,Python胜过R。
它可以轻松地与大数据框架(如Spark和Hadoop)集成。
Python具有很好的在线社区支持。
你知道这些网站是用Python开发的吗?
YouTube的
Instagram的
书签交易
Dropbox的
Disqus
如何安装Python有两种方法可以下载和安装Python
下载Anaconda。它附带Python软件以及预装的流行各种库。
从其官方网站下载Python。您必须手动安装库。
推荐: 推荐下载anaconda 。它节省了大量的时间学习和编码Python
编程环境
Anaconda配有两个流行的IDE:
Jupyter(Ipython)笔记本
Spyder的
Jupyter(Ipython)notebook
Jupyter相当于R中有了Markdown。当您需要向其他人介绍您的工作或需要创建一步一步的项目报告,因为它可以组合代码,输出,单词和图形,这很有用。
Spyder。就像Python的RStudio。它给出了编写python代码是用户友好的环境。如果您是SAS用户,则可以将其视为SAS Enterprise Guide / SAS Studio。它附带一个语法编辑器,您可以在其中编写程序。它有一个控制台来检查每一行代码。在“变量浏览器”下,您可以访问创建的数据文件和功能。
我强烈推荐Spyder!
Spyder快捷键
以下是一些有用的spyder快捷键的列表,使您更有效率。
按F5运行整个脚本
按F9运行选择或行
按Ctrl + 1来评论/取消注释
转到功能前面,然后按Ctrl + I查看功能的文档
运行%reset -f清理工作区
Ctrl +左键单击对象以查看源代码
Ctrl + Enter执行当前单元格。
Shift + Enter执行当前单元格,并将光标移动到下一个单元格
具有示例的算术运算符列表
案例1
#Basics
x = 10
y = 3
print("10 divided by 3 is", x/y)
print("remainder after 10 divided by 3 is", x%y)结果:
10 divided by 3 is 3.33
remainder after 10 divided by 3 is 1
案例2
x = 100
x > 80 and x <=95
x > 35 or x < 60x > 80 and x <=95
Out[45]: Falsex > 35 or x < 60
Out[46]: True赋值运算符用于为声明的变量赋值,例如 x += 25 表示 x = x +25
.
x = 100
y = 10
x += y
print(x)print(x)
110在这种情况下, x+=y 表示 x=x+y, 这里 x = 100 + 10.
类似地, 你也可以用 x-=y, x*=y 和 x /=yPython的数据结构
在每一种编程语言中,了解数据结构是非常重要的。下面是Python中使用的一些数据结构。
1. List-列表它是多个值的序列。它允许我们存储不同类型的数据,如整数,浮点数,字符串等。请参见下面的列表示例。第一个是只包含整数的整数列表。第二个是仅包含字符串值的字符串列表。第三个是包含整数,字符串和浮点值的混合列表。x = [1, 2, 3, 4, 5]
y = [‘A’, ‘O’, ‘G’, ‘M’]
z = [‘A’, 4, 5.1, ‘M’]
获取列表项
我们可以使用索引提取列表项。索引从0开始,以(元素数-1)结束。x = [1, 2, 3, 4, 5]
x[0]
x[1]
x[4]
x[-1]
x[-2]x[0]
Out[68]: 1
x[1]
Out[69]: 2
x[4]
Out[70]: 5
x[-1]
Out[71]: 5
x[-2]
Out[72]: 4x[0] 从列表中选择第一个元素。负号告诉Python从右到左搜索列表项。x [-1]
从列表中选择最后一个元素。
您可以使用以下方法从列表中选择多个元素
x[:3] 返回 [1, 2, 3]2. Tuple-元组
组元组是一个类似于列表的意义,它是一系列元素。列表和元组之间的区别如下 :
创建一个元组不能更改,而列表可以修改。
通过在括号( )中放置逗号分隔值创建元组。而列表是在方括号[ ]内创建的
例子
K = (1,2,3)
City = (北京,上海,广州)在元组中实现循环
for i in City:
print(i)北京
上海
广州Functions-函数
像 print( ),你可以创建自己的自定义函数。它也称为用户定义的功能。它可以帮助您自动化重复任务,并以更简单的方式调用可重用的代码。
规则定义功能
函数以def关键字开始,后跟函数名和()
函数体以冒号(:)开始,缩进
关键字返回结束函数并 给出先前表达式的值。
def sum_fun(a, b):
result = a + b
return result z = sum_fun(10, 15)结果 :
z = 25
假设如果没有为参数b指定值,则希望python假定为0作为默认值。
def sum_fun(a, b=0):
result = a + b
return result
z = sum_fun(10)在上述功能中,如果没有为参数b提供值,则将b设置为0。这并不意味着没有其他值可以在这里设置。它也可以用作z = sum_fun(10, 15)
条件语句(if else)条件语句通常用于编码。它是IF ELSE语句。它可以像:“如果一个条件成立,然后执行一些,否则执行别的”
注意: if和else语句以冒号结尾:
示例
k = 27
if k%5 == 0:
print(Multiple of 5)
else:
print(Not a Multiple of 5)结果: 可以被5整除
用于数据分析和可视化的流行python包的多个Python中的一些领先包以及R中的等效库如下所示:
pandas。用于数据操纵和数据争吵。了解和探索数据的功能集合。它是R中的dplyr和reshape2包的对应物。
NumPy。用于数值计算。它是一个用于高效数组计算的包。它允许我们在一行中的整个列或表上进行一些操作。它大致近似于R中的Rcpp包,消除了R中慢速的限制。
Scipy。对于数学和科学功能,如积分,插值,信号处理,线性代数,统计等,它建立在Numpy上。
Scikit-learn。机器学习算法的集合。它建立在Numpy和Scipy上。它可以使用glm,knn,randomForest,rpart,e1071包执行R中可以完成的所有技术 。
Matplotlib。 用于数据可视化。它是Python中图形的主要包装。它相当于R中的ggplot2包。
Statsmodels。 用于统计和预测建模。它包含各种功能来探索数据并生成描述性和预测性分析。它允许用户运行描述性统计信息,估算缺失值的方法,统计测试,并将表格输出为HTML格式。
pandasql。 它允许SQL用户在Python中编写SQL查询。对于喜欢编写SQL查询来操纵数据的人来说,这是非常有用的。
转发即可领取原文哦!
资源获取方式
1、点亮文章底部“在看”图标
2、关注“社科学术汇”公众号
点击公众号右上角三个点-设为星标
3、点击“发消息”在后台发送关键词
按照提示获取资源哦
扫码添加客服微信,备注“加群”,进入硕博交流群