Windows下安装Python的机器学习(Scikit-Learn)算法库方法

Python社区仿照MATLAB开发了类似的数学分析库,主要包括用NumPy和SciPy来处理数据,用Matplotlib实现数据可视化。大多数Python数学和算法领域的应用广泛地将其作为基本的程序库。为了适应处理大规模数据的需求,Python在此基础上开发了Scikit-Learn机器学习算法库,同时还提供了深度学习算法库Theano,并支持GPU运算,Python已经可以完整地提供基于C/C++语言的机器学习开发包,而且都是开源的。本文主要介绍一下Scikit-Learn机器学习算法库的安装方法。

Windows下安装Python的机器学习(Scikit-Learn)算法库方法

一、基本环境

操作系统:Windows 10 64位
Python版本:Pyhton 2.7
算法库:scikit-learn 0.16.1

二、基本步骤

1.搭建Python开发环境

Python开发环境可以搭建在Linux下,也可以搭建在Windows下:这里在Windows 10环境下部署64位的Python开发环境。
Pyhton可在官方网站直接下载,网站为>https://www.python.org/downloads/source/.
双击下载的安装程序,选择安装路径,也可以自己新建路径(尽量避免使用中文路径),这里我的路径是E:\python27,按照安装向导完成安装即可。

2.安装Pyhton算法库

这里以Scikit-Learn库为例,介绍一下Python算法库的安装方法。
cikit-Learn算法库可以在官方下载(>http://scikit-learn.org/stable/),
也可以在翻墙去google上搜索相关资源,这里提供一个可以直接下载0.16.1版本Scikit-Learn库的链接(>https://sourceforge.net/projects/scikit-learn/?source=typ_redirect).

除此之外,Python还提供了大量的常用程序库,如数据库 API(MysqlDB)、GUI图形界面库(WxPython)、高并发协成库(gevent)、中文分词库(jieba)等外部库。这些库可以在下面的链接下载:
官方下载网址:>https://pypi.python.org/pypi
非官方下载网址:>http:/www.lfd.uci.edu/~gohlke/pythonlibs

在安装Scikit-Learn库之前,请先装一个setuptools或者easy_install.
装好之后执行C:\Python27\Scripts\pip install 库名 命令即可

这里的算法库的安装顺序为:NumPy->SciPy->Matplotlib->Scikit-Learn

三、其他工具

WinPython:PythonWin 是一个 Python 集成开发环境,在许多方面都比 IDE 优秀。它集成了Scikit-Learn库和深度学习Theano库。集成了Spyder编辑器等开发工具,可对Python脚本进行编译和调试,支持语法高亮和单步跟踪,非常适合新手使用。(在师兄的指导下,本人目前也主要使用该工具)
Anaconda:Anaconda和WinPython类似,不过它是在Linux环境下集成的,比较适合Linux下的Python开发

四、测试

import numpy as np #导入Numpy库
from numpy import * #导入Numpy库
import matplotlib.pyplot as plt #导入Matplotlib库

dataSet=[[1,2],[1,3],[2,2.5],[3,4],[3,6],[4,5],[6,9],[8,12],[10,15]]
dataMat=mat(dataSet).T #将数据集转换为NumPy矩阵,并转置
plt.scatter(dataMat[0],dataMat[1],c=’red’,marker=’o’) #绘制散点图

#绘制直线图像
X=np.linspace(-2,12,100) #产生直线数据集
Y=2*X+5
plt.plot(X,Y) #绘制直线图
plt.show()

结果为:

上面这个是测试Numpy库的,要测试Scikit-Learn的安装,写个小程序看下对应的库能不能导入即可。

1