Gloomymoon

Try not. Do or do not. There is no try.

Python Machine Learning VII

Combining Different Models for Ensemble Learning本章将基于前几章学到的内容和技术,用多个的分类器构建成一个分类器,来获得比任何单一模型更好的效果。 基于多数投票算法的预测 通过随机抽取组合训练数据集降低过拟合 通过学习弱模型(weak learners)的差错构建更强的模型 Learning with ensembles集成算法(ensem......

Python Machine Learning VI

Learning Best Practices for Model Evaluation and Hyperparameter Tuning前面的课程我们学习了几种基本的机器学习分类算法,以及如何对数据进行预处理。本章将介绍通过调优获得更好的建模效果,以及如何评估模型的表现: 获取模型表现的无偏估计量 分析诊断机器学习算法中碰到的普遍问题 模型调优 通过各种指标评估预测效果 Stream......

Python Machine Learning V

5 Compressing Data via Dimensionality Reduction本章将介绍三类基础方法,将训练数据映射到低维特征子空间。数据压缩是机器学习中一个重要的课题,它帮助我们存储和分析现代科技收集的增长惊人的数据。本章将涵盖如下主要内容: 主成分分析(Principal component analysis,PCA),用于无监督数据压缩 线性判别分析(Linear D......

Bit City

Bit City:一个值得轻度肝的小游戏3月13日NimbleBit LLC发布了最新的游戏Bit City,立即上了App Store的首页推荐,目前(3月16日)已经收获近600评分,平均评分4星。 NimbleBit是由两个双胞胎兄弟Ian Marsh和Dave Marsh在2009年联合创办的一个独立游戏开发公司,成员目前只有4人,哥哥Ian负责码代码,弟弟David负责描像素,......

Python Machine Learning IV

4 Building Good Training Sets – Data Preprocessing数据的质量和有效信息含量直接决定了机器学习算法能够学得多好。因此在建模前绝对应当对数据进行细查和预处理。本章节将介绍构建模型前必须要具备的数据预处理技术。 清除或插补缺失值 将分类数据塑形成模型可用的形式 为模型构建选择相关的特征变量 Dealing with missing data我们......

Python Machine Learning III

3 A Tour of Machine Learning Classifiers Using Scikit-learn本章将浏览一系列流行而且强大的机器学习算法,学习区别的时候也会了解各个分类算法的强项和弱点。 流行分类算法的概要介绍 使用scikit-learn 选择一个机器学习算法前需要回答的问题 Choosing a classification algorithm为特定任务选择合......

Python Machine Learning II

2 Training Machine Learning Algorithms for Classification 建立机器学习算法的基础知识 利用pandas、NumPy和matplotlib来读入、处理和展示数据 用Python实现线性分类算法 Artificial neurons – a brief glimpse into the early history of machine ......

Python Machine Learning I

Python Machine LearningSebastian Raschka Sebastian Raschka是密歇根州立大学的博士生,擅长Python和机器学习,是GitHub广受欢迎的数据科学家之一。 1 Giving Computers the Ability to learn from DataBuilding intelligent machines to transfo......

Python for Data Analysis VII

8 绘图和可视化绘图是数据分析工作中最重要的任务之一,通过可视化的方式能够让我们快速进行探索过程,找出异常值、进行数据转换、获取模型的idea。Python有许多可视化工具,这里主要介绍matplotlib。 8.1 matplotlib API入门准备工作: 12%matplotlib inline # 在IPython中内嵌显示matplot图表,也可以在IPython启动时增加--pm......

Python for Data Analysis VI

7.4 字符串操作字符串对象方法 对于大部分字符串操作应用而言,python内置的字符串对象方法已经能够满足要求,例如split拆分、strip修剪空白符、+号连接字符串、join连接列表或元组、in, index, find方法定位子串、count方法返回子串出现次数、replace方法实现模式替换等等。 正则表达式 Python内置的re模块负责对字符串应用正则表达式,re模块的函数可以......