Gloomymoon

Try not. Do or do not. There is no try.

Improving your submission

1 Improving Our Features书接上回,我们刚刚完成了第一个Kaggle竞赛模型的提交,预测准确率是75%左右,排名将近5000。 本回将从以下三个方面来提高: 使用更好的机器学习算法 优化特征变量 结合多种机器学习算法 Let’s do it. 2 Random Forest Introduction首先我们引入一个新的算法决策树,决策树能够有效应对非线性关系。 举个......

Getting started with Kaggle

0 Prefacedataquest.io是一个在线学习数据科学的网站,内容涵盖Python、数据分析、数据可视化、统计学、机器学习、大数据工具、R等内容,并提供在线交互式编程环境,今天我们先来学习Kaggle的一个入门教程:Getting started with Kaggle 1 The Competition首先我们从Kaggle上最简单的题目入手:Titanic: Machine L......

Convert PDF to Images using Python

1 Install GhostScript从GhostScript官网下载Ghostscript 9.20 for Windows(32bit)安装包,注意即便是64位的系统也请安装32位。安装完成后将%安装目录\bin加入到系统Path环境变量,如果使用默认安装的话,则添加:1C:\Program Files (x86)\gs\gs9.20\bin 2 Install ImageMagic......

Building LegoSpyder Part III

4 Finish The LegoSpyder4.1 Define Items通过分析Search API返回的json数据格式,得出的结果数据格式如下: 考虑到所需要保存的数据和便于下载文件,最终设计的items类如下图: 最终items.py的代码如下:123456789101112131415161718192021from scrapy import Field, Itemclass......

Building LegoSpyder Part II

2. Installing Scrapy直接用pip安装即可:1$ pip install Scrapy 如果出现如下错误:exceptions.ImportError: No module named win32api 需要手动安装pypiwin32:1$ pip install pypiwin32 如果需要生成下载预览图片的缩略图,请手动安装image:1$ pip install im......

Building LegoSpyder Part I

0. Preface10月8日收到了新买的Architecture Studo,前两天无意中发现了Lego.com竟然提供了所有Set的Building Instructions。这是一个搜索页面,可以根据主题和年份搜索到所有Set的图纸,于是产生了一个邪恶的想法:把所有的图纸用爬虫Download下来。 1. 分析页面在开始爬之前首先需要分析页面的结构,根据firebug监控Net流量发现......

Build A Blog With GitHub And Hexo

第一篇肯定是关于如何搭建一个基于GitHub的Blog。主要的过程都是通过网络搜索获得,使用的主题也是简单挑选的一个Hexo主题HuxBlog。 1. 开发环境1.1 安装Git从Git的官网下载最新的版本,我下载的是Git for Windows 64-bit版本,你可以从下载页面获取其他系统和版本。 安装时的注意事项: 使用默认选项:Use git from Windows Comma......

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Qu......