Gloomymoon

Try not. Do or do not. There is no try.

Python for Data Analysis Note II

5 pandas入门约定:12from pandas import Series, DataFrameimport pandas as pd 5.1 pandas的数据机构介绍pandas两个主要数据结构Series和DataFrame SeriesSeries有两个属性values和index,表示数据(各种NumPy数据类型)及与之相关的标签(索引),因此可以从一个Python字典中直接......

Python for Data Analysis Note I

0 Jupyter Notebook建议直接安装Anaconda。 1~3 准备工作直接使用Jupyter Notebook,这三个章节可以直接跳过。 4 NumPy基础:数组和矢量计算NumPy(Numerical Python)是高性能科学计算和数据分析的基础包,是python下几乎所有高级分析工具的构建基础。其主要功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且......

StudiousPrime

应领导要求给儿子做了一个英语单词联系网页StudiousPrime,目前为版本号为0.2,主要功能如下: 根据单词掌握程度新建测试Exercise,每个测试25道题Question,题目形式为根据中文单词(及词组)填充。题目中的单词会根据长度随机显示:有限个字母总长5个及以下的单词随机展示1个字母,6个及以上随机展示2个,10个以上随机展示3个,答对得1分且该单词得分+1,答错不得分。 ......

Improving your submission

1 Improving Our Features书接上回,我们刚刚完成了第一个Kaggle竞赛模型的提交,预测准确率是75%左右,排名将近5000。 本回将从以下三个方面来提高: 使用更好的机器学习算法 优化特征变量 结合多种机器学习算法 Let’s do it. 2 Random Forest Introduction首先我们引入一个新的算法决策树,决策树能够有效应对非线性关系。 举个......

Getting started with Kaggle

0 Prefacedataquest.io是一个在线学习数据科学的网站,内容涵盖Python、数据分析、数据可视化、统计学、机器学习、大数据工具、R等内容,并提供在线交互式编程环境,今天我们先来学习Kaggle的一个入门教程:Getting started with Kaggle 1 The Competition首先我们从Kaggle上最简单的题目入手:Titanic: Machine L......

Convert PDF to Images using Python

1 Install GhostScript从GhostScript官网下载Ghostscript 9.20 for Windows(32bit)安装包,注意即便是64位的系统也请安装32位。安装完成后将%安装目录\bin加入到系统Path环境变量,如果使用默认安装的话,则添加:1C:\Program Files (x86)\gs\gs9.20\bin 2 Install ImageMagic......

Building LegoSpyder Part III

4 Finish The LegoSpyder4.1 Define Items通过分析Search API返回的json数据格式,得出的结果数据格式如下: 考虑到所需要保存的数据和便于下载文件,最终设计的items类如下图: 最终items.py的代码如下:123456789101112131415161718192021from scrapy import Field, Itemclass......

Building LegoSpyder Part II

2. Installing Scrapy直接用pip安装即可:1$ pip install Scrapy 如果出现如下错误:exceptions.ImportError: No module named win32api 需要手动安装pypiwin32:1$ pip install pypiwin32 如果需要生成下载预览图片的缩略图,请手动安装image:1$ pip install im......

Building LegoSpyder Part I

0. Preface10月8日收到了新买的Architecture Studo,前两天无意中发现了Lego.com竟然提供了所有Set的Building Instructions。这是一个搜索页面,可以根据主题和年份搜索到所有Set的图纸,于是产生了一个邪恶的想法:把所有的图纸用爬虫Download下来。 1. 分析页面在开始爬之前首先需要分析页面的结构,根据firebug监控Net流量发现......

Build A Blog With GitHub And Hexo

第一篇肯定是关于如何搭建一个基于GitHub的Blog。主要的过程都是通过网络搜索获得,使用的主题也是简单挑选的一个Hexo主题HuxBlog。 1. 开发环境1.1 安装Git从Git的官网下载最新的版本,我下载的是Git for Windows 64-bit版本,你可以从下载页面获取其他系统和版本。 安装时的注意事项: 使用默认选项:Use git from Windows Comma......