Gloomymoon

Try not. Do or do not. There is no try.

Python for Data Analysis V

7.2 重塑和轴向旋转重塑层次化索引 stack:将数据的列旋转为行 unstack:将数据的行旋转为列 1234data = DataFrame(np.arange(6).reshape((2, 3)), index=pd.Index(['Ohio', 'Colorado'], name='state'), columns......

Start using Materialize in your website

1 About Meterial DesignMaterial Design是由Google发布的全平台设计规范,其原则如下:Material is the metaphorGoogle认为材质的触感可以通过纸片的隐喻来表达,通过在设计上运用符合运动规律的动画交互、通过光影打造层及设计的关系来创造全新的虚拟交互控件,将设计从2D拓展到了3D。 Bold, graphic, intention......

Using PostgreSQL for Flask

1 安装PostgreSQL从官网下载windows install,直接安装,默认用户为postgres,密码一定需要设置。在pgAdmin中新建数据库StudiousPrime 2 安装Python驱动从Unofficial Windows Binaries for Python Extension Packages 下载预编译好的psycopg2-2.6.2-cp27-cp27m-wi......

Python for Data Analysis IV

7 数据规整化:清理、转换、合并、重塑数据分析和建模工作中大量的编程使用在数据准备上的:加载、清洗、转换以及重塑,大部分情况下存放在文本或数据库中的数据并不能满足应用的要求,幸运的是,pandas和Python标准库提供了一组高级、灵活、高效的核心函数和算法,使你能够轻松操作数据。 7.1 合并数据集 pandas.merge可以根据一个或多个键将不同的DataFrame中的行连接起来,类似......

Python for Data Analysis III

6 数据加载、存储与文件格式6.1 读写文本格式的数据pandas提供了一些从文本都去为DataFrame对象的函数,常用的包括read_csv或read_table。123df = pd.read_csv('..\\..\\public\\pydata-book-master\\ch06\\ex1.csv')dfpd.read_table('..\\..\\public\\pydata-b......

Python for Data Analysis Note II

5 pandas入门约定:12from pandas import Series, DataFrameimport pandas as pd 5.1 pandas的数据机构介绍pandas两个主要数据结构Series和DataFrame SeriesSeries有两个属性values和index,表示数据(各种NumPy数据类型)及与之相关的标签(索引),因此可以从一个Python字典中直接......

Python for Data Analysis Note I

0 Jupyter Notebook建议直接安装Anaconda。 1~3 准备工作直接使用Jupyter Notebook,这三个章节可以直接跳过。 4 NumPy基础:数组和矢量计算NumPy(Numerical Python)是高性能科学计算和数据分析的基础包,是python下几乎所有高级分析工具的构建基础。其主要功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且......

StudiousPrime

应领导要求给儿子做了一个英语单词联系网页StudiousPrime,目前为版本号为0.2,主要功能如下: 根据单词掌握程度新建测试Exercise,每个测试25道题Question,题目形式为根据中文单词(及词组)填充。题目中的单词会根据长度随机显示:有限个字母总长5个及以下的单词随机展示1个字母,6个及以上随机展示2个,10个以上随机展示3个,答对得1分且该单词得分+1,答错不得分。 ......

Improving your submission

1 Improving Our Features书接上回,我们刚刚完成了第一个Kaggle竞赛模型的提交,预测准确率是75%左右,排名将近5000。 本回将从以下三个方面来提高: 使用更好的机器学习算法 优化特征变量 结合多种机器学习算法 Let’s do it. 2 Random Forest Introduction首先我们引入一个新的算法决策树,决策树能够有效应对非线性关系。 举个......

Getting started with Kaggle

0 Prefacedataquest.io是一个在线学习数据科学的网站,内容涵盖Python、数据分析、数据可视化、统计学、机器学习、大数据工具、R等内容,并提供在线交互式编程环境,今天我们先来学习Kaggle的一个入门教程:Getting started with Kaggle 1 The Competition首先我们从Kaggle上最简单的题目入手:Titanic: Machine L......