首页
关于
论坛
投稿
搜索
推荐文章
2019-07-13
2 / 6
推荐文章
3张图 解释我的数据价值观
张翔
/
2016-12-05
作者简介:张翔,车轮互联数据副总裁,COS9年老水友 […] 做数据的人现在越来越强调价值,那么在商业世界里,什么数据价值最高?我们先看几个例子: 一张简单的图表,可以决定一次投资的收益,号称最贵图表的,就是下面这张美国房价自1970年以来的走势图,蓝色的线是未剔除通胀,红色的线是剔除通胀,趋势非常明显。这张价值连城的图表,所需要的数据并不高深,相信在次贷之前,有一大批专业研究人员曾……
推荐文章
为什么我不是R方的粉丝
John Myles White
/
2016-09-01
本文翻译自 John Myles White 的博客 Why I’m Not a Fan of R-Squared。翻译工作已经获得作者授权同意。 […] 人们通常喜欢用 $R^2$ 作为评判模型拟合好坏的标准。与 MSE 和 MAD 不同,$R^2$ 不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利用因变量均值进行预测的模……
推荐文章
中药、西药及统计学
李舰
/
2016-08-04
作者简介: 李舰,现任九峰移动医疗 CTO,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。 擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn 等 R 包的作者。与肖凯合著了《数据科学中的R语言》, 参与翻译了《R语言核心技术手册》、《机器学习与R语言》。 这篇文章本来是从屠呦呦得诺奖的时候开始写的,作为一个拖延症晚期患者,直到今天才……
推荐文章
张志华教授:机器学习——统计与计算之恋
张志华
/
2016-06-23
编辑部按:本文是从张志华老师在第九届中国R语言会议和上海交通大学的两次讲座中整理出来的,点击此处观看幻灯片。张志华老师是上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和浙江大学统计科学中心兼职教授。张老师主要从事人工智能、机器学习与应用统计学领域的教学与研究,迄今在国际重要学……
推荐文章
数据江湖,回归5式
王汉生
/
2016-06-04
今天要跟大家分享的主题叫做:数据江湖,回归5式! 如今啊,大数据时代,群雄割据,天下大乱。各位童鞋,闯荡江湖,凶险难测。没一些必备的看家的本领,就想从数据出发,直达价值的彼岸,恐怕很难。 为此呢,熊大教大家几招防身绝技,叫做:回归5式!简单的说,就是5种最常见的回归模型。这5个招式,看似简单,却是熊大行走江湖的看家本领。回归5式,就如同少林长拳,看似平淡无奇,但是如果辅以深厚的内力,就能威力无比。……
推荐文章
统计之都十周年感言
谢益辉
/
2016-05-24
呐,统计之都已经创建十周年。作为所谓的创始人,自然也是时候卷起袖子跟大家一起干一大碗鸡汤,毕竟十年这个时间长度听起来好像还蛮厉害的。不巧最近这些天挺忙,加上我其实并不太喜欢专门写文字给乌泱乌泱的客官们看,年龄越大,就越不愿意去安利别人。这篇十周年感言如何写,每天晚上苦苦思考三分钟之后就睡得特别香。想全面概括这十年的发展是不可能的,只能用我最擅长的意识流方式想到哪儿说到哪儿了,这篇文章基本上是纯个人……
推荐文章
丑图百讲|好看的统计图都是相似的,难看的统计图各有各的丑
水妈
/
2016-05-24
大家好,我是水妈,在大学工作,主要教统计学。今天代表狗熊会,发起一个新的系列,丑图百讲。这个系列不讲炫酷的、高大上的统计图,而是给大家分享如何画好最基础的统计图。 读者可能会问,为什么要分享统计画图?熊大说了,数据分析的第一步,是梳理业务目标,接下来才是分析数据。水妈认为,在分析数据环节,第一步是做描述分析。这里的描述分析,包括三个内容:一、明确行业背景和变量含义;二、用统计图、统计表以及各种统计……
COS访谈
COS访谈第20期:千秋邈矣独留我,百战归来再读书:谢益辉
谢益辉 / 冯俊晨
/
2016-01-03
【COS编辑部按】 受访者:谢益辉 采访者:冯俊晨 […] 他站在技术与艺术的交界点。 ——沃尔特·华森《乔布斯传》 […] 2002年,谢益辉报考了中国人民大学统计学系。并不是因为他喜欢统计学——那时候他根本不知道统计学是什么——只是因为人大当年在湖北招生统计系有三个名额,比其他系都多,感觉录取概率会大一些。这个日后将跻身华人R开发者名人堂的湖北小伙,就这样从“种地……
推荐文章
使用ggtree实现进化树的可视化和注释
余光创
/
2015-11-30
本文作者:余光创,目前就读于香港大学公共卫生系,开发过多个R/Bioconductor包,包括 ChIPseeker, clusterProfiler, DOSE, ggtree, GOSemSim 和 ReactomePA。 进化树看起来和层次聚类很像。有必要解释一下两者的一些区别。 层次聚类的侧重点在于分类,把距离近的聚在一起。而进化树的构建可以说也是一个聚类过程,但侧重点在于推测进化关系和进……
推荐文章
泛滥与缺失:个人征信vs.征信误差评估
王汉生
/
2015-11-04
王汉生@北大光华 最近被刺激了!有人被刺激后的反应是以头抢地尔,而教授被刺激的第一反应是:写Paper!故事的发生是这样的。一天组会,大家东拉西扯,也不知怎么就扯到个人征信上去了。于是突发奇想,我请大家把自己的手机掏出来,每个人查一下自己的“芝麻信用”分是多少。王老师的芝麻信用分高居630之多,心想:这么高的芝麻信用分,可以秒杀众多学生,然后可以得意地哈哈大笑。 对,就是上面这个样子:哈,哈,哈,……
推荐文章
统计学发展方向的选择
王汉生
/
2015-10-02
看这题目,多吓唬人。又是方向,又是选择。一看就是知道作者是一个深受商学院教育毒害的砖家!但是,想跟大家说的是,我真心想把这个题目整小点,但是困难。为什么?因为接下来跟大家瞎聊的故事,确实关乎发展方向,确实关乎取舍。或者,至少关乎我自己的研究团队(小二十号兄弟姐妹)的方向和选择! 首先给大家简单介绍一点背景知识,小小吐槽一下现在统计学正面临的挑战。先从方法论说起。统计学的方法论主要依赖数学,尤其是概……
推荐文章
Hadley Wickham:一个改变了R的人
Dan Kopf
/
2015-09-21
【COS编辑部按】本译文得到了原英文作者的授权同意,翻译:冯俊晨、王小宁。 Hadley Wickham 是 RStudio 的首席科学家以及 Rice University 统计系的助理教授。他是著名图形可视化软件包ggplot2的开发者,以及其他许多被广泛使用的软件包的作者,代表作品如plyr、reshape2等。本文取自PRICEONOMICS. 通过数据从根本上了解世界真的是一件非常,非常……
««
«
1
2
3
…
6
»
»»