首页
关于
论坛
投稿
搜索
统计之都
2019-07-13
1 / 44
COS访谈
作者访谈 | 数据资产论
王小宁 / 黄湘云
/
2019-07-04
《数据资产论》作者王汉生简介 王汉生,北京大学光华管理学院商务统计与经济计量系,嘉茂荣聘讲席教授,博导,系主任。北京大学商务智能研究中心主任。数据科学微信公众号“狗熊会”创始人。致力于商务统计学的理论研究与产业实践。 1998 年北京大学数学学院概率统计系本科毕业,2001 年美国威斯康星大学麦迪逊分校统计系博士毕业。2003年加入光华至今。国内外各种专业杂志上发表文章一百多篇,并合著有英文专著共……
推荐文章
统计月读(2019 年 6 月)
2019-07-01
推荐语:这个仓给出了常见算法的 python 实现,其实对其他语言也做了汇总,不过 python 的这个算是最完整的。R 的话 caret 包的文档可能对机器学习的包总结比较全些,至于排序、寻址、加密解密这些算法估计一般也不会用 R 来实现吧。 推荐人:于淼 链接:https://github.com/TheAlgorithms/Python […] 推荐语:国际贸易数据对于我们了解……
统计模型
倒数的诚信与消失的变量
邱怡轩
/
2019-06-25
今天朋友之间分享了一篇发表在《科学》杂志上的论文,《Civic honesty around the globe》,意即全球各地的公民诚信度。这篇论文的作者在全世界的40个国家做了一个大型的社会实验,即在不同的场所放置事先准备好的钱包,钱包中留有“主人”的联系方式,然后通过观察是否有人联系失主来推断公民的诚信程度。 这篇论文之所以受到关注,是因为大家发现文章里中国的公民诚信值位列倒数第一,于是大家……
统计软件
基于 R Markdown 的演示文稿和报告模板使用经验
李家郡
/
2019-06-19
英语演讲课曾说,幻灯片只是辅助工具,而内容才是演讲的核心和本质。报告和幻灯片,其本质都是服务于“展示知识”这个过程,两者有着相通之处。利用 R Markdown 可以特别方便地将一份课程报告转化为课程答辩幻灯片,也可以将幻灯片填充些内容后形成总结报告。这四年来,利用两者的转换关系,我节约了不少时间。 作为排版困难者,我尝试着探索了一些只关注内容的幻灯片和报告的写法。随着四年统计学习,R 虽然已经快……
推荐文章
女士品茶的实验、假设和检验
丁鹏
/
2019-05-30
R. A. Fisher 的名著《实验设计;第八版,1971年》第二部分有十六页,仅仅讲了一个最简单的实验:女士品茶。这个故事非常有名,以至于 Salsburg 的统计学通俗读物就以它命名:《女士品茶:20世纪统计怎样变革了科学》。 先回顾一下这个故事。在英国的 Rothamsted 实验站,Fisher 给一位名叫 Muriel Bristol 的女士倒了一杯茶,但是 Bristol 表示,自己……
统计应用
中国传统中的统计思维
李舰
/
2019-05-08
这是拙作《统计之美:人工智能时代的科学思维》的序言,虽然这本书是在讲一些统计相关的小故事,也试图用轻松的语言介绍数据科学领域的一些理论和应用基础,但关于统计学中的科学思维、尤其是中国传统文化中的统计精神,是我动笔前的主要动因。我对各种攻击中国文化没有科学精神的观点一直不满,所以写了这篇序,希望能和更多人探讨。 […] 英国学者李约瑟研究中国科技史时提出了一个问题:“尽管中国古代对人类……
推荐文章
统计月读(2019 年 5 月)
2019-05-01
推荐语:2019年,第十二届中国R会议(北京)将于5月24-26日在中国人民大学举办。2019年,是中国R会议值得纪念的第12个年头,12年象征一个轮回,这一个轮回中,变化的是不断壮大的统计与数据科学领域奋斗者队伍,是日渐凝聚的统计力量,而不变的是中国R会议的初心——服务广大统计与数据科学爱好者,推动中国R会议的不断发展。在这样一个值得纪念的时刻,让我们相约中国人民大学,共赴这场数据科学盛会!本届……
新闻动态
统计月读(2019 年 4 月)
2019-04-01
推荐语:PAC学习理论是统计机器学习中最最重要的基础理论之一,它解答了机器学习机制、可学习性等一系列问题,衍生出了计算学习理论这一机器学习的子领域。这篇文章对PAC理论中的概念进行了较为详细的梳理,并加入了作者自己的理解,挺适合统计机器学习初学者一窥门径。 推荐人:林枫 链……
R会议
第12届中国R会议(北京)通知
统计之都
/
2019-03-25
[…] 2019年,第12届中国R会议(北京)将于5月24-26日在中国人民大学举办。2019年,是中国R会议值得纪念的第12个年头,12年象征一个轮回,这一个轮回中,变化的是不断壮大的统计与数据科学领域奋斗者队伍,是日渐凝聚的统计力量,而不变的是中国R会议的初心——服务广大统计与数据科学爱好者,推动中国R会议的不断发展。在这样一个值得纪念的时刻,让我们相约中国人民大学,共赴这场数据……
新闻动态
统计月读(2019 年 3 月)
2019-03-01
推荐语:传感技术是数据收集的底层支撑,当开放数据不能满足需求时,使用开源硬件搭建传感平台收集展示数据就成了天然需求。开源硬件平台目前比较流行的是全功能的树莓派/Rock64系列与单一功能但开发便利的单片机 arduino,当然还有个介于之间的 intel Galileo 平台(善用搜索建议功能)。那么如何实现开源硬件与数据分析平台的交互呢?这篇文章提供了 arduino 与 R 的交互函数,使得实……
新闻动态
统计月读(2019 年 2 月)
2019-02-01
推荐语: FlowingData 是一个关注数据可视化的博客,这是其2018年的总结及文章推荐,这个博客很多可视化直接用的开放数据,同一数据通过不同可视化方式就会表现出不同主题,形式或技术与内容或数据从来都没有完全分开过,运用之妙,存乎一心,窃以为这是只修炼抽象理论所不易到达的。 推荐人:于淼 链接:https://flowingdata.com/2018/12/31/2018/……
R 语言
大规模地理数据可视化入门:Deck.gl 和 H3
朱俊辉
/
2019-01-05
[…] 如何大规模可视化地理数据一直都是一个业界的难点,随着2015年起 Uber 在这一领域的发力,构建了基于 Deck.gl + H3 (deckgl,h3r) 的大规模数据可视化方案。一方面,极大地满足了日常前端开发者的需求。另一方面,也极大地方便了数据科学家的可视化工作。在大规模空间轨迹分析、交通流量与供需预测等领域这一方案正得到广泛应用,突破了传统方法中数据量(通常不会超……
««
«
1
2
3
…
44
»
»»