首页
关于
论坛
投稿
搜索
统计之都
2019-07-13
35 / 44
新闻动态
首届全国大学生数据挖掘邀请赛圆满结束
统计之都
/
2011-05-16
2011年5月8日,来自浙江大学、厦门大学、复旦大学、浙江大学、北京大学、东南大学、中山大学、北京航空航天大学大学等多所高校的获奖队伍聚集于中国科学技术大学进行比赛的最终答辩环节,确定了最终的名次和奖项,标志着经过一个多月的群雄逐鹿,首届全国大学生数据挖掘邀请赛终于圆满结束。首届全国大学生数据挖掘邀请赛是由中国科技大学管理学院、中国人民大学统计学院和统计之都发起并主办,由上海花千树信息科技有限公司……
职业事业
一封统计之都读者来信及回复
谢益辉
/
2011-05-12
厦门大学的毛家栋同学几周前给我写了一封邮件,我看了之后觉得有拿出来公开回复的价值,一方面可以省去重复回复类似邮件的劳动,另一方面我也想借此机会说明统计之都(COS)网站的一些理念。本文不属于技术文章,但若能从此打开一个高手与新手互动的局面,那就善莫大焉了(当然我不是什么高手,只是跳梁者先出来献丑而已)。在征得同意之后,我将他的邮件以及其中的问题整理并回答形成本文,原邮件中的文字以引用格式出现(方框……
R会议
第四届中国R语言会议通知
统计之都
/
2011-04-28
R是一门用于数据分析和图形展示的语言、平台和环境,其官方机构每年都会举办useR!会议,各个国家及地区也定期有R用户的交流活动。在国内,自2008年以来,中国已经在北京和上海成功举办了三届R语言会议,促进了R语言在中国的推广和发展。为了进一步加强各领域R语言使用者之间的交流和互动,我们准备在2011年5月28日(北京会场)和2011年11月(上海会场,具体时间待定)举办第四届中国R语言会议。欢迎各……
统计应用
社会网络分析:探索人人网好友推荐系统
陈逸波
/
2011-04-28
最近四五年间,互联网行业似乎总是绕不开社交网络这个概念。无论是旗舰级别的传说中的facebook、LinkedIn,还是如雨后春笋般冒出来的各种团购和微博网站,全都或多或少地体现着SNS(社会网络服务)的特色。这些五花八门的产品,在丰富我们业余生活的同时,也为研究者提供了大量珍贵的数据。以往只能依靠有限的调研或模拟才能进行的社会网络分析(SNA),现在具备了大规模开展和实施的条件。国内著名而典型……
统计模型
分组最小角回归算法(group LARS)
郝智恒
/
2011-04-27
继续前两篇博文中对于最小角回归(LARS)和lasso的介绍。在这篇文章中,我打算介绍一下分组最小角回归算法(Group LARS)。本文的主要观点均来自Ming Yuan和Yi Lin二人2006合作发表在JRSSB上的论文Model selection and estimation in regression with grouped variables. 首先,我想说明一下,为何要引入分组变……
统计模型
修正的LARS算法和lasso
郝智恒
/
2011-04-25
在小弟的上一篇文章中,简单的介绍了LARS算法是怎么回事。主要参考的是Efron等人的经典文章least angle regression。在这篇文章中,还提到了一些有趣的看法,比如如何用LARS算法来求解lasso estimate和forward stagewise estimate。这种看法将我对于模型选择的认识提升了一个层次。在这个更高的层次下看回归的变量选择过程,似乎能有一些更加创新的想……
统计模型
LARS算法简介
郝智恒
/
2011-04-23
最近临时抱佛脚,为了讨论班报告Group Regression方面的文章,研究了Efron等人于2004年发表在Annals of Statistics里一篇被讨论的文章LEAST ANGLE REGRESSION。这篇文章很长,有45页。加上后面一些模型方面大牛的讨论的文章,一共有93页。对于这种超长论文,我向来敬畏。后来因为要报告的文章里很多东西都看不懂,才回过头来研读这篇基石性的文章。 所谓……
统计模型
正交试验和多因素方差分析
刘飞燕
/
2011-04-02
英国学者R. A. Fisher等在二十世纪前期开创了近代数理统计这门大学科,开始的标志是学生氏t分布的引入。在统计的发展过程中,Fisher又提出:“在进行一批试验之前,考虑到在取得这批试验的结果后,将要进行统计分析,因此,在试验前怎样合理地安排这批试验使得试验后的结果和统计分析取得更好的效果,是值得思考的。”在这种提法的推动下,在数理统计中形成了一种一分为二和合二而一的试验设计与方差分析这两个……
新闻动态
通知:首届全国大学生数据挖掘邀请赛
邱怡轩
/
2011-03-20
[…] Amazon的数百万图书,Netflix的10万部电影,淘宝的8亿件在线商品,以及数以亿万计用户的资料和行为记录……互联网最近十年的迅猛发展伴随着海量数据的积累。然而,在线用户常常面对过多的选择而显得无所适从。心理学研究证实,这类情境下的用户有时会做出放弃交易的决定,从而造成大量潜在的用户流失。针对这一现象,统计技术的发展能够为在线服务商提供更有效的推荐算法,在帮助用户走出信……
统计应用
统计词话(一)
邱怡轩
/
2011-03-04
不知道这个标题是否有足够的吸引力把你骗进来。如果你认为统计是一个到处充满了期望方差分布回归随机多元和概率的东西,那么……你可能是对的,不过本文想要告诉你的是,你其实还可以用统计来做一些你关心的事情,比如现在,我们既谈风月,也谈统计。:D 相信大家对宋词都不会陌生。无论你是否喜欢,总还是可以吟诵出几句名篇来的。如果你经常找一些宋词来读的话,你可能会发现一个有趣的现象,那就是有些词语或意象似乎特别受到……
R语言
用R也能做精算——actuar包学习笔记(三)
李皞
/
2011-02-13
时隔半年,终于隆重推出了最终版~ 本次包括以下重要更新: […] 增加了(五) 保单组合的模拟 和 (六) 信度理论 的有关内容。 […] 在(四)风险理论一节增加了VaR和TVaR的介绍。 […] 全文重新用LaTeX排版,版式更精美。 […] 修改了前面文章中的一些错误。 […] 感兴趣的读者可以下载文章的pdf版本:用R ……
统计模型
从线性模型到广义线性模型(2)——参数估计、假设检验
张缔香
/
2011-01-31
为了理论上简化,这里把GLM的分布限定在指数分布族。事实上,实际应用中使用最多的分布就是指数分布族,所以这样的简化可以节省很多理论上的冗长论述,也不会限制实际应用。 如前文如述,指数分布族的概率密度函数可以统一地写为: $$ f_Y(y;\theta,\Psi)=exp[(y\theta – b(\theta))/{\Psi} + c(y;\Psi)] $$ 这里为了在模型中体现散布参……
««
«
1
2
3
…
34
35
36
…
44
»
»»