首页
关于
论坛
投稿
搜索
统计软件
2019-07-13
3 / 4
统计软件
RHadoop实践系列之一:Hadoop环境搭建
张丹
/
2013-03-24
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据所带来的单机性能问题,可能会一去不复返了。 RHadoop实践是一套系列文章,主要包……
统计软件
一起来投SCI吧:谈谈我的第一篇JSS论文
主伟呈
/
2013-03-06
Journal of Statistical Software(JSS)创建于1996年,该杂志的出版物主要包括论文、书评、代码片段以及关于统计学软件和算法的测评。其中,论文是发表最多的类型,截止发稿时为止(2013.03.04),官方数据显示该杂志总共发表论文565篇,代码片段37篇,书评110篇,软件测评6篇。在该杂志发表论文是免费的,并且论文及其附带的源代码都是可以从网上免费获得的,遵……
统计软件
2012年SAS公司博客排名
高燕
/
2013-02-24
想要了解和学习 SAS 产品的同学,一定要看看这个博客排名,因为这里有你需要的绝大部分资料,从数据处理、图形显示、分析、培训到最新的技术和产品信息。 前10名: […] Rick Wicklin, 博士, SAS 公司计算统计学方面资深研发人员,PROC IML 和 SAS/IML Studio 的首席开发工程师。精通计算统计学、统计图形、现代统计分析方法,是 Statistical……
统计软件
关联规则:R与SAS的比较
高燕
/
2013-02-17
啤酒和尿布的故事是关联分析方法最经典的案例,而用于关联分析的Apriori算法更是十大数据挖掘算法之一(http://www.cs.uvm.edu/~icdm/algorithms/index.shtml,这个排名虽然是几年前的调查结果,但是其重要性仍可见一斑)。本文以《R and Data Mining》书中使用的泰坦尼克号人员的生存数据为例,介绍如何使用R和SAS的Apriori算法进行关联分……
统计软件
R与SAS的集成
高燕
/
2013-02-16
一位优秀的分析师不仅要有深厚的理论功底、丰富的实战经验,还要熟悉几款常用的分析软件,并有一款自己精通的软件。就像武林高手既有独门秘器,又要熟悉各门各派,这样才能博采众长,兼收并蓄,为己所用。 竞争促进创新,合作带来双赢。R与SAS各有优势,也各有问题,国内外网上骂战得多,思考如何将两者集成并能拿出可行方案的人则少之又少,即便有也基本都是老外或者外籍华人想出来的。这里不想贬低国人,只想建议大家多一些……
统计软件
knitr与可重复的统计研究(花絮篇)
谢益辉
/
2012-06-11
2010年年底我写了两篇文章,关于Sweave/LyX/pgfSweave,顺便引出可重复研究(Reproducible Research)的概念。一年过后,我逐渐意识到这一系列基于Sweave的工具都有致命的设计缺陷,束缚感越来越强,屡屡冒出要重复造轮子的想法。于是就在“造乎?不造乎?”的犹豫中最终痛下决心全盘重造,knitr包就诞生了。在第五届中国R语言会议上魏太云已经对它作了初步介绍,我会在……
统计图形
中秋献礼——Layer图形设备
邱怡轩
/
2011-09-12
你在用R画图的时候,是否会遇到以下的麻烦: […] 于是接下来就有一个好消息和一个坏消息。好消息是有一个软件包可以解决上面的大部分问题了,而坏消息是这个包仍然处于开发阶段,所以各种bug是难以避免的。今天恰逢中秋,我便把这个自己编写的Layer软件包介绍给大家,算是送给大家的一份小礼物。 Layer顾名思义,指的是图层,而这个绘图设备正是采用了图层的思想。在你用Layer画图时,你可……
统计应用
R软件在精算教学中的应用案例
张缔香
/
2011-01-12
本文作者为张缔香,文章由COS编辑部审核发表,略有修改。点击此处下载/阅读本文PDF版本 R软件做为一种统计软件,因其开源、免费、灵活的诸多优点得到越来越多的关注,无论网络上还是实体书店,关于R的教程铺天盖地,不甚枚举。因此,本文的目标不是做R的教程,而是将R和保险、精算教学结合起来,通过几个案例来说明R在保险、精算专业日常的教学和研究中可用之处。 作者在保险、精算的理论、专业知识方面水平有限,……
统计计算
Sweave后传:统计报告中的大规模计算与缓存
谢益辉
/
2011-01-03
学无止境。我曾以为我明白了如何在Sweave中使用缓存加快计算和图形,但后来发现我并没有真的理解,直到读了另外一些手册才明白,因此本文作为前文“Sweave:打造一个可重复的统计研究流程”之续集,向大家介绍一下如何在Sweave的计算和图形中使用缓存,以节省不必要的重复计算和作图,让那些涉及到密集型计算的用户不再对Sweave感到难堪。 如果你还没读前文,建议先从那里开始读,了解Sweave与“可……
统计软件
Think SAS(二)
胡江堂
/
2010-12-30
有个老本家,著有《白话文学史》(上卷)、《中国哲学史大纲》(上卷),——你知道他叫胡适。然后有朋友问这个“Think SAS”系列有没有下文,我自然不敢托大,“半卷先生”不能做,还是老老实实地把这个系列往前推吧。 第一篇“Think SAS”中的“Think”,纯粹做“考虑”解,说,诸君如果为工作计,不妨考虑下SAS。下面说些关于SAS本身的一些思考与认识。俗话说,人类一思考,上帝就拍砖。上一篇是……
统计软件
Sweave:打造一个可重复的统计研究流程
谢益辉
/
2010-11-05
警告:本文提到的工具在更新中,请暂时不要按本文的配置去做,静候LyX 2.0.3的发布。 我们都痛恨统计造假。我们都对重复性的工作感到厌倦。如果你同意这两句话或这两句话适用于你的现状,那么本文将介绍一套开源、免费的工具来克服这两个问题。当然,前提是你愿意改变,这里的工具可以让这两种现象没有藏身之地,但无法改变造假和重复劳动的现实。以下为吊胃口视频(墙外观众可以看Vimeo;墙内看不到视频的可以任选……
统计软件
Think SAS(一)
胡江堂
/
2010-04-18
为什么你应该学SAS?本文不想卷入SAS与R,或者与SPSS、S-Plus、Matlab等统计软件孰优孰劣的争论中去,我是说,作为一个有志于投身工业界的统计分析人员,你为什么应该把SAS纳入你的分析工具箱?这会是一篇动员贴,尤其是对广大对数据分析感兴趣的在校生。在默认统计编程语言是R的“统计之都”,我需要拿上面这幅图来吸引眼球:学SAS吧。 R是好东西,不只是在COS,现在全世界的统计系和统计学生……
««
«
1
2
3
4
»
»»