我国将建首个致畸风险数据库 随
数据库

R语言及数据挖掘应用培训 8月15-17日北京开班

  R是一套完整的数据处理、计算和制图软件系统,R是一种数学计算的环境,它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。在R网站上提供了统计及各个有关应用领域几乎所有最新的成果和代码公开的软件包。截至2012年7月底,CRAN库中的R包已经超过3900个,例如仅仅空间统计一个方向的软件包就有20多个。应广大R软件爱好者的需求,科学软件学习网和SupStat公司联合举办R语言基础及数据挖掘应用培训班,由SupStat公司资深R软件讲师主讲。

  陈堰平,曾担任新华社国家金融信息中心指数研究院研发部负责人,主要从事经济指数、金融衍生品方面的研究。2013年加入北京数博思达信息科技有限公司(SupStat?Inc.),主要从事统计咨询、金融数据分析、开发基于R语言的定制化统计软件,曾给惠普中国研发中心、花旗银行、东方航空、中国电信做过培训和咨询,多次在中国R语言会议上发表演讲,2013?Oracle技术嘉年华演讲嘉宾。现在同时也是统计之都管理团队成员,中国R语言会议理事会成员,曾获CQF国际数量金融认证,译作有《R语言编程艺术》,目前还参加其他几本R语言图书的编写和翻译。

  培训费用:2000元一人(7月20日前报名并缴费的学员可享有8折优惠,8月10日前报名并缴费的学员可享9折优惠)

  摘要:讲解R的基本操作知识,了解R的特点、资源获取方式,并掌握基本的程序编写

  摘要:R语言如何从各种方式读取数据,通过基本的WEB知识进行网页抓取,连接数据库,通过sql语句调用数据,从本地读取excel等各种文件数据。

  摘要:讲解R语言如何操作数据,能对数据进行自由的操作转换,特别是对于字符串和日期的操作处理。

  案例和练习:分析NBA数据,判断金融市场中的一月效应,找出QQ群中的话唠

  摘要:讲解R语言中基础绘图函数和高级绘图包的使用,理解可视化探索的各种方法

  摘要:讲解数据挖掘的主要任务,各挖掘方法的简要介绍和应用场景,典型的工作流步骤,以及R和数据挖掘之间的关系。

  摘要:讲解必要的统计学知识,了解各种概率分布、统计描述函数,以及学习假设检验的原理和应用

  摘要:讲解分析前的数据处理工作,包括如何识别数据中可能的问题,如数据缺失和数据噪声,如何解决这些问题。

  摘要:讲解最经典的回归分析方法,即对连续数值进行预测,学习其基本原理和前提假设,以及如何在R中实施回归

  摘要:讲解logistic回归,即对离散的类别数据进行预测,了解系数解释和模型的意义

  摘要:讲解如何对分类模型和回归模型进行评价,学习过度拟合与拟合不足的区别,并如何规避这些陷阱

  摘要:学习KNN分类方法的原理和实现过程,它的优点缺点,以及如何在R中的函数应用

  摘要:学习用kmeans来进行无监督学习,了解其原理和改进方法,并了掌握如何选择关键参数

  摘要:介绍基于R环境的文本挖掘入门,如何处理将文本这种非结构化数据转为结构化数据,并使用bayes进行分析。