图书馆

杭州校区  8:00—21:30

绍兴校区  8:00—21:00

首页 / 最新专著 / 正文
《大数据分析——基于R语言》
来源:   作者:   编辑:   时间:2020-09-18   点击数:


作者:(印)塞玛·阿查亚(Seema Acharya)、李媚

ISBN:9787302557326


内容简介:

本书共12章,每章的内容安排如下:

第1章。介绍R及R软件包的安装,使读者通过find.package()、install.packages()、library()、vignette()和packageDescription()函数利用任意R包进行工作。

第2章。利用dir()和list()函数分析目录下的内容,并利用str()、summary()、ncol()、nrow()、head()、tail()和edit()等函数轻松地分析数据集。

第3章。本章帮助读者熟悉从csv文件、电子表格、网络、JASON文档、XML等导入数据的过程,熟悉MySQL、PostgreSQL、SQLite和JasperDB等数据库在R中的使用方法。

第4章。主要关于数据框的操作,帮助读者将不同类型的数据存入数据框,并从数据框中提取数据,执行dim()、nrow()、ncol()、str()、summary()、names()、head()、tail()和edit()等R函数,以理解数据框中的数据;帮助读者实现对数据的描述性统计(如频数、均值、中值、众数、标准差等)。

第5章。讨论常用于基于预测变量预测结果变量值(目标或响应值)的回归分析。

第6章。介绍逻辑回归、二项逻辑回归模型和多元逻辑回归模型。

第7章。关于分类问题,帮助读者引入一个决策树以执行分类,并利用创建的决策树模型预测结果变量的值。

第8章。介绍探索时间序列数据,帮助读者使用scan()和ts()函数读取时间序列数据,对其应用线性滤波,并对时间序列数据进行分解;通过合适的绘制图对时间序列数据进行可视化。

第9章。帮助读者利用hclust()函数实现在R中的聚类,讨论R中的kmeans算法。

第10章。帮助读者在给出特定事务和项集的情况下确定关联规则,同时使用支持度、置信度和提升度对关联规则进行评价;讨论在R中实现关联规则的挖掘,创建给定项集的二元关联矩阵,创建项矩阵,确定项频率,使用apriori()函数和eclat()函数。

第11章。帮助读者在R中实现对文本的挖掘。

第12章。使用doParallel包和foreach包在R中进行并行计算。