R笔记：因子

Original vacleon 统计浆糊 2023-09-26

变量可以简单地分为连续变量和分类变量（类别变量），分类变量又可以分为名义变量（包括二分类变量和无序多分类变量）和等级变量（有序多分类变量）。分类变量在R中称为因子。因子在R中很重要，可以影响到数据的分析方式。

函数factor()可以将向量编码成因子，对分类变量的每一个水平（原始值）赋值为一个整数，并以整数向量的形式储存起来。

factor {base}: The function factor is used to encode a vector as a factor (the terms "category" and "enumerated type" are also used for factors). If argument ordered is TRUE, the factor levels are assumed to be ordered. For compatibility with S there is also a function ordered.

is.factor, is.ordered, as.factor and as.ordered are the membership and coercion functions for these classes.

factor(x = character(), levels, labels = levels,exclude = NA, ordered = is.ordered(x), nmax = NA)

ordered(x, ...)

解释一下比较重要的几个参数。ordered：logical flag to determine if the levels should be regarded as ordered (in the order given)，默认FALSE，构建名义变量；ordered=TRUE时将会构建有序变量，函数会根据字母顺序（字符变量）或数字顺序（数值变量）赋值因子的水平，也可以通过指定levels选项来覆盖默认排序。对于数值型变量，labels可以赋予数值实际意义的标签。需要注意的是，在数据中出现但在levels没有列举的值将会按缺失值处理。

levels代表原始类别名称（因子格水平的名称），levels选项中原始类别名称的从左到右的排列顺序对应赋值由小到大，如果levels缺失，则默认由字母顺序（字符变量）或数字顺序（数值变量）赋值因子的各水平。factor函数类似于SPSS中通过values给原始类别名称赋值，lables相当于对类别名称进行重命名，类似于SPSS中label。

创建因子后，针对该因子的任何分析都会将其作为创建的名义型（ordered=FALSE）或者有序型（ordered=TRUE）变量对待，并自动选择合适的统计方法。

其他参数可参见函数介绍文件。

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

R笔记：因子

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

生成图片，分享到微信朋友圈

R笔记：因子

您可能也对以下帖子感兴趣