分类数据,在R中称为“因子”数据,在数据争用中提出了独特的挑战。R用户经常看不起像Excel这样的工具,因为它会自动将变量强制为不正确的数据类型,但是R中的因子数据也会产生非常类似的问题。stringsAsFactors=HELLNO运动和标准的Tidyverse默认值使我们远离了因子的使用,但它们有时仍然是分析所必需的。本讲座将概述R中分类变量变换引起的常见问题,并展示使用base R和Tidyverse(特别是dplyr和forcats函数)避免这些问题的策略。

查看材料

相关的论文DSS集合

标签: 因素 forecats

订阅更多鼓舞人心的开源数据科学内容。

我们喜欢庆祝和帮助人们做伟大的数据科学。通过订阅,每当我们发布新内容时,你都会收到通知。