R语言如何将大型Excel文件转为dta格式详解

本文以2000年度我国工业企业数据库为例，该文件后缀名为xlsx，包含约16万条记录，文件有88m这么大。直接使用excel打开都费劲：等待时间久，电脑风扇呼呼呼作响。如果尝试用stata打开该xlsx文件，则会出现提示报错。

报错原因在于，stata无法读取超过40m的excel文件。

这就好比瓜迪奥拉的传控足球固然美丽，但是面对摆大巴的球队无能为力。

破大巴需要攻城锤，这把锤子的名字就是r语言。万事开头难啊，正憧憬着数据清洗和花式选取变量建模呢，可不能连数据们长啥模样都没见着啊。r语言适时挺身而出，帮助stata叩开大型excel文件之门。

在rstudio中运行如下代码，过程较为浅显，首先引入两个r包，然后输入xlsx后缀名文件，最后便可输出dta后缀名文件。等待2分钟，谁让文件那么庞大呢，接下来便是见证奇迹的时刻。

library(openxlsx)
library(foreign)

x = read.xlsx('2000.xlsx',1)  # 读取 excel 的 sheet1
# view(x)
write.dta(x, '2000.dta')    # 输出为 stata 能读取的格式

在stata中打开该文件，屏幕会显示这份文件是在r中转化而来。

也许你有更好的转化方法，欢迎赐教。

总结

到此这篇关于r语言如何将大型excel文件转为dta格式的文章就介绍到这了,更多相关r语言大型excel为dta内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com！

黄山市民网：https://www.huangshanshimin.com/