1.1 Imports 导入
Next: Export to text files,Previous: Introduction,Up: Introduction
1.1 Imports 导入
导入 R 的数据中最容易的格式是简单的文本文件。对于小型或中型的问题,这种格式都可以接受的。从文本文件导入数据的原始函数(primary function)是 scan。电子表格类似数据(Spreadsheet-like data)一章中讨论的大多数比较便利的函数都是基于这个原始函数。
但是,所有的统计顾问们对客户用软盘或光盘提交一些私有的二进制数据(比如,`Excel 电子表格'或`SPSS文件')都比较熟悉。通常,可以做的最简单的事情是用原始软件把数据用文本文件导出(而统计顾问们为了这个目的会在他们电脑里面安装大多数常用的软件)。不过,这不会总是可能的1。在从其它统计软件中导入数据(Importing from other statistical systems)一章中,我们会讨论一些可以在 R 里面直接读取这些文件的工具。对 Excel 电子表格,读取Excel电子表格(Reading Excel spreadsheets)一章对可以获得的相关方法进行了总结。
在很少的一些例子中,出于简洁和快速访问考虑,数据以二进制格式保存。这种情况下一个例子是我们已经见过几次的图像数据。它通常以二进制流的方式保存然后在内存里面呈现,而且可能在数据前面加个信息头。这种数据格式在二进制文件(Binary files)和二进制连接(Binary connections)部分都有所讨论。
对于大的数据库数据,通常要借助数据库管理系统(Database managementsystem,DBMS)来处理。我们可以通过DBMS从数据库里面提取没有格式的文本文件,但是对于大多数这一类型的DBMS,我们可以直接通过 R的包来实现数据提取操作:见关系数据库(Relational databases)部分。通过网络连接来导入数据在网络接口(Network interfaces)一章讨论。
Footnotes
[1] 译者注:国外的软件破解版没有我们这么容易方便。还有,软件太大了,有时,也不愿安装。比如SPSS,SAS比 R 大多了。
Hits:Loading...
- Previous Page: 1 绪论
- Next Page: 1.2 导出到文本文件中
