20150925 [R基礎與應用] Ch06 : 讀取各類資料

整理自 R 軟體資料分析基礎與應用 -- Ch06 : 讀取各類資料

[ 本次筆記內容 ]
  • (一)讀取 CSV
  • (二)讀取 Excel
  • (三)從資料庫讀取資料
  • (四)其他統計軟體的資料
  • (五)R 二進位檔 (RData檔)
  • (六)R 內建的資料集
  • (七)從網路提取資料
 
 
 
 

(一)讀取 CSV

1.  read.table()
  • [ 用法
  • read.table (file = 檔案路徑 , header = TRUE or FALSE, sep = "分隔符號")
  • [ 引數設定 ]
  • file    設定檔案的完整路徑
  • header    設定是否將資料的第一橫列設為直行名稱
  • sep    設定用來分隔資料的分隔符號
  • [ 注意事項 ]
  • 若發現 CSV 檔(或 tab 分隔值檔)內容有缺漏,例如分隔資料格的分隔符號出現在儲存格內。在這個情況下應該改用 read.csv2()read.delim2() 讀取資料。
 
> theUrl <- "http://www.jaredlander.com/data/Tomato%20First.csv"  # 讀取檔案的完整路徑(在此為網路位址)
> tomato <- read.table (file = theUrl, header = TRUE, sep = ",")  # 將檔案載入R,在這裡設定
 
 
2.  head()
  • [ 用法
  • head(資料表名稱)
 
> head(tomato)    # 查看檔案的第一部分
  Round             Tomato Price      Source Sweet Acid Color Texture Overall Avg.of.Totals Total.of.Avg
1     1         Simpson SM  3.99 Whole Foods   2.8  2.8   3.7     3.4     3.4          16.1         16.1
2     1  Tuttorosso (blue)  2.99     Pioneer   3.3  2.8   3.4     3.0     2.9          15.3         15.3
3     1 Tuttorosso (green)  0.99     Pioneer   2.8  2.6   3.3     2.8     2.9          14.3         14.3
4     1     La Fede SM DOP  3.99   Shop Rite   2.6  2.8   3.0     2.3     2.8          13.4         13.4
5     2       Cento SM DOP  5.49  D Agostino   3.3  3.1   2.9     2.8     3.1          14.4         15.2
6     2      Cento Organic  4.99  D Agostino   3.2  2.9   2.9     3.1     2.9          15.5         15.1
 
 
3.  data.frame()
  • [ 用法
  • data.frame (變數1 = 名稱1, 變數2 = 名稱2, 變數3 = 名稱3, ...... , stringsAsFactors = TRUE or False)