Loading...
公務員開放資料Lesson 1
(ver1.0)
〈
公務員開放資料 Lesson 系列傳送門
〉
本文件目錄
+
PART I - 原則性問題
+
PART II - 常見錯誤案例【千萬不可犯的錯】
+
常見錯誤一:合併欄位
+
常見錯誤二:把兩份資料集放在同一個csv上
+
常見錯誤三:編碼格式是BIG5
+
常見錯誤四:欄位分在不同欄/分在不同
+
常見錯誤五:空白欄位
+
PART III 常見瑕疵案例【有注意會更好】
+
常見瑕疵一:數值的「逗號」請去掉
+
常見瑕疵二:有重複欄位
+
常見瑕疵三:沒有欄位名稱
+
常見瑕疵四:分隔方式檔名要注意
+
常見瑕疵五:建議不要加入小計、總計欄位
+
PART IV 其他資料工作建議
PART I 原則性問題:直接把excel轉csv
機器可以辨識讀取的樣子
※資料來源:
iTaiwan中央行政機關室內公共區域免費無線上網熱點查詢服務
第一欄是各筆資料的對應「項目」名稱,第一欄下面各欄則為每一筆「資料」。
問題點
許多資料是直接
將
excel
做格式轉換(xls
轉成csv
)
,轉成csv
格式
後看不出原始檔案的合併儲存格等原始問題點,反而更難
修正或
使用。
建議解法
速成解法:上傳開放資料時,同時上傳csv及excel檔案。
如果副檔名是 .xlsx
(Office
XML) 的話,
社群是可以處理的
,請直接上傳。
治本解法:未來可以做一個功能,把資料上傳到某個地方後,可以判斷這個檔案轉csv後會不會有問題,直接給出建議「上傳csv即可」或是「請附加上傳excel」。
PART II
常見錯誤案例
常見錯誤一:合併欄位
案例來源
:
http://data.gov.tw/node/12235
資料問題
:目前很多開放資料平台上的資料打開後,都會長成左邊這個樣子,你會發現上面有很多是【空白】的儲存格。原因是因為原始我們公務部門同仁用excel製作表格資料的時候,是像右邊這樣子,每個顏色區塊都是利用「合併儲存格」的功能。但是!只要excel檔案存成csv時,合併儲存格無法被記錄,就會變成左邊的樣子了。左邊這種充滿空白儲存格的資料後,其實是無法使用的。
Please turn on JavaScript to use Paper in all of its awesomeness. ^_^
本文件目錄
PART I 原則性問題:直接把excel轉csv
PART II 常見錯誤案例