[R] 計算文字在句子中出現次數

一般判斷句子中是否出現文字常用的是 grepl, 不過 grepl 是回傳 TRUE 或 FALSE, 而要計算文字在句中出現次數的話, 就要使用 stringr 套件中的 str_count , 其回傳值為出現次數(數值), 下面範例可以試試看, 會比較好理解。

Read more

[R] dplyr 轉換為 data.table 在處理速度上具有差異

最近在作些一般分析時, 發現當資料量大的時候, dplyr  跟  data.table  處理會差很多(個人處理到200萬筆資料時速度上就有明顯差異)。 此篇文章有 data.table 的介紹: 連結 , 詳細內容可以看上述文章, 下面舉三個例子(有的文章內沒有)...

Read more

[R] 更改檔案名稱及壓縮檔案 (rename, zip)

最近發現比較有趣的功能, R也可以結合迴圈等語法修改以及壓縮大量檔案。 修改檔名是用 file.rename , 下面範例中 from 帶入的是原本的檔案名稱, to 則是修改後的名稱。 壓縮檔案是用  zip , zipfile 是帶入壓縮檔的名稱, files...

Read more