[R] 利用R下載網頁上的檔案

最近用網路爬蟲, 赫然想到是否可以直接用R下載檔案, 發現真的有相關函式, 就是 download.file 。 你可以給他網址, 並且設定檔案名稱, 即可將檔案下載下來, 配合網路爬蟲抓取多個URL即可自動化下載多個檔案了(?)。 下面有程式碼範例。 Whe...

Read more

[好文] 資料科學面面觀

這篇文章由台大圖資系所整理, 講者為中研院資料科學研究所研究員, 提到一些大數據應用以及迷思。 演講投影片: 連結 台大圖資系整理文章: 連結

Read more

[R] 使用rvest進行網路爬蟲 (二)

  在使用網路爬蟲時,有些時候網頁的url並不一定具有規則(例如PTT),那我們可以先從其列表中抓取個網站的url(PTT的每一頁列表的url具有規則),再利用這些爬到的url去做網路爬蟲。   例如我要爬marvel版第1657頁的所有文章,我就需要讀取.title底下的a ...

Read more