當前位置:妙知谷 >

職場理財 >職場就業 >

R軟件如何讀取文本數據?

R軟件如何讀取文本數據?

R軟件中有很多程序包,比如RCurl、XML、rvest,以及R的基礎包,都有函數可以讀取文本數據,下面我們就來介紹下具體的使用方法。

操作方法

(01)對於網頁為csv文件的頁面,可以直接用函數導入網頁數據並轉為數據框的形式。html格式的網頁也可以讀取。例如:data <- (text="it is a page")#text是要查看的文本head(data,10)#讀取網頁數據的代碼data <- ("page"),page可以是要查看的網址或文本

R軟件如何讀取文本數據?

(02)R基礎包中的readLines可以讀取網頁或文本數據。#輸入文本cat("asqsdn1213",file="a1")readLines("a1") #讀取文本數據#cat中"n"表示換行。

R軟件如何讀取文本數據? 第2張

(03)RCurl包中的getURL()函數獲取網頁數據。library(RCurl)data<-getURL("a1")#a1為某個具體的網址。head(data)

R軟件如何讀取文本數據? 第3張

(04)通過getURL直接獲取的數據有些凌亂,可以藉助library(XML)解析樹函數htmlTreeParse處理。library(XML)#解析樹函數htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)

R軟件如何讀取文本數據? 第4張

(05)對於複雜網站的文本數據,用rvest包中的read_html函數來提取文本數據。library(rvest)page<-read_html("a1")#a1為某個具體的網址data<-html_nodes(page,"table")head(data)#本例中沒有輸入網址,所以結果為空。

R軟件如何讀取文本數據? 第5張

(06)通過html_nodes獲得的數據不能直接投入使用。table<-html_table(data);table #提取表格數據,可以得到多個表格結果table[1]#查看第1個表text<-html_text(data);text #提取文本數據#在實際應用中,可以發現提取表格後的數據或文本是非常便於分析的。

R軟件如何讀取文本數據? 第6張
標籤: 讀取 文本 軟件
  • 文章版權屬於文章作者所有,轉載請註明 https://miaozhigu.com/zclc/jiuye/5k6vo7.html