爬取xml数据之R-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

爬取xml数据之R

阅读量：7262 次

发布时间：2019-06-29

本文共 331 字，大约阅读时间需要 1 分钟。

生物信息很多时候要爬数据。最近也看了一些这些方面的。

url<-"要爬取的网址"

url.html<-htmlParse(url,encoding="UTF-8")

如果要获得部分信息，则使用XPath方法。

xpath<-"//*[@id='填写目标id']/span[@id='细分标签的id']

目标id.node<-getNodeSet(url.html,xpath)

//表示任意个html嵌套标签

*表示任意个标签

/表示下一级，span则表示细分标签

如果要读取节点下表签内的内容，则使用xmlValue;xmlGetAttr则可以读取某个属性值

转载于:https://www.cnblogs.com/ubiwind/p/9883151.html

你可能感兴趣的文章

三个应用案例——大数据挖掘潜在的威胁

GEF常见问题7：计算字符串在画布上占据的空间

JS不忘本之JS类篇～类，方法，属性，子类，扩展方法在ＪＳ里的实现

【JSP EL】el表达式判断是否为null

java的nio之：java的nio系列教程之SocketChannel

强化学习之免模型学习（model-free based learning）

SQLite3日期与时间，常见函数

排班知识点

用U盘安装Ubuntu系统

ASP.NET Core学习之三 NLog日志

计算机常用端口一览表

态度以及业余付出决定程序生涯

Datapump数据迁移的实践总结

为什么要避免标题关键词重复？

高性能--解决mysql连接和进程故障

搜索引擎网页去重算法解析

C++对象模型（虽然在GCC下很大的不同，但是先收藏）

[20150314]256列.txt

SAP QM Partial Lot

[20151201]备份迁移sql profile.txt

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-14 02:18:13 当前IP: 3.12.36.56 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我