斧不止三板

python简单爬虫 用lxml解析页面中的表格

目标:爬取湖南大学2018年在各省的录取分数线,存储在txt文件中 部分表格如图: 部分html代码: 代码: 注:原本数据字典是这样写的: 输出结果有很多‘\xa0’,其实就是空格,源网页中就字段里就存在很多空格: plus:解析表格有更好的方法,比如pandas,一步到位!非常方便。 详情请看a56爆大奖在线娱乐

posted on 2019-04-25 15:51  斧不止三板  阅读(7480)  评论(0编辑  收藏  举报

导航