【Python爬虫】120行代码爬取豆瓣电影,附源码( 四 )
star_save.append(star.text)
stars.append(star_save)
# print(stars)
# 爬取制片国家
#<span class=\"pl\">制片国家/地区:</span> 美国<br>
# 学到的知识点:通过匹配文本内容找下个兄弟节点
country = soup.find('span' text='制片国家/地区:').next_sibling[1:
countrys.append(country)
# print(countrys)
# 爬取影片语言
# <span class=\"pl\">语言:</span>
language = soup.find('span' text='语言:').next_sibling[1:
languages.append(language)
# print(language)
# print(directors)
# print(true_director)
# print(a)
if __name__ == '__main__':
base = base_urls(base_url)
print(base)
print(len(base))
parse_url(base)
print(countrys)
print(directors)
print(languages)
print(names)
#
# 最后我们将数据写入到一个excel表格里
info ={'Filmname':names 'Directors':directors 'Country':countrys 'Languages':languages
pdfile = pandas.DataFrame(info)
# pdlook.to_excel('链家.xlsx' sheet_name=\"链家二手房广州\")
推荐阅读
- Python|阿里达摩院13小时讲完的python!整整466集,拿走不谢
- 爬虫学习之HttpClient练习
- Python打开和关闭文件
- 爬虫学习之HTTP协议初步了解
- 用python爬了840款真无线蓝牙耳机数据,竟发现了几个有趣结论!
- 手把手教你使用Python操控手机微信app(最新教程)
- Python编程常用技巧,你全知道么?
- 升职加薪利器:Python+Pytest框架在Jenkins上生成Allure测试报告
- 编程零基础应当如何开始学习 Python?
- 女神照片当背景,使用Python做个免费的VIP视频播放软件