【Python爬虫】120行代码爬取豆瓣电影，附源码( 四 )_学习爬虫

star_save.append(star.text)
stars.append(star_save)
# print(stars)
# 爬取制片国家
#制片国家/地区: 美国 
# 学到的知识点：通过匹配文本内容找下个兄弟节点
country = soup.find('span' text='制片国家/地区:').next_sibling[1:

countrys.append(country)
# print(countrys)
# 爬取影片语言
# 语言:
language = soup.find('span' text='语言:').next_sibling[1:

languages.append(language)
# print(language)
# print(directors)
# print(true_director)
# print(a)
if __name__ == '__main__':
base = base_urls(base_url)
print(base)
print(len(base))
parse_url(base)
print(countrys)
print(directors)
print(languages)
print(names)
#
# 最后我们将数据写入到一个excel表格里
info ={'Filmname':names 'Directors':directors 'Country':countrys 'Languages':languages
pdfile = pandas.DataFrame(info)
# pdlook.to_excel('链家.xlsx' sheet_name=\"链家二手房广州\")