teaching:progappchim:urllib

Lecture du code source d'une page web via la librairie urllib

urllib-read-01
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
exemple de programme pour obtenir le code d'une page avec la librairie urllib
source : https://realpython.com/python-web-scraping-practical-introduction/
 
"""
from urllib.request import urlopen
 
 
site_url = 'https://dvillers.umons.ac.be/wiki/page_simple'
page = urlopen(site_url)
print(page)
# page est un objet urllib
 
html_bytes = page.read()
html = html_bytes.decode("utf-8")
# html est une chaîne de caractères contenant la page web, après décodage
 
lines = html.splitlines()
print(lines)
# lines contient les lignes de la page web
 
print('***************************************************************')
 
# affichage de toutes les lignes
for line in lines:
    print(line)
Ce site web utilise des cookies. En utilisant le site Web, vous acceptez le stockage de cookies sur votre ordinateur. Vous reconnaissez également que vous avez lu et compris notre politique de confidentialité. Si vous n'êtes pas d'accord, quittez le site.En savoir plus
  • teaching/progappchim/urllib.txt
  • Dernière modification: 2022/03/21 15:46
  • de villersd