Aunque muchos de los ejemplos en este tutorial se han enfocado en leer archivos y buscar datos en ellos, hay muchas fuentes de información diferentes si se tiene en cuenta el Internet.
En este capítulo fingiremos ser un navegador web y recuperaremos páginas web utilizando el Protocolo de Transporte de Hipertexto (HyperText Transfer Protocol HTTP). Luego revisaremos los datos de esas páginas web y los analizaremos.
TEMARIO:
- Protocolo de Transporte de Hipertexto – HTTP
- El navegador web más sencillo del mundo
- Recepción de una imagen mediante HTTP
- Recepción de páginas web con urllib
- Leyendo archivos binarios con urllib
- Análisis de HTML y rascado de la web
- Análisis de HTML mediante expresiones regulares
- Análisis de HTML mediante BeautifulSoup
- Sección extra para usuarios de Unix/Linux
- Glosario
- Ejercicios
Debe estar conectado para enviar un comentario.