Skip to content

Crawling Service for GuidaMichelin@Social, Software Engineering Course @ UniPD

Notifications You must be signed in to change notification settings

marcouderzo/CrawlingService

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CrawlingService for GuidaMichelin@Social

Questo repository contiene il servizio di crawling per il progetto di SWE 2021/22: GuidaMichelin@Social proposto da Zero12.

Changes

  • La prima versione del crawler usava Selenium per fare web scraping su Instagram, basandosi sui tag HTML e gli attributi CSS. Questo metodo, seppur funzionante, era poco elegante e potenzialmente inaffidabile in caso qualcosa fosse cambiato nell'HTML e CSS delle pagine analizzate.
  • La seconda versione del crawler utilizza instagrapi, un'API non ufficiale per Instagram, che offre più funzionalità e affidabilità.

About

Crawling Service for GuidaMichelin@Social, Software Engineering Course @ UniPD

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%