Skip to content

Consultar notícias sobre tecnologia por meio de raspagem de dados

Notifications You must be signed in to change notification settings

annatrajano/project-tech-news

Repository files navigation

Este projeto contém os requisitos realizados por Anna Beatriz Garcia Trajano de Sá enquanto estudava na Trybe 🚀

Project Tech News

Neste projeto o objetivo principal era fazer consultas em notícias sobre tecnologia!

As notícias foram obtidas através da raspagem do Blog da Trybe: https://blog.betrybe.com.

Além disso, as notícias foram salvas no banco de dados (MongoDB) utilizando funções em python.

Instalação do projeto localmente:

Após cada um dos passos, haverá um exemplo do comando a ser digitado para fazer o que está sendo pedido, caso tenha dificuldades e o exemplo não seja suficiente, não hesite em me contatar em annagarcia@id.uff.br

  1. Abra o terminal e crie um diretório no local de sua preferência com o comando mkdir:
  mkdir projetos
  1. Entre no diretório que acabou de criar e depois clone o projeto:
  cd projetos
  git clone git@github.com:annatrajano/project-tech-news.git
  1. Acesse o diretório do projeto e depois crie um ambiente virtual para instalar todas as dependências necessárias:
  cd project-tech-news
  1. O Python oferece um recurso chamado de ambiente virtual, onde permite sua máquina rodar sem conflitos, diferentes tipos de projetos com diferentes versões de bibliotecas.

  2. criar o ambiente virtual

$ python3 -m venv .venv
  1. ativar o ambiente virtual
$ source .venv/bin/activate
  1. instalar as dependências no ambiente virtual
$ python3 -m pip install -r dev-requirements.txt

Com o seu ambiente virtual ativo, as dependências serão instaladas neste ambiente. Quando precisar desativar o ambiente virtual, execute o comando "deactivate". Lembre-se de ativar novamente quando voltar a trabalhar no projeto.

Habilidades Desenvolvidas

Neste projeto, desenvolvi as seguintes habilidades:

  • Utilizar o terminal interativo do Python
  • Escrever seus próprios módulos e importá-los em outros códigos
  • Aplicar técnicas de raspagem de dados
  • Extrair dados de conteúdo HTML
  • Armazenar os dados obtidos em um banco de dados (MongoDB)

Referências

Scraping: o que é e como fazer raspagem? [O guia completo!]
Python na Prática fazendo Web Scraping (de JavaScript dinâmico)

Escopo do Projeto

1 - Crie a função fetch

2 - Crie a função scrape_novidades

3 - Crie a função scrape_next_page_link

4 - Crie a função scrape_noticia

5 - Crie a função get_tech_news para obter as notícias!

6 - Crie a função search_by_title

7 - Crie a função search_by_date

8 - Crie a função search_by_tag

9 - Crie a função search_by_category

About

Consultar notícias sobre tecnologia por meio de raspagem de dados

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages