Use o Excel como uma ferramenta para copiar dados da web
Web scraping é o ato de extrair dados, informações ou imagens de um site usando um método automatizado. Pense nisso como copiar e colar no modo totalmente automático.
Ou escrevemos ou usamos um aplicativo para ir aos sites que queremos e fazer uma cópia das coisas específicas que queremos desses sites. É muito mais preciso do que baixar um site inteiro .
Como qualquer ferramenta, a web scraping pode ser usada para o bem ou para o mal. Alguns dos melhores motivos para roubar sites seriam classificá-los em um mecanismo de pesquisa com base em seu conteúdo, comparação de preços ou monitoramento de informações do mercado de ações. Você pode até usá-lo como uma espécie de ferramenta de pesquisa.
Como posso raspar sites com o Excel?
Acredite ou não, o Excel tem a capacidade de extrair dados de sites há muito tempo, pelo menos desde o Excel 2003. É que web scraping é algo em que a maioria das pessoas não pensa, muito menos pensa em usar um programa de planilha para faça o trabalho. Mas é surpreendentemente fácil e poderoso. Vamos aprender como isso é feito criando uma coleção de atalhos de teclado do Microsoft Office.
Encontre os sites que você deseja acessar
A primeira coisa que faremos é encontrar as páginas da web específicas das quais desejamos obter informações. Vamos até a fonte e pesquise em https://support.office.com/ . Vamos usar o termo de pesquisa "atalhos usados com frequência". Podemos torná-lo mais específico usando o nome do aplicativo específico, como Outlook, Excel, Word e assim por diante. Pode ser uma boa ideia marcar a página de resultados para que possamos voltar lá facilmente.
Clique no resultado da pesquisa, "Atalhos de teclado no Excel para Windows". Uma vez nessa página, encontre a lista de versões do Excel e clique em Versões mais recentes . Agora estamos trabalhando com o que há de melhor e mais recente.
Poderíamos voltar para nossa página de resultados de pesquisa e abrir os resultados de todos os outros aplicativos do Office em suas próprias guias e marcá-los. É uma boa ideia, mesmo para este exercício. É aqui que a maioria das pessoas para na coleta de atalhos do Office, mas não nós. Vamos colocá-los no Excel para que possamos fazer o que quisermos com eles, quando quisermos.
Abra o Excel e o Scrape
Abra o Excel e inicie uma nova pasta de trabalho. Salve a pasta de trabalho como Atalhos do Office . Se você tiver o OneDrive, salve-o lá para que o recurso AutoSalvar funcione.
Depois que a pasta de trabalho for salva, clique na guia Dados .
Na faixa da guia Dados, clique em Da Web .
A janela do assistente From Web será aberta. É aqui que colocamos o endereço da web ou URL do site do qual queremos extrair os dados. Mude para o seu navegador da web e copie o URL.
Cole a URL no campo URL do assistente From Web. Podemos escolher usar isso no modo Básico ou Avançado . O modo Avançado nos dá muito mais opções sobre como acessar os dados do site. Para este exercício, precisamos apenas do modo Básico. Clique OK .
O Excel agora tentará se conectar ao site. Isso pode demorar alguns segundos. Veremos uma janela de progresso, se houver.
A janela do Navigator será aberta e veremos uma lista de tabelas do site à esquerda. Quando selecionarmos um, veremos uma visualização da tabela à direita. Vamos selecionar a tabela de atalhos usados com frequência .
Podemos clicar na guia Visualização da Web para ver o site real, se precisarmos procurar a mesa que desejamos. Quando o encontrarmos, podemos clicar nele e ele será selecionado para importação.
Agora, clicamos no botão Carregar na parte inferior desta janela. Existem outras opções que podemos escolher, que são mais complexas e estão além do escopo de fazer nosso primeiro scrape. Esteja ciente de que eles estão lá. Os recursos de web scraping do Excel são muito poderosos.
A tabela da web será carregada no Excel após alguns segundos. Veremos os dados à esquerda, onde o número 1 está na foto abaixo. O número 2 destaca a consulta usada para obter os dados do site. Quando temos várias consultas em uma pasta de trabalho, é aqui que selecionamos aquela que precisamos usar.
Observe que os dados vêm para a planilha como uma tabela do Excel. Já está configurado para que possamos filtrar ou classificar os dados.
Podemos repetir esse processo para todas as outras páginas da web que possuem os atalhos do Office que desejamos para Outlook, Word, Access, PowerPoint e qualquer outro aplicativo do Office.