• snapshot
    How to use Puppeteer with Docker

    Puppeteer is a Node.js library that provides a high-level API to control Chromium (or Firefox) browsers. Puppeteer is a Node.js library for interacting with Chrome. Firefox support has also been added recently.
    The Puppeteer Node.js image is used inside the Docker container. When installing chromium from apt, if we use Docker images for Node.js v14 LTS Gallium, it will be v90.0, which may cause compatibility issues. Chromium's latest stable release was used to test it.


  • 23c0ff0c5fd9c5d33890b5fc2ccd86ce.png
    Headless Chrome : A Puppeteer Basic Tutorial

    Using a headless browser, we show how to perform web scraping. The author provides a Puppeteer tutorial that demonstrates how to take screenshots and gather structured data using Google Chrome using Puppeteer. 


  • f60a15da92659c2653705b049a342909.png
    What does "headless browser" mean? Does scraping a website violate the law?

    The six most frequently asked questions about headless chrome and puppeeter


  • 4bff57a0671971b8b5605f519105af8d.png
    How to avoid getting blocked when scraping the website?

    A web scraper is an application that scrapes or extracts data from a website using a browser or HTTP protocol. You can use a bot or a web crawler to automate the process or you can do it manually. Additionally, web scraping is not illegal unless you're trying to access non-public data (such as login credentials) that is unreachable to the public.


    It might not be a problem to scrape through small websites. Some big websites or even Google might ignore your requests or even block your IP address when you attempt web scraping.


    We will discuss some best practices to avoid getting yourself blocked (your IP) when scraping data from the web in this article.