معرفی شرکت ها


docscraper-2.0.7


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A web crawler to scrape documents from websites
ویژگی مقدار
سیستم عامل -
نام فایل docscraper-2.0.7
نام docscraper
نسخه کتابخانه 2.0.7
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Patrick Ryan
ایمیل نویسنده pjryan126@gmail.com
آدرس صفحه اصلی https://docscraper.readthedocs.io/en/latest/
آدرس اینترنتی https://pypi.org/project/docscraper/
مجوز MIT
[![Travis](https://travis-ci.com/pjryan126/docscraper.svg?branch=main)](https://travis-ci.com/pjryan126/docscraper.svg?branch=main) [![Total alerts](https://img.shields.io/lgtm/alerts/g/pjryan126/docscraper.svg?logo=lgtm&logoWidth=18)](https://lgtm.com/projects/g/pjryan126/docscraper/alerts/) [![Language grade: Python](https://img.shields.io/lgtm/grade/python/g/pjryan126/docscraper.svg?logo=lgtm&logoWidth=18)](https://lgtm.com/projects/g/pjryan126/docscraper/context:python) # Overview The ``docscraper`` package is a ``scrapy`` spider for crawling a given set of websites and dowloading all available documents with a given set of file extensions. The package is intended to be called from a Python script. # Getting Started You can get started by downloading the package with ``pip``: ``` $ pip install docscraper ``` Once the package is installed, you can use it with scrapy directly in your Python script to download files from websites as follows: ``` >>> import docscraper >>> allowed_domains = ["books.toscrape.com"] >>> start_urls = ["https://books.toscrape.com"] >>> extensions = [".html", ".pdf", ".docx", ".doc", ".svg"] >>> docscraper.crawl(allowed_domains, start_urls, extensions=extensions) ```


نیازمندی

مقدار نام
- openpyxl
>=1.16.5 numpy
- pandas
- requests
- scrapy
- scrapy-wayback-machine


نحوه نصب


نصب پکیج whl docscraper-2.0.7:

    pip install docscraper-2.0.7.whl


نصب پکیج tar.gz docscraper-2.0.7:

    pip install docscraper-2.0.7.tar.gz