معرفی شرکت ها

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A web crawler to scrape documents from websites

ویژگی	مقدار
سیستم عامل	-
نام فایل	docscraper-2.0.7
نام	docscraper
نسخه کتابخانه	2.0.7
نگهدارنده	[]
ایمیل نگهدارنده	[]
نویسنده	Patrick Ryan
ایمیل نویسنده	pjryan126@gmail.com
آدرس صفحه اصلی	https://docscraper.readthedocs.io/en/latest/
آدرس اینترنتی	https://pypi.org/project/docscraper/
مجوز	MIT

[![Travis](https://travis-ci.com/pjryan126/docscraper.svg?branch=main)](https://travis-ci.com/pjryan126/docscraper.svg?branch=main) [![Total alerts](https://img.shields.io/lgtm/alerts/g/pjryan126/docscraper.svg?logo=lgtm&logoWidth=18)](https://lgtm.com/projects/g/pjryan126/docscraper/alerts/) [![Language grade: Python](https://img.shields.io/lgtm/grade/python/g/pjryan126/docscraper.svg?logo=lgtm&logoWidth=18)](https://lgtm.com/projects/g/pjryan126/docscraper/context:python) # Overview The ``docscraper`` package is a ``scrapy`` spider for crawling a given set of websites and dowloading all available documents with a given set of file extensions. The package is intended to be called from a Python script. # Getting Started You can get started by downloading the package with ``pip``: ``` $ pip install docscraper ``` Once the package is installed, you can use it with scrapy directly in your Python script to download files from websites as follows: ``` >>> import docscraper >>> allowed_domains = ["books.toscrape.com"] >>> start_urls = ["https://books.toscrape.com"] >>> extensions = [".html", ".pdf", ".docx", ".doc", ".svg"] >>> docscraper.crawl(allowed_domains, start_urls, extensions=extensions) ```

نیازمندی

مقدار	نام
-	openpyxl
>=1.16.5	numpy
-	pandas
-	requests
-	scrapy
-	scrapy-wayback-machine

نحوه نصب

نصب پکیج whl docscraper-2.0.7:

pip install docscraper-2.0.7.whl

نصب پکیج tar.gz docscraper-2.0.7:

pip install docscraper-2.0.7.tar.gz