معرفی شرکت ها


chkweb-0.1.5


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A very simple web crawler and checker
ویژگی مقدار
سیستم عامل -
نام فایل chkweb-0.1.5
نام chkweb
نسخه کتابخانه 0.1.5
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Juan Ignacio Rodriguez de Leon
ایمیل نویسنده euribates@gmail.com
آدرس صفحه اصلی https://github.com/euribates/chkweb.git
آدرس اینترنتی https://pypi.org/project/chkweb/
مجوز GPL-3.0-or-later
## ChkWeb This is a very simple web crawler to check the public webpages in a webserver. to use, call the subcommand start with the URL to crawl: chkweb start http://localhost/ This will create a sqlite3 database ``pages.db`` whith the urls being detected by the spyder. It also checks this first page and add all the locals links to the database as pending url to be checked. Now you can run: chkweb advance to continue the crawling process. This is going to take at most 10 pending url and repeat the process with each of then. You can define the maximun amount of new urls to be checked setting the environment variable `CHKWEB_ADVANCE_LIMIT` or setting the `--limit` command line option, like in this example: chkweb advance --limit 1000 ### Checking process status You can check the current process status with the subcommand `status`, like this: chkweb status ### Logs A log file is stored in ``logs/chklog.log``. You can change the log level either in the settings file or declaring a environment variable named ``CHKWEB_LOG_LEVEL`` to the desired level. It is set to ``ERROR`` by default. ### TODO things - Add a plugin system to perform custom checks - Add a new subcommand to make the tests from a given list of urls - Add an option to select the name and path of the database file. Alos include in the `settings.py` file. ### DONE things - add an option in the `advance` command to set the number of pages being analized in every call. Set to 0 to indicate continue until all the pages are analized [DONE 0.1.4] - logs stored in some other location [DONE 0.1.2] - Subcommand list to list the URLs in the database [DONE 0.1.2] - Subcommand init to delete the database and start a new crawl proces [DONE 0.1.2] - subcommand run to get a URL form the pending list and check it [DONE 0.1.2]


نیازمندی

مقدار نام
>=0.4.0,<0.5.0 fire
>=2.25.1,<3.0.0 requests
>=2.2.1,<3.0.0 prettyconf


زبان مورد نیاز

مقدار نام
>=3.8,<4.0 Python


نحوه نصب


نصب پکیج whl chkweb-0.1.5:

    pip install chkweb-0.1.5.whl


نصب پکیج tar.gz chkweb-0.1.5:

    pip install chkweb-0.1.5.tar.gz