معرفی شرکت ها


Scrapy-UserAgents-0.0.1


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A middleware to change user-agent in request for Scrapy
ویژگی مقدار
سیستم عامل OS Independent
نام فایل Scrapy-UserAgents-0.0.1
نام Scrapy-UserAgents
نسخه کتابخانه 0.0.1
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Grammy Jiang
ایمیل نویسنده grammy.jiang@gmail.com
آدرس صفحه اصلی https://github.com/grammy-jiang/scrapy-useragents
آدرس اینترنتی https://pypi.org/project/Scrapy-UserAgents/
مجوز BSD
================= Scrapy-UserAgents ================= Overview ======== Scrapy is a great framework for web crawling. This downloader middleware provides a user-agent rotation based on the settings in settings.py, spider, request. Requirements ============ * Tests on Python 2.7 and Python 3.5, but it should work on other version higher then Python 3.3 * Tests on Linux, but it's a pure python module, it should work on other platforms with official python supported, e.g. Windows, Mac OSX, BSD Installation ============ The quick way:: pip install scrapy-useragents Or put this middleware just beside the scrapy project. Documentation ============= In setting.py, for example:: # ----------------------------------------------------------------------------- # USER AGENT # ----------------------------------------------------------------------------- DOWNLOADER_MIDDLEWARES.update({ 'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None, 'scrapy_useragents.downloadermiddlewares.useragents.UserAgentsMiddleware': 500, }) USER_AGENTS = [ ('Mozilla/5.0 (X11; Linux x86_64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/57.0.2987.110 ' 'Safari/537.36'), # chrome ('Mozilla/5.0 (X11; Linux x86_64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/61.0.3163.79 ' 'Safari/537.36'), # chrome ('Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:55.0) ' 'Gecko/20100101 ' 'Firefox/55.0') # firefox ] Settings Reference ------------------ USER_AGENTS ~~~~~~~~~~~ A list of User-Agent to use when crawling, unless overridden. The middleware will rotate this list by function cycle from the module itertools. **Be careful this middleware can't handle the situation that the COOKIES_ENABLED is True, and the website binds the cookies with User-Agent, it may cause unpredictable result of the spider. This problem will be solved in the future.** TODO ==== * Read User-Agent from a backend, e.g. MongoDB, MySQL, or even a file saved on the local disk. * Rotate User-Agent binding with cookies, keep the consistence * Add meta key for User-Agent selection based on each request


نیازمندی

مقدار نام
>=1.4.0 scrapy
>=2.1.0) PyPyDispatcher


نحوه نصب


نصب پکیج whl Scrapy-UserAgents-0.0.1:

    pip install Scrapy-UserAgents-0.0.1.whl


نصب پکیج tar.gz Scrapy-UserAgents-0.0.1:

    pip install Scrapy-UserAgents-0.0.1.tar.gz