معرفی شرکت ها


ScrapyEs-0.9


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

An extension module to send data to elasticsearch in bulk format.
ویژگی مقدار
سیستم عامل OS Independent
نام فایل ScrapyEs-0.9
نام ScrapyEs
نسخه کتابخانه 0.9
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Ernesto Miguez
ایمیل نویسنده ernesto.miguez@asquera.de
آدرس صفحه اصلی https://github.com/Asquera/scrapy-elasticsearch-extension
آدرس اینترنتی https://pypi.org/project/ScrapyEs/
مجوز Apache License, Version 2.0
###scrapy-elasticsearch-extension A Scrapy Extension with the following functionaltity: - to bulk export data to elasticsearch - delete outdated documents ###required modules [pyes](http://pyes.readthedocs.org/en/latest/) ###installation generaly information to be found in the [Scrapy Extensions installation guide](http://doc.scrapy.org/en/latest/topics/extensions.html) add the following line to the **EXTENSIONS** setting in your Scrapy settings: ``` 'scrapyes.Sender' : 1000 ``` ###configuration the module can be configured per project in your Scrapy settings using the following options: ``` ELASTICSEARCH_SERVER = "localhost" ELASTICSEARCH_PORT = 9200 ELASTICSEARCH_INDEX = "sixx" ELASTICSEARCH_TYPE = "text" ELASTICSEARCH_BULK_SIZE = 10 SCRAPYES_ENABLED = True ``` ### index configuration the index used in Elastic Search insertion can be configured per spider [by initializing an attribute on the spider](http://doc.scrapy.org/en/latest/topics/spiders.html#spider-arguments), named index, and passing the desired value when the spider job is scheduled. example: ``` curl http://192.168.33.10:6800/schedule.json -d project=psd_search_crawler \ -d spider=sixx_spider \ -d index=my_index ``` if the index is not configured on the running spider, the crawler settings value for variable **ELASTICSEARCH_INDEX** will be used. if the item declares an id field, it will be used to update ES ### deleting outdated documents If the document has been indexed with fiels 'spider_name' and 'last_indexed' documents indexed before the latest run of the spider will be removed when the spider closes,in case the spider has finished its task


نحوه نصب


نصب پکیج whl ScrapyEs-0.9:

    pip install ScrapyEs-0.9.whl


نصب پکیج tar.gz ScrapyEs-0.9:

    pip install ScrapyEs-0.9.tar.gz