معرفی شرکت ها


adidentifier-0.0.8


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

AdIdentifier
ویژگی مقدار
سیستم عامل -
نام فایل adidentifier-0.0.8
نام adidentifier
نسخه کتابخانه 0.0.8
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Alecyrus
ایمیل نویسنده heyuangunia@gmail.com
آدرس صفحه اصلی https://github.com/Alecyrus/AdIdentifier
آدرس اینترنتی https://pypi.org/project/adidentifier/
مجوز MIT
# AdIdentifier [![PyPI version](https://img.shields.io/pypi/pyversions/adidentifier.svg)](https://pypi.python.org/pypi/adidentifier) [![PyPI](https://img.shields.io/pypi/v/adidentifier.svg)](https://pypi.python.org/pypi/adidentifier) ## Installation Prerequisites: * The re2 library from Google > \# git clone https://github.com/google/re2.git & cd re2 & make & make install * The Python development headers > \# apt-get install python-dev * Cython 0.20+ (pip install cython) > $ pip install cython After the prerequisites are installed, install as follows (pip3 for python3): > $ pip install https://github.com/andreasvc/pyre2/archive/master.zip or >$ git clone git://github.com/andreasvc/pyre2.git >$ cd pyre2 >$ make install then >$ pip install adidentifier ## Usage ### Import ```python from adidentifier import AdIdentifier ``` ### Initialize ```python ad = AdIdentifier() ``` ## API ### is_finance(text) Check whether the text or url is relevent to Finance. ```python test1 = ["速贷之家-借钱不担心_2小时到账", "https://www.aiqianzhan.com/html/register3_bd4.html?utm_source=bd4-pc-ss&utm_medium=bd4SEM&utm_campaign=D1-%BE%BA%C6%B7%B4%CA-YD&utm_content=%BE%BA%C6%B7%B4%CA-%C3%FB%B4%CA&utm_term=p2p%CD%F8%B4%FB"] for test in test1: resu = ad.is_finance(text) print text,"------->>", resu ``` > Output: ``` 速贷之家-借钱不担心_2小时到账 ------->> True https://www.aiqianzhan.com/html/register3_bd4.html?utm_source=bd4-pc-ss&utm_medium=bd4SEM&utm_campaign=D1-%BE%BA%C6%B7%B4%CA-YD&utm_content=%BE%BA%C6%B7%B4%CA-%C3%FB%B4%CA&utm_term=p2p%CD%F8%B4%FB ------->> True ``` ### is_ad(url) Check whether the url is relevent to AD ```python test2 = ["https://ss3.baidu.com/-rVXeDTa2gU2pMbgoY3K/it/u=3778907493,3669893773&fm=202&mola=new&crop=v1", "https://ss2.bdstatic.com/8_V1bjqh_Q23odCf/pacific/upload_25289207_1521622472509.png?x=0&y=0&h=150&w=242&vh=92.98&vw=150.00&oh=150.00&ow=242.00", "http://pagead2.googlesyndication.com/pagead/show_ads.js", "http://www.googletagservices.com/tag/js/gpt_mobile.js"] for text in adtexts2: resu = ad.is_ad(text) print(text, "------>>", resu) ``` > Output: ``` ('https://ss3.baidu.com/-rVXeDTa2gU2pMbgoY3K/it/u=3778907493,3669893773&fm=202&mola=new&crop=v1', '------>>', True) ('https://ss2.bdstatic.com/8_V1bjqh_Q23odCf/pacific/upload_25289207_1521622472509.png?x=0&y=0&h=150&w=242&vh=92.98&vw=150.00&oh=150.00&ow=242.00', '------>>', True) ('http://pagead2.googlesyndication.com/pagead/show_ads.js', '------>>', True) ('http://www.googletagservices.com/tag/js/gpt_mobile.js', '------>>', False) ``` ### get_target_from_href(href) Extract the target url from a hyperlink. eg. https://www.baidu.com/...%ASDD ----> https://www.wdzj.com/...1%E8%B4%B7 ```python print ad.get_target_from_href("https://www.baidu.com/baidu.php?url=0f0000jsnOdydCYpIY2xQXFCV1h5YmZnZh_pWjXI1sMrqQiM8Y55S59-6yXvznN6gm_5K2BIwOl4qzVcr2qRUIZdYnyTM2gOTAL-ed0xhaXP7ZI4XoxPJtWsnc4vPT3Qgcpo8dLTicCsAu_tZqqn5DH0sVytFArXV5kfFxBwLN5Kyia2R0.DD_NR2Ar5Od663rj6t8ae9zC63p_jnNKtAlEuw9zsISgZsIoDgQvTVxQgzdtEZ-LTEuzk3x5I9qxo9vU_5Mvmxgv3IhOj4en5VS8ZutEOOS1j4SrZdSyZxg9tqhZden5o3OOOqhZ1tT5ot_rSEj4en5ovmxgkl32AM-WI6h9ikX1BsIT7jHzlRL5spycTT5y9G4mgwRDkRAcY_1fdIT7jHzs_lTUQqRHAZ1tT5ot_rSEj4en5ovmxgkl32AM-CFhY_mx5ksSEzselt5M_sSEu9qx7i_nYQZu_LSr4f.U1Yk0ZDq1xBYSsKspynqn0KY5TL3V5_0pyYqnWcd0ATqmhRLn0KdpHdBmy-bIfKspyfqnWR0mv-b5Hckr0KVIjYknjDLg1DsnH-xnW0vn-t1PW0k0AVG5H00TMfqP1cz0ANGujYkPjmvg1cvnWR4g1cknH0Yg1cznHR40AFG5HcsP0KVm1YLPjDknjnknjIxP1fkPWckP1f1g1DkP1bkrHD1nHIxn0KkTA-b5H00TyPGujYs0ZFMIA7M5H00mycqn7ts0ANzu1Ys0ZKs5H00UMus5H08nj0snj0snj00Ugws5H00uAwETjYs0ZFJ5H00uANv5gKW0AuY5H00TA6qn0KET1Ys0AFL5HDs0A4Y5H00TLCq0ZwdT1YLPHTvnHnLPWTLrjmkPWmvnHfk0ZF-TgfqnHRzPHcYrH0knj0dPsK1pyfqrHNhmW-9m10snj0suARvrfKWTvYqPWD4PRuAPHc3Pbw7wj9arfK9m1Yk0ZK85H00TydY5H00Tyd15H00XMfqn0KVmdqhThqV5HKxn7tsg100uA78IyF-gLK_my4GuZnqn7tsg1Kxn0Ksmgwxuhk9u1Ys0AwWpyfqn0K-IA-b5iYk0A71TAPW5H00IgKGUhPW5H00Tydh5H00uhPdIjYs0AulpjYs0Au9IjYs0ZGsUZN15H00mywhUA7M5HD0UAuW5H00mLFW5HfsPHmv&us=0.0.0.0.0.0.0.101&ck=0.0.0.0.0.0.0.0&shh=www.baidu.com&sht=baidu") ``` > Output: ```shell https://www.wdzj.com/zhuanti/518lcj/?_pwk=n_4_1_1_1_3_5_4_s%E5%BF%85%E4%BA%89%E8%AF%8D|%E7%BD%91%E8%B4%B7|%E7%BD%91%E8%B4%B7&utm_source=baidu&utm_medium=cpc&tm_content=search&utm_campaign=%E7%BD%91%E8%B4%B7&utm_term=%E7%BD%91%E8%B4%B7 ``` ### get_domain_from_url(href) Extract the domain from a url . eg. https://www.asdasd.com/asdasd ----> www.asdasd.com ```python print ad.get_domain_from_url("https://www.asdasd.com/asdasd") ``` > Output: ```shell www.asdasd.com ``` ## Config Config will be generated automatically. ```ini [CUSTOM] uri_keywords = qian,dai,cf,wd,jin text_keywords = 网贷 ad_filter = https://ss3.baidu.com/*,https://ss2.bdstatic.com/* ``` ## ATTENTION!!! 调用is_finance(),判断链接是否是金融链接时,必须传入 href 超链接指向的target地址,且格式如同`{scheme}://{domain}/{path}`,其中`path`可以省略。


نحوه نصب


نصب پکیج whl adidentifier-0.0.8:

    pip install adidentifier-0.0.8.whl


نصب پکیج tar.gz adidentifier-0.0.8:

    pip install adidentifier-0.0.8.tar.gz