معرفی شرکت ها


PyMinHash-0.1.4


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Efficient MinHashing
ویژگی مقدار
سیستم عامل OS Independent
نام فایل PyMinHash-0.1.4
نام PyMinHash
نسخه کتابخانه 0.1.4
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Frits Hermans
ایمیل نویسنده -
آدرس صفحه اصلی https://github.com/fritshermans/pyminhash
آدرس اینترنتی https://pypi.org/project/PyMinHash/
مجوز -
<!--- BADGES: START ---> [![Version](https://img.shields.io/pypi/v/pyminhash)](https://pypi.org/project/pyminhash/) ![](https://img.shields.io/github/license/fritshermans/pyminhash) [![Downloads](https://pepy.tech/badge/pyminhash)](https://pepy.tech/project/pyminhash) [![Conda - Platform](https://img.shields.io/conda/pn/conda-forge/pyminhash?logo=anaconda&style=flat)][#conda-forge-package] [![Conda (channel only)](https://img.shields.io/conda/vn/conda-forge/pyminhash?logo=anaconda&style=flat&color=orange)][#conda-forge-package] [![Conda Recipe](https://img.shields.io/static/v1?logo=conda-forge&style=flat&color=green&label=recipe&message=pyminhash)][#conda-forge-feedstock] [![Docs - GitHub.io](https://img.shields.io/static/v1?logo=readthdocs&style=flat&color=pink&label=docs&message=pyminhash)][#docs-package] [#pypi-package]: https://pypi.org/project/pyminhash/ [#conda-forge-package]: https://anaconda.org/conda-forge/pyminhash [#conda-forge-feedstock]: https://github.com/conda-forge/pyminhash-feedstock [#docs-package]: https://pyminhash.readthedocs.io/en/latest/ <!--- BADGES: END ---> # PyMinHash MinHashing is a very efficient way of finding similar records in a dataset based on Jaccard similarity. PyMinHash implements efficient minhashing for Pandas dataframes. See instructions below or look at the example notebook to get started. Developed by [Frits Hermans](https://www.linkedin.com/in/frits-hermans-data-scientist/) ## Documentation Documentation can be found [here](https://pyminhash.readthedocs.io/en/latest/) ## Installation ### Normal installation **Using PyPI** ``` pip install pyminhash ``` **Using conda** ``` conda install -c conda-forge pyminhash ``` ### Install to contribute Clone this Github repo and install in editable mode: ``` python -m pip install -e ".[dev]" python setup.py develop ``` ## Usage Apply record matching to column `name` of your Pandas dataframe `df` as follows: ```python myHasher = MinHash(n_hash_tables=10) myHasher.fit_predict(df, 'name') ``` This will return the row pairs from `df` that have non-zero Jaccard similarity.


نیازمندی

مقدار نام
- pandas
- numpy
- scikit-learn
- pytest
- openpyxl
- pandas
- numpy
- scikit-learn
- pytest
- openpyxl
- pandas
- numpy
- scikit-learn
- pytest
- openpyxl
- jupyterlab
==3.5.4 sphinx
- nbsphinx
- sphinx-rtd-theme
==3.5.4 sphinx
- nbsphinx
- sphinx-rtd-theme


زبان مورد نیاز

مقدار نام
>=3.6.9 Python


نحوه نصب


نصب پکیج whl PyMinHash-0.1.4:

    pip install PyMinHash-0.1.4.whl


نصب پکیج tar.gz PyMinHash-0.1.4:

    pip install PyMinHash-0.1.4.tar.gz