معرفی شرکت ها


bagmodels-0.1.5


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

BM25 NLP model
ویژگی مقدار
سیستم عامل -
نام فایل bagmodels-0.1.5
نام bagmodels
نسخه کتابخانه 0.1.5
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Himanshu Mittal
ایمیل نویسنده himanshum1312@gmail.com
آدرس صفحه اصلی https://github.com/HimanshuMittal01/bagmodels
آدرس اینترنتی https://pypi.org/project/bagmodels/
مجوز -
# BagModels [![PyPI version](https://badge.fury.io/py/bagmodels.svg)](https://badge.fury.io/py/bagmodels) [![Python tests](https://github.com/HimanshuMittal01/bagmodels/actions/workflows/python-app.yml/badge.svg)](https://github.com/HimanshuMittal01/bagmodels/actions/workflows/python-app.yml) BagModels is a repository of various bag of words (BoW) algorithms in machine learning. Currently it includes OkapiBM25. More coming soon. BM25 is a text retrieval function that can find similar documents or rank search in a set of documents based on the query terms appearing in each document irrespective of their proximity to each other. It is an improved and more generalised version of TF-IDF algorithm in NLP. ## Installation It can be installed using pip: ```zsh pip install bagmodels ``` ## Getting started ### Basic usage ```py import re from bagmodels import BM25 # Load corpus corpus = list({ "Yo, I love NLP model", "I like algorithms", "I love ML!" }) # Clean manually if needed or pass custom tokenizer to BM25 corpus = [re.sub(r",|!", " ", doc).strip() for doc in corpus] # Initialize model model = BM25(corpus=corpus) # Similarity model.similarity("I love NLP model", "I like NLP model") # 0.775 model.similarity("I love blah", "I love algorithms") # 0.446 ``` ### Save and reuse models ```py # libaries imported and corpus already loaded before it model = BM25(corpus=corpus) # write to save path model.save("output/bm25_v1.jbl") # load again model = BM25.load("output/bm25_v1.jbl") # add documents if required model.resume(corpus=additonal_corpus) # predict / search / find / retrieve like model.similarity(doc_a, doc_b) ``` ## Coming soon Please feel free to open an issue to request a feature or discuss any changes. Pull requests are most welcome. I am trying to actively add the following: - [X] OkapiBM25 - [ ] BM25 variations - [ ] MultiThreading


نیازمندی

مقدار نام
- joblib


زبان مورد نیاز

مقدار نام
>=3.6 Python


نحوه نصب


نصب پکیج whl bagmodels-0.1.5:

    pip install bagmodels-0.1.5.whl


نصب پکیج tar.gz bagmodels-0.1.5:

    pip install bagmodels-0.1.5.tar.gz