معرفی شرکت ها


docs2tops-0.0.3


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Takes a list of documents and returns fully automated & labeled dictionaries where topic names are keys and semantically similar keywords from the documents as values
ویژگی مقدار
سیستم عامل -
نام فایل docs2tops-0.0.3
نام docs2tops
نسخه کتابخانه 0.0.3
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Orkhan Amrullayev
ایمیل نویسنده orkhan_amrullayev@gmail.com
آدرس صفحه اصلی https://github.com/orkhan-amrullayev/docs2tops
آدرس اینترنتی https://pypi.org/project/docs2tops/
مجوز -
# docs2tops stands for documents to topics. What it basically does is: - extracting ngrams from the documents - extracting meaningful moregrams (2 or more grams) - creates semi-automated dictionary - if user provided some possible topics, docs2tops provides similar keywords per topics provided - creates fully-automated dictionary in both cases (either user inputs some topics or not), docs2tops returns 2 dictionaries. if user did not provide any topic, first dictionary will be empty with a message only. in all cases, fully-automated dictionary will be created. docs2tops function takes list of documents optionally, you can provide candidate_topics_list, moregrams_sample_size. docs2tops(docs_input_list, candidate_topics_list=None, moregrams_sample_size=None) ## installation Run the following to install: ```python pip install docs2tops ``` ## usage ```python from docs2tops import docs2tops import pandas as pd df = pd.read_csv(r"C:\Users\my_file.csv") docs = df['my_texual_content'].to_list() candidate_topics_list = ['smell', 'taste', 'delivery', 'packaging'] moregrams_sample_size = 100 user_input_dict, fully_auto_dict = docs2tops(docs_input_list=docs, candidate_topics_list=candidate_topics_list, moregrams_sample_size=moregrams_sample_size) list_dicts = [user_input_dict, fully_auto_dict] for result in list_dicts: print(result) print('number of topics: ', len(result)) print('---') ``` # Developing docs2tops to install docs2tops, along with the tools you need to develop and run tests, run the following in your virtual environment: ```bash pip install -e .[dev] ```


نیازمندی

مقدار نام
~=1.5.3 pandas
~=1.23 numpy
~=3.8.1 nltk
- tqdm
~=0.7.0 keybert
~=0.0.11 keyphrase-vectorizers
~=2.2.2 sentence-transformers
~=4.26.1 transformers
==3.5.0 spacy
- sklearn
>=3.8 pytest


نحوه نصب


نصب پکیج whl docs2tops-0.0.3:

    pip install docs2tops-0.0.3.whl


نصب پکیج tar.gz docs2tops-0.0.3:

    pip install docs2tops-0.0.3.tar.gz