معرفی شرکت ها


SCBert-0.2


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A small package to do Sentence Clustering with BERT (SCBert)
ویژگی مقدار
سیستم عامل OS Independent
نام فایل SCBert-0.2
نام SCBert
نسخه کتابخانه 0.2
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Kevin Ferin
ایمیل نویسنده siktime92@gmail.com
آدرس صفحه اصلی https://github.com/KevinFerin/SCBert
آدرس اینترنتی https://pypi.org/project/SCBert/
مجوز -
# Sentence Clustering with BERT (SCB) Sentence Clustering with BERT project which aim to use state-of-the-art BERT models to compute vectors for sentences. A few tools are also implemented to explore those vectors and how sentences are related to each others in the latent space. ### Demonstration - **Create vectors from raw data :** ``` #How to transform raw french texts into vectors using BERT model. from SCBert.SCBert import Vectorizer vectorizer = Vectorizer("flaubert") text_vectors = vectorizer.vectorize(data) ``` - **Explore the embedded space :** ``` #How to explore the relation in your data. from SCBert.SCBert import EmbeddingExplorer ee = EmbeddingExplorer(data,text_vectors) labels = ee.cluster(k=3) #Cluster with k-means ee.extract_keywords() #Extract keywords using Rake algorithm, then accessible with ee.keywords ee.explore(color = labels) #Generate a plot with PCA of the embedded vectors with colors corresponding to the labels ``` ### Built-in example There is a built-in example that you can find in the example folder. It comes with it's own data which is the CLS-fr composed of Amazon reviews from different sources (DVD, CD, Livres) ### Installation You can either download the zip file or use the Pypi package that you can install with the following command : ``` > pip install SCBert ``` If you encounter problems during the installation it may be because of the multi-rake dependy with cld2-cffi. I will try to address this later on. To bypass, just follow the instructions : ``` > export CFLAGS="-Wno-narrowing" > pip install cld2-cffi > pip install multi-rake ```


نیازمندی

مقدار نام
==4.42.1 tqdm
==2018.7.23 stop-words
==2.5.1 transformers
==0.0.1 multi-rake
==1.18.1 numpy
==3.1.1 matplotlib
==1.3.1 torch
==0.22.2.post1 scikit-learn


نحوه نصب


نصب پکیج whl SCBert-0.2:

    pip install SCBert-0.2.whl


نصب پکیج tar.gz SCBert-0.2:

    pip install SCBert-0.2.tar.gz