معرفی شرکت ها


bert-document-classification-1.0.0


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

long document classification with language models
ویژگی مقدار
سیستم عامل -
نام فایل bert-document-classification-1.0.0
نام bert-document-classification
نسخه کتابخانه 1.0.0
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Andriy Mulyar, Elliot Schumacher, Masoud Rouhizadeh and Mark Dredze
ایمیل نویسنده contact@andriymulyar.com
آدرس صفحه اصلی https://github.com/AndriyMulyar/bert_document_classification
آدرس اینترنتی https://pypi.org/project/bert-document-classification/
مجوز MIT
# :book: BERT Long Document Classification :book: an easy-to-use interface to fully trained BERT based models for multi-class and multi-label long document classification. pre-trained models are currently available for two clinical note (EHR) phenotyping tasks: smoker identification and obesity detection. To sustain future development and improvements, we interface [pytorch-transformers](https://github.com/huggingface/pytorch-transformers) for all language model components of our architectures. Additionally, their is a [blog post](http://andriymulyar.com/blog/bert-document-classification) describing the architecture. | Model | Dataset | # Labels | Evaluation F1 | |-------------------|------------------|--------|----------| | n2c2_2006_smoker_lstm | I2B2 2006: Smoker Identification | 4 | 0.981 | | n2c2_2008_obesity_lstm | I2B2 2008: Obesity and Co-morbidities Identification | 15 | 0.997 | # Installation Install with pip: ``` pip install bert_document_classification ``` or directly: ``` pip install git+https://github.com/AndriyMulyar/bert_document_classification ``` # Use Maps text documents of arbitrary length to binary vectors indicating labels. ```python from bert_document_classification.models import SmokerPhenotypingBert from bert_document_classification.models import ObesityPhenotypingBert smoking_classifier = SmokerPhenotypingBert(device='cuda', batch_size=10) #defaults to GPU prediction obesity_classifier = ObesityPhenotypingBert(device='cpu', batch_size=10) #or CPU if you would like. smoking_classifier.predict(["I'm a document! Make me long and the model can still perform well!"]) ``` More [examples](/examples). # Notes - For training you will need a GPU. - For bulk inference where speed is not of concern lots of available memory and CPU cores will likely work. - Model downloads are cached in `~/.cache/torch/bert_document_classification/`. Try clearing this folder if you have issues. # Acknowledgement If you found this project useful, consider citing our extended abstract accepted at NeurIPS 2019 ML4Health . ``` Format bibtex citation ``` Implementation, development and training in this project were supported by funding from the Mark Dredze Lab at Johns Hopkins University.


نیازمندی

مقدار نام
- pytorch-transformers
- torch
- configargparse
- scikit-learn


نحوه نصب


نصب پکیج whl bert-document-classification-1.0.0:

    pip install bert-document-classification-1.0.0.whl


نصب پکیج tar.gz bert-document-classification-1.0.0:

    pip install bert-document-classification-1.0.0.tar.gz