معرفی شرکت ها


CwnSenseTagger-0.1.6


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A package to use chinese word net to achieve word sense disambigution task
ویژگی مقدار
سیستم عامل -
نام فایل CwnSenseTagger-0.1.6
نام CwnSenseTagger
نسخه کتابخانه 0.1.6
نگهدارنده []
ایمیل نگهدارنده []
نویسنده NTUGIL LOPE Lab
ایمیل نویسنده -
آدرس صفحه اصلی -
آدرس اینترنتی https://pypi.org/project/CwnSenseTagger/
مجوز -
# Word Sense Disambiguaion by Chinese Word Net Chinese word sense disambiguation has been known to a very difficult problem since Chinese is a complicated language. A word can have dozens or even hundreds of meanings on different occasions. Manually labels the senses of the words is labor-intensive and inefficient. In this project, we aim to solve this problem by state-of-the-art Bert model. It gives us huge performance gains and can score roughly 82% accuracy on Chinese word sense disambiguation problem. ## Prerequest * Input should be tokenized first. POS Tagging is preferred but not required. * Suppose we have m sentences and each sentence has $n_m$ words. * list_of_sentence[ [list_of_word[[target, pos, sense_id, sense] * $n_m$ ] *m ] * The following is an example that has 2 sentences, input data should be formed as following [[["他","Nh","",""],["由","P","",""],["昏沈","VH","",""],["的","DE","",""],["睡夢","Na","",""],["中","Ng","",""],["醒來","VH","",""],[",","COMMACATEGORY","",""]], [["臉","Na","",""],["上","Ncd","",""],["濕涼","VH","",""],["的","DE","",""],["騷動","Nv","",""],["是","SHI","",""],["淚","Na","",""],["。","PERIODCATEGORY","",""]]] ## How to get sense * At Project root directory (same as setup.py) pip3 install . import CWN_WSD data = read_somewhere() #list of sentence, and sentence is composed as list of word sense = CWN_WSD.wsd(data) * example can be found under example folder ## Acknowledgement We thank Po-Wen Chen (b05902117@ntu.edu.tw) and Yu-Yu Wu (b06902104@ntu.edu.tw) for contributions in model development.


نیازمندی

مقدار نام
- numpy
- pandas
>=1.6 torch
- tqdm
>=3.2 transformers


زبان مورد نیاز

مقدار نام
>=3.5 Python


نحوه نصب


نصب پکیج whl CwnSenseTagger-0.1.6:

    pip install CwnSenseTagger-0.1.6.whl


نصب پکیج tar.gz CwnSenseTagger-0.1.6:

    pip install CwnSenseTagger-0.1.6.tar.gz