معرفی شرکت ها


cophi-1.3.2


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A library for preprocessing.
ویژگی مقدار
سیستم عامل -
نام فایل cophi-1.3.2
نام cophi
نسخه کتابخانه 1.3.2
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Chair of Computer Philology and Modern German Literary History
ایمیل نویسنده -
آدرس صفحه اصلی https://github.com/cophi-wue/cophi-toolbox
آدرس اینترنتی https://pypi.org/project/cophi/
مجوز Apache 2.0
# A library for processing text data `cophi` is a Python library for handling, modeling and processing text corpora. You can easily pipe a collection of text files using the high-level API: ```python corpus, metadata = cophi.corpus(directory="british-fiction-corpus", filepath_pattern="**/*.txt", encoding="utf-8", lowercase=True, token_pattern=r"\p{L}+\p{P}?\p{L}+") ``` You can also plug the [DARIAH-DKPro-Wrapper](https://dariah-de.github.io/DARIAH-DKPro-Wrapper/) into this pipeline to lemmatize text, or just keep certain word types. >Check out the introducing [Jupyter notebook](https://github.com/cophi-wue/cophi-toolbox/blob/master/notebooks/introducing-cophi.ipynb). ## Getting started To install the latest **stable** version: ``` $ pip install cophi ``` To install the latest **development** version: ``` $ pip install --upgrade git+https://github.com/cophi-wue/cophi-toolbox.git@testing ``` ## Available complexity measures There are also a plenty of complexity metrics for measuring the lexical richness of (literary) texts. Measures that use sample size and vocabulary size: * Type-Token Ratio TTR * Guiraud’s R * Herdan’s C * Dugast’s k * Maas’ a<sup>2</sup> * Dugast’s U * Tuldava’s LN * Brunet’s W * Carroll’s CTTR * Summer’s S Measures that use part of the frequency spectrum: * Honoré’s H * Sichel’s S * Michéa’s M Measures that use the whole frequency spectrum: * Entropy S * Yule’s K * Simpson’s D * Herdan’s V<sub>m</sub> Parameters of probabilistic models: * Orlov’s Z


نیازمندی

مقدار نام
>=0.23.4 pandas
>=1.15.0 numpy
>=4.2.4 lxml
>=2018.07.11 regex


زبان مورد نیاز

مقدار نام
>=3.4.0 Python


نحوه نصب


نصب پکیج whl cophi-1.3.2:

    pip install cophi-1.3.2.whl


نصب پکیج tar.gz cophi-1.3.2:

    pip install cophi-1.3.2.tar.gz