معرفی شرکت ها


CLTranscriptor-0.0.6


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Wav2Vec2-based transcriptor fine tuned on chilean lessons
ویژگی مقدار
سیستم عامل -
نام فایل CLTranscriptor-0.0.6
نام CLTranscriptor
نسخه کتابخانه 0.0.6
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Danner Schlotterbeck Mendez
ایمیل نویسنده danner.schmen@ciae.uchile.cl
آدرس صفحه اصلی https://github.com/dannersm/CLTranscriptor
آدرس اینترنتی https://pypi.org/project/CLTranscriptor/
مجوز -
# CLTranscriptor Wrapper for spanish speech-to-text model based on huggingface's [Wav2Vec2ForCTC](https://huggingface.co/transformers/model_doc/wav2vec2.html) and finetuned on Chilean lessons + [PySpellChecker](https://pyspellchecker.readthedocs.io/en/latest/)'s spanish spellchecking algorithm. ## Install To install, simply use `pip`: ```python pip install cltranscriptor ``` ## Usage To use, initialize a `Transcriptor` object: ```python from cltranscriptor.cltranscriptor import Transcriptor transcriptor = Transcriptor() ``` By default, spell checking is set to `True` and the model name is the one available at [dannersm/wav2vec2-large-xlsr-53-chilean-lessons](https://huggingface.co/dannersm/wav2vec2-large-xlsr-53-chilean-lessons), which is based on Jonatas Grosman's [model](https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-spanish) and finetuned on a 6 hour set of chilean lessons. To transcribe a file, call `Transcriptor.transcribe()`: ```python transcriptor.transcribe('/path/to/your/audio_file.wav') ``` By default, the file is streamed into 10 second intervals (to avoid loading it in memory) and returns a list with the transcripts for each segment. If you want to transcribe a *relatively short* file all at once you can pass `interval=None`: ```python transcriptor.transcribe('my_file.wav', interval=None) ``` You can also pass the `offset` and `duration` parameters which will be passed to `librosa.stream` to set the start time and a maximum duration to the transcription ```python transcriptor.transcribe('my_file.wav', offset=600, duration=120) # transcribe 2 minutes of audio starting from minute 10 ``` Finally, you can control the length of the streamed segments passing `interval`: ```python transcriptor.transcribe('my_file.wav', interval=15) # transcribe every 15 seconds ```


نیازمندی

مقدار نام
- librosa
- numpy
- transformers
- torch
- pyspellchecker
- tqdm


زبان مورد نیاز

مقدار نام
>=3.6 Python


نحوه نصب


نصب پکیج whl CLTranscriptor-0.0.6:

    pip install CLTranscriptor-0.0.6.whl


نصب پکیج tar.gz CLTranscriptor-0.0.6:

    pip install CLTranscriptor-0.0.6.tar.gz