معرفی شرکت ها


TExtractor-0.1.2


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Extract text content from many filetypes.
ویژگی مقدار
سیستم عامل OS Independent
نام فایل TExtractor-0.1.2
نام TExtractor
نسخه کتابخانه 0.1.2
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Thorsten Weimann
ایمیل نویسنده weimann.th@yahoo.com
آدرس صفحه اصلی http://bitbucket.org/whitie/textractor-py3/
آدرس اینترنتی https://pypi.org/project/TExtractor/
مجوز MIT
TExtractor ========== Extract text content from many filetypes in pure Python. This package extracts pure text from many office filetypes. Only three external (pure Python) libraries are needed to work. After extracting you get a list of words with the most common stop words stripped out (only en, de). Install with: `pip install TExtractor` Usage:: >>> from textractor import TExtractor >>> extractor = TExtractor() >>> extractor.index('test.docx', lang='en') ['workflow_history', 'portal_workflow', 'review_history', 'implementation', 'organizations', 'Illustrations', ...] >>> extractor.index('test.pdf', lang='en') ['workflow_history', 'portal_workflow', 'review_history', 'implementation', 'organizations', 'Illustrations', ...] >>>


نیازمندی

مقدار نام
- pdfminer.six
- pluginbase
- chardet


نحوه نصب


نصب پکیج whl TExtractor-0.1.2:

    pip install TExtractor-0.1.2.whl


نصب پکیج tar.gz TExtractor-0.1.2:

    pip install TExtractor-0.1.2.tar.gz