معرفی شرکت ها


docdump-1.0.4


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A package to extract text from common document types.
ویژگی مقدار
سیستم عامل -
نام فایل docdump-1.0.4
نام docdump
نسخه کتابخانه 1.0.4
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Grant Holtes
ایمیل نویسنده gwholes@gmail.com
آدرس صفحه اصلی https://github.com/Gholtes/docdump
آدرس اینترنتی https://pypi.org/project/docdump/
مجوز MIT
[![MIT License][license-shield]][license-url] # DocDump ### A package to extract text from common document types DocDump aims to allow for raw text data and document metadata to be easily extracted from a range of commonly used document types, such as Word, PDF, PowerPoint, Excel, txt. DocDump acts as a wrapper for a number of existing packages: `PyPDF2`, `openpyxl`, `python-docx`, `python-pptx`. DocDump extracts all text as a single string, and does not preserve text structure. This makes it a useful tool in a natural language processing or search pipeline. DocDump does not perform any preprocessing or normalisation of the extracted text. ## Getting Started DocDump requires Python 3.7+ ### Installation ```bash pip install docdump ``` ### Usage ```python from docdump import doc_reader document = doc_reader("sampleFile.docx") text_dump = document.text metadata = document.metadata filetype = document.filetype absolute_path = document.path ``` ## License Distributed under the MIT License. See `LICENSE` for more information. ## Contact Grant Holtes - gwholtes@gmail.com Project Link: [https://github.com/Gholtes/docdump](https://github.com/Gholtes/docdump) [license-url]: https://github.com/Gholtes/docdump/blob/master/LICENSE.txt [license-shield]: https://img.shields.io/github/license/othneildrew/Best-README-Template.svg?style=flat-square


نحوه نصب


نصب پکیج whl docdump-1.0.4:

    pip install docdump-1.0.4.whl


نصب پکیج tar.gz docdump-1.0.4:

    pip install docdump-1.0.4.tar.gz