معرفی شرکت ها


RTFDE-0.0.2


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A library for extracting HTML content from RTF encapsulated HTML as commonly found in the exchange MSG email format.
ویژگی مقدار
سیستم عامل OS Independent
نام فایل RTFDE-0.0.2
نام RTFDE
نسخه کتابخانه 0.0.2
نگهدارنده []
ایمیل نگهدارنده []
نویسنده seamus tuohy
ایمیل نویسنده code@seamustuohy.com
آدرس صفحه اصلی https://github.com/seamustuohy/RTFDE
آدرس اینترنتی https://pypi.org/project/RTFDE/
مجوز -
# RTFDE: RTF De-Encapsulator A python3 library for extracting encapsulated `HTML` & `plain text` content from the `RTF` bodies of .msg files. De-encapsulation enables previously encapsulated HTML and plain text content to be extracted and rendered as HTML and plain text instead of the encapsulating RTF content. After de-encapsulation, the HTML and plain text should differ only minimally from the original HTML or plain text content. # Features - De-encapsulate HTML from RTF encapsulated HTML. - De-encapsulate plain text from RTF encapsulated text. # Known Issues - This library *fully* unquotes text it de-encapsulates because it does not know which text was quoted in the RTF conversion process and which text was quoted in the original html/text. So, for instance escaped [Quoted-Printable](https://en.wikipedia.org/wiki/Quoted-printable) text will be returned un-escaped. - This library currently can't [combine attachments](https://docs.microsoft.com/en-us/openspecs/exchange_server_protocols/ms-oxrtfex/b518f0bc-468c-4218-87a7-8f8859bf5773) from a .MSG Message object with the de-encapsulated HTML. This is mostly because I could not get a good set of examples of encapsulated HTML which had attachment objects that needed to be integrated back into the body of the HTML. # Anti-Features (I don't intend to have this library do this.) - Extract plain text from RTF encapsulated HTML. If you want this, then you will have to parse the HTML using another library. # Installation **To install from the pip package.** ``` pip3 install RTFDE ``` # Usage ## De-encapsulating HTML or TEXT ```python from RTFDE.deencapsulate import DeEncapsulator with open('rtf_file', 'r') as fp: raw_rtf = fp.read() rtf_obj = DeEncapsulator(raw_rtf) rtf_obj.deencapsulate() if rtf_obj.content_type == 'html': print(rtf_obj.html) else: print(rtf_obj.text) ``` # Contribute Please check the [contributing guidelines](./CONTRIBUTING.md) # License Please see the [license file](./LICENSE) for license information on RTFDE. If you have further questions related to licensing PLEASE create an issue about it on github.


نیازمندی

مقدار نام
>=0.11 lark-parser
>=0.56 oletools
>=4.6 lxml
>=0.27 extract-msg


زبان مورد نیاز

مقدار نام
>=3.6 Python


نحوه نصب


نصب پکیج whl RTFDE-0.0.2:

    pip install RTFDE-0.0.2.whl


نصب پکیج tar.gz RTFDE-0.0.2:

    pip install RTFDE-0.0.2.tar.gz