معرفی شرکت ها


dirtytext-1.0.0


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Searches for [ab]using of Unicode glyphs
ویژگی مقدار
سیستم عامل -
نام فایل dirtytext-1.0.0
نام dirtytext
نسخه کتابخانه 1.0.0
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Jacopo De Luca
ایمیل نویسنده jacopo.delu@gmail.com
آدرس صفحه اصلی https://github.com/jacopodl/dirtytext
آدرس اینترنتی https://pypi.org/project/dirtytext/
مجوز GNU General Public License v3
# DirtyText # Searches for [ab]using of Unicode glyphs. ## Installation DirtyText package can be installed through pip :snake: : $ pip install dirtytext or downloaded from [GitHub](https://github.com/jacopodl/dirtytext). # Quick tour: # ## Common options: ## - Read from file: -f \<filename> - Save modified text: -s \<file> - Text filter: --filter - Pipeline mode: -p ### :mag_right: Looks for ZERO-WIDTH characters: ### $> echo "This text‌‌‌‌‍‌‬‌‌‌‌‌‍‬‍‍ ‌‌‌‌‍‬‌contains‌‌‌‌‍‬‌‌‌‌‌‍‬‌‌‌‌‌‬‌‌‌‌‌‌‍‍‍‌‌‌‌‍‬ ‌‌‌‌‍‌‬‌‌‌‌‍‬‌zero-width‌‌‌‌‍‬‍‌ chars" | dirtytext --zero -v will produce the following output: ```text Contains zero-width characters: True JSON: [{"idx": 0, "char": "\ufeff", "cval": "FEFF", "infos": null}, {"idx": 10, "char": "\u200c", "cval": "200C", "infos": null}, {"idx": 11, "char": "\u200c", "cval": "200C", "infos": null}, ...] ``` ### :mag_right: Looks for CONFUSABLES characters: ### $> echo "hello" | dirtytext --confusables greek -v will produce the following output: ```text Contains confusables characters: True JSON: [{"idx": 2, "char": "l", "cval": "006C", "infos": [{"target": "0399", "description": "GREEK CAPITAL LETTER IOTA"}]}, {"idx": 3, "char": "l", "cval": "006C", "infos": [{"target": "0399", "description": "GREEK CAPITAL LETTER IOTA"}]}, {"idx": 4, "char": "o", "cval": "006F", "infos": [{"target": "03BF", "description": "GREEK SMALL LETTER OMICRON"}, {"target": "03C3", "description": "GREEK SMALL LETTER SIGMA"}]}] ``` ### :mag_right: Looks and filter anomalies in LATIN text: ### ```text example.txt: It ⅽan be argueⅾ that the ⅽomputer ⅰs humanⅰty’s attempt to repⅼⅰⅽate the human brain. This ⅰs perhaps an unattainable goal. However, unattainable goals often lead to outstanding accomplishment. ``` $> dirtytext -f example.txt --lsubs --filter -s out.txt ```text out.txt: It can be argued that the computer is humanity’s attempt to replicate the human brain. This is perhaps an unattainable goal. However, unattainable goals often lead to outstanding accomplishment. ``` # UnicodeDB # The unicode data that composes dirtytext database are extracted from unicode consortium, in particular there are two database files into dirtytext/data directory: - categories.json: built from data extracted from [here](https://unicode.org/Public/UNIDATA/Scripts.txt) - confusables.json: built from data extracted from [here](https://unicode.org/Public/security/latest/confusables.txt) If dirtytext/data doesn't exist, DT downloads and build database before performing the required operations, after which you can force the database update by adding the --update option # License # Released under GPL-3.0


نحوه نصب


نصب پکیج whl dirtytext-1.0.0:

    pip install dirtytext-1.0.0.whl


نصب پکیج tar.gz dirtytext-1.0.0:

    pip install dirtytext-1.0.0.tar.gz