معرفی شرکت ها


TextProcess-Ora-0.0.6


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

compute similar scores of two text
ویژگی مقدار
سیستم عامل OS Independent
نام فایل TextProcess-Ora-0.0.6
نام TextProcess-Ora
نسخه کتابخانه 0.0.6
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Ora
ایمیل نویسنده victor.xsyang@gmail.com
آدرس صفحه اصلی https://github.com/shawshany/TextProcess
آدرس اینترنتی https://pypi.org/project/TextProcess-Ora/
مجوز -
# TextProcess Package 这是一个文本预处理的python库,主要是在做自然语言处理任务时,对文本进行一些预处理工作。 # 支持的功能 * 英文字母大写转小写 * 中文繁体转简体 * 中文简体转繁体 * 全角转半角 * 去除emotion表情 * 将emotion表情替换成文字描述 * 去除控制字符 * 去除超链接tag,href * 去除http超链接 * 将长数字转换成特殊字符 * 过滤括号及括号内的内容【xxxxx】/(xxxxxxx)/ [xxxx] 【.*】|(.*)|\[.*\] * 过滤连续标点和空格 * 只保留中文字符 * 保留中文和英文 * 保留中文和英文及数字 # 安装方法 ```pip install TextProcess-Ora``` # 使用方法 ``` import TextProcess.TextProcess as tp if __name__ == '__main__': test_string = u'我😍愛你中華https://<a></a>,,,,,, Hello Word 121233124234213 [sdfsd]{}【】' test = tp.TextProcess() # 英文字母大写转小写 print(test.strLower(test_string)) # '我😍你中华<http://><a></a>, hello word。' # 中文繁体转简体 print(test.Tra2Sim(test_string, 'zh-hans')) # 中文简体转繁体 print(test.Tra2Sim(test_string, 'zh-hant')) # 全角转半角 print(test.strQ2B(test_string)) # 去除emotion表情 print(test.replace_emotion(test_string,"")) # 将emotion表情替换成文字描述 print(test.convert_emotion(test_string)) # 去除控制字符 print(test.replace_control_character(test_string, '')) # 去除超链接tag,href print(test.remove_ahref(test_string, '')) # 去除http超链接 print(test.remove_http(test_string, '')) # 将长数字转换成特殊字符 print(test.replace_long_num(test_string, 'LONG_NUM')) # 过滤括号及括号内的内容【xxxxx】/(xxxxxxx)/ [xxxx] 【.*】|(.*)|\[.*\] print(test.replace_brackets(test_string, '')) # 过滤连续标点和空格 print(test.remove_commas(test_string)) # 只保留中文字符 print(test.remove_not_che(test_string)) # 保留中文和英文 print(test.keep_chi_eng(test_string, '')) # 保留中文和英文及数字 print(test.keep_chi_eng_num(test_string, '')) # 一条龙服务 基本过滤 print(test.evaluate(test_string, 'OnlinePipe')) #一条龙服务 强过滤 print(test.evaluate(test_string, 'OnlinePipeStrictMore')) #一条龙服务 极强过滤 print(test.evaluate(test_string, 'OnlinePipeStrictMost')) ```


زبان مورد نیاز

مقدار نام
>=2.7 Python


نحوه نصب


نصب پکیج whl TextProcess-Ora-0.0.6:

    pip install TextProcess-Ora-0.0.6.whl


نصب پکیج tar.gz TextProcess-Ora-0.0.6:

    pip install TextProcess-Ora-0.0.6.tar.gz