معرفی شرکت ها

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Data File Elf

ویژگی	مقدار
سیستم عامل	-
نام فایل	dfelf-0.1.9
نام	dfelf
نسخه کتابخانه	0.1.9
نگهدارنده	[]
ایمیل نگهدارنده	[]
نویسنده	Krix Tam
ایمیل نویسنده	krix.tam@qq.com
آدرس صفحه اصلی	https://github.com/KrixTam/dfelf
آدرس اینترنتی	https://pypi.org/project/dfelf/
مجوز	MIT

# dfelf 由于日常工作需要（有时候还有写blog的需要），总是要处理一些数据文件，很多繁琐的工作希望可以有一个文件精灵来帮我处理，所以就把过去写的小工具重新整理下，形成“数据文件精灵”（“dfelf”）。 “dfelf”为“Data File Elf”的缩写。因为日常总是需要处理如下文件： * PDF * CSV * 图片所以数据文件精灵初步设计可以支持以上三类文件的日常处理需要。自v0.1.4版本开始支持*silent模式*，即不进行IO处理、不输出文件，相关方法中增加*silent*参数，默认值为*False*。 ## 安装 > pip install --upgrade dfelf 在macOS下，如果要pdf2image运行正常，需要安装Poppler > conda install -c conda-forge poppler ## PDFFileElf PDF文件精灵用于日常对*pdf*文件的处理应用。相关方法如下： * **reorganize**：抽取PDF文件中相关页重新排列组合成一个新的PDF文件；对应的配置设定为*reorganize*。 > PDFFileElf.reorganize(input_obj: PdfFileReader = None, silent: bool = False, **kwargs) * **image2pdf**：将图片文件拼接成一个PDF文件，每个图片为一页；对应的配置设定为*image2pdf*。 > PDFFileElf.image2pdf(input_obj: list = None, silent: bool = False, **kwargs) * **to_image**：将PDF文件相关页输出成图片，每一页为一个图片，以页码为文件后续；对应的配置设定为*2image*。 > PDFFileElf.to_image(input_obj: PdfFileReader = None, silent: bool = False, **kwargs) * **merge**：将PDF文件按顺序合并为一个PDF文件；对应的配置设定为*merge*。 > PDFFileElf.merge(input_obj: list = None, silent: bool = False, **kwargs) * **remove**：将PDF文件中指定的页面删除后输出PDF文件；对应的配置设定为*remove*。 > PDFFileElf.remove(input_obj: PdfFileReader = None, silent: bool = False, **kwargs) * **extract_images**：将PDF文件中指定的页面或整个PDF文件（当*pages*配置为空*list*时，表示整个PDF文件）的图片进行提取；对应的配置设定为*extract_images*。 > PDFFileElf.extract_images(input_obj: PdfFileReader = None, silent: bool = False, **kwargs) 配置文件设定如下： ```json { 'reorganize': { 'input': 'input_filename', 'output': 'output_filename', 'pages': [1] }, 'image2pdf': { 'images': [], 'output': 'output_filename' }, '2image': { 'input': 'input_filename', 'output': 'output_filename_prefix', 'format': 'png', 'dpi': 200, 'pages': [1] }, 'merge': { 'input': [], 'output': 'output_filename' }, 'remove': { 'input': 'input_filename', 'output': 'output_filename', 'pages': [1] }, 'extract_images': { 'input': 'input_filename', 'output': 'output_filename_prefix', 'pages': [1] } } ``` > - 自v0.1.4版本开始，PDFFileElf.to_image中的**pages**设置为“[ ]”（空列表），表示全量输出，即把整个PDF文件的每一页都输出为图片。 > > - 自v0.1.5版本开始，支持PDFFileElf.merge > > - 自v0.1.6版本开始，支持PDFFileElf.remove和PDFFileElf.extract_images > > 对于PDFFileElf.extract_images的*pages*配置，若为空list，即"**\[ \]**"，表示对整个文件的图片进行提取。 > ## CSVFileElf CSV文件精灵用于日常对*csv*文件的处理应用。相关方法如下： * **add**：将*tags*下定义的*csv*文件，按照*key*进行匹配，补充相关字段到*base*的*csv*文件中；对应的配置设定为*add*。 > CSVFileElf.add(input_obj: pd.DataFrame = None, silent: bool = False, **kwargs) * **join**：将*files*下定义的*csv*文件，拼接到*base*的*csv*文件中；对应的配置设定为*join*。 > CSVFileElf.join(input_obj: pd.DataFrame = None, silent: bool = False, **kwargs) * **exclude**：根据*exclusion*下定义的条件（*op*支持的操作有：'=', '!=', '>', '>=', '<=', '<'），对*input*的*csv*文件内容进行剔除处理；对应的配置设定为*exclude*。 > CSVFileElf.exclude(input_obj: pd.DataFrame = None, silent: bool = False, **kwargs) * **filter**：根据*filters*下定义的条件（*op*支持的操作有：'=', '!=', '>', '>=', '<=', '<'），对*input*的*csv*文件内容进行筛选处理；对应的配置设定为*filter*。 > CSVFileElf.filter(input_obj: pd.DataFrame = None, silent: bool = False, **kwargs) * **split**：根据*key*对*input*的*csv*文件进行拆解处理；对应的配置设定为*split*。 > CSVFileElf.split(input_obj: pd.DataFrame = None, silent: bool = False, **kwargs) * **merge**：基于*on*对*input*的*csv*文件进行合并处理；对应的配置设定为*merge*。 > CSVFileElf.merge(input_obj: list = None, silent: bool = False, **kwargs) 配置文件设定如下： ```json { 'add': { 'base': { 'name': 'base_filename', 'key': 'key_field', 'drop_duplicates': False, }, 'output': { 'name': 'output_filename', 'BOM': False, 'non-numeric': [] }, 'tags': [ { 'name': 'tags_filename', 'key': 'key_field', 'fields': ['field A', 'field B'], 'defaults': ['default value of field A', 'default value of field B'] } ] }, 'join': { 'base': 'base_filename', 'output': { 'name': 'output_filename', 'BOM': False, 'non-numeric': [] }, 'files': [ { 'name': 'join_filename', 'mappings': {} } ] }, 'exclude': { 'input': 'input_filename', 'exclusion': [ { 'key': 'field', 'op': '=', 'value': 123 } ], 'output': { 'name': 'output_filename', 'BOM': False, 'non-numeric': [] } }, 'filter': { 'input': 'input_filename', 'filters': [ { 'key': 'field', 'op': '=', 'value': 123 } ], 'output': { 'name': 'output_filename', 'BOM': False, 'non-numeric': [] } }, 'split': { 'input': 'input_filename', 'output': { 'prefix': 'output_filename_prefix', 'BOM': False, 'non-numeric': [] }, 'key': 'key_field' }, 'merge': { 'input': ['input_filename_01', 'input_filename_02'], 'output': { 'name': 'output_filename', 'BOM': False, 'non-numeric': [] }, 'on': ['field_name'], 'mappings': {} } } ``` 对于输出*output*配置，如果需要输出*BOM*格式，请把*BOM*设置为*True*；若有一些字段需要表达为非数字类字段，以便于在Excel中打开处理的话，请在*non-numeric*中设置需要处理的相关字段。 > 自v0.1.7版本开始，支持CSVFileElf.merge > ### CSVFileElf的处理案例参考 <img src="http://krixtam.com/img/it/dfelf/wm_add.png"> <img src="http://krixtam.com/img/it/dfelf/wm_join_01.png"> <img src="http://krixtam.com/img/it/dfelf/wm_join_02.png"> <img src="http://krixtam.com/img/it/dfelf/wm_exclude.png"> <img src="http://krixtam.com/img/it/dfelf/wm_filter.png"> <img src="http://krixtam.com/img/it/dfelf/wm_split.png"> <img src="http://krixtam.com/img/it/dfelf/wm_merge.png"> ## ImageFileElf Image文件精灵用于日常对图片类文件的处理应用。相关方法如下： * **to_favicon**：把图片转化为favicon；对应的配置设定为*favicon*。 > ImageFileElf.to_favicon(input_obj: Image.Image = None, silent: bool = False, **kwargs) * **splice**：将*input*中的图片文件拼接为一张图片；对应的配置设定为*splice*。 > ImageFileElf.splice(input_obj: list = None, silent: bool = False, **kwargs) * **watermark**：在指定的*x*、*y*坐标中增加水印文字；对应的配置设定为*watermark*。 > ImageFileElf.watermark(input_obj: Image.Image = None, silent: bool = False, **kwargs) * **qrcode**：将*input*的字符串生成二维码；对应的配置设定为*qrcode*。 > ImageFileElf.qrcode(input_obj: str = None, silent: bool = False, **kwargs) * **decode_qrcode**：将*input*的二维码图片解析成字符串，并返回；对应的配置设定为*dqrcode*。 > ImageFileElf.decode_qrcode(input_obj=None, **kwargs) * **to_base64**：将*input*的图片转化为base64字符串，并返回；对应的配置设定为*2base64*。 > ImageFileElf.to_base64(input_obj: bytes = None, **kwargs) * **from_base64**：将*input*的base64字符串转化为图片；对应的配置设定为*base64*。 > ImageFileElf.from_base64(input_obj: str = None, silent: bool = False, **kwargs) * **resize**：将*input*的图片调整尺寸后输出到*output*；对应的配置设定为*resize*。 > ImageFileElf.resize(input_obj: Image.Image = None, silent: bool = False, **kwargs) * **crop**：将*input*的图片按照*loaction*裁剪后输出到*output*；对应的配置设定为*crop*。当*mode*为**0**时，*location*为**left, top, right, bottom**构成的数组；当*mode*为**1**时，*location*为**left, top, width, right**构成的数组。 > ImageFileElf.crop(input_obj: Image.Image = None, silent: bool = False, **kwargs) * **fill**：将*input*的图片中*loaction*的指定区域进行马赛克或者单色填充后输出到*output*；对应的配置设定为*fill*。当*mode*为**0**时，*location*为**left, top, right, bottom**构成的数组；当*mode*为**1**时，*location*为**left, top, width, right**构成的数组。*type*为填充方式，**M**或**m**表示马赛克填充，单色填充可以用*#8012de*指定到**type**中实现。 > ImageFileElf.fill(input_obj: np.ndarray = None, silent: bool = False, **kwargs) 配置文件设定如下： ```json { 'favicon': { 'size': -1, 'input': 'input_filename' }, 'splice': { 'output': 'output_filename', 'input': [], 'width': 700, 'gap': 5, 'color': '#ffffff', 'mode': 'v' }, 'watermark': { 'input': 'input_filename', 'output': 'output_filename', 'text': 'Krix.Tam', 'color': 'FFFFFF', 'font': 'arial.ttf', 'font_size': 24, 'x': 5, 'y': 5, 'alpha': 50 }, '2base64': { 'input': 'input_filename', 'css_format': False }, 'base64': { 'input': 'base64 string', 'output': 'output_filename' }, 'qrcode': { 'input': 'string', 'output': 'output_filename', 'border': 2, 'fill_color': "#000000", 'back_color': "#FFFFFF" }, 'dqrcode': { 'input': 'input_filename' }, 'resize': { 'input': 'input_filename', 'output': 'output_filename', 'scale': False, 'width': 28, 'height': 28, 'quality': 100, 'dpi': 1200 }, 'crop': { 'input': 'input_filename', 'output': 'output_filename', 'mode': 0, 'location': [0, 0, 5, 5] }, 'fill': { 'input': 'input_filename', 'output': 'output_filename', 'mode': 0, 'location': [0, 0, 5, 5], 'unit': 5, 'type': 'M' } } ``` > - 自v0.1.3版本开始，有如下变更： > > - ImageFileElf.watermark对*color*参数支持值为"**auto**"的设定，表示由程序自动选择水印颜色；颜色选择方法为水印所在位置(*x, y*)区域高频使用颜色的反转颜色。 > > - ImageFileElf.splice支持水平拼接（设置*mode*参数为"**H**"或"**h**"，默认为垂直拼接，即*mode*参数为"**v**"或"**V**"）。 > > - 自v0.1.4版本开始，支持ImageFileElf.crop、ImageFileElf.fill > > - 自v0.1.6版本开始，ImageFileElf.splice有如下调整： > > - 原配置项*images*调整为*input*，即使用与其他方法保持一致的输入配置项名称 > > - 配置项*mode*除了支持水平（h或H）、垂直（v或V）外，新增自动模式，即自动水平（ah，不区分大小写）、自动垂直（av，不区分大小写）的拼接模式，此时参数*width*将会被忽略。 > > - 自v0.1.11版本开始，ImageFileElf.splice配置项*mode*新增：按照图片最小宽度自动垂直（xv，不区分大小写）或按照最小高度进行自动水平（xh，不区分大小写）的拼接模式，此时参数*width*将会被忽略。 > > - 自v0.1.12版本开始，ImageFileElf.splice新增配置项*color*，表示边框颜色，默认值为白色。 > ## 示例 ```python import os from dfelf import CSVFileElf df_elf = CSVFileElf() config = { 'base': { 'name': os.path.join('sources', 'df1.csv'), 'key': 'key' }, 'output': { 'name': 'test_add.csv' }, 'tags': [ { 'name': os.path.join('sources', 'df3.csv'), 'key': 'key', 'fields': ['new_value'], 'defaults': ['0.0'] } ] } df_elf.add(**config) ``` 下面的代码在v0.1.0版本开始，可以获得与上面代码同样的结果： ```python import os import pandas as pd from dfelf import CSVFileElf df_elf = CSVFileElf() config = { 'base': { 'key': 'key' }, 'output': { 'name': 'test_add.csv' }, 'tags': [ { 'name': os.path.join('sources', 'df3.csv'), 'key': 'key', 'fields': ['new_value'], 'defaults': ['0.0'] } ] } input_df = pd.read_csv(os.path.join('sources', 'df1.csv'), dtype=str) df_elf.add(input_df, **config) ```

نیازمندی

مقدار	نام
>=0.0.6	pymoment
>=0.0.15	ni-config
>=0.25.2	pandas
>=1.26.0	PyPDF2
>=5.2.0	Pillow
>=1.14.0	pdf2image
>=7.2	qrcode
>=4.5.3.56	opencv-python
>=0.19.2	scikit-image

زبان مورد نیاز

مقدار	نام
>=3.6	Python

نحوه نصب

نصب پکیج whl dfelf-0.1.9:

pip install dfelf-0.1.9.whl

نصب پکیج tar.gz dfelf-0.1.9:

pip install dfelf-0.1.9.tar.gz