معرفی شرکت ها


Effulge-0.0.1


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

A small package used to find data variances
ویژگی مقدار
سیستم عامل -
نام فایل Effulge-0.0.1
نام Effulge
نسخه کتابخانه 0.0.1
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Regish
ایمیل نویسنده regishdhanush@gmail.com
آدرس صفحه اصلی https://github.com/Regish/Effulge
آدرس اینترنتی https://pypi.org/project/Effulge/
مجوز -
# Effulge ## Use Case - When we have two pyspark dataframes with valid Primary Key - and we need to find the attributes that are mismatching between the two dataframes. ----- ## Example Lets consider two dataframes "**expectation**" and "**reality**". ### *Inputs* If Primary Key is (*ProductID, Colour*) and if the contents of "**expectation**" are - <table border=solid> <tr><th style="background-color:lightgreen">ProductID</th><th>ProductName</th><th style="background-color:lightgreen">Colour</th><th>UnitPrice</th><th>Quantity</th><th>Fragile</th><th>Gift</th></tr> <tr><td>1001</td><td>GelPen</td><td>Blue</td><td>10</td><td>2</td><td>0</td><td>0</td></tr> <tr><td>1001</td><td>GelPen</td><td>Black</td><td>10</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1001</td><td>GelPen</td><td>Red</td><td>10</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1002</td><td>InkPen</td><td>Blue</td><td>50</td><td>1</td><td>0</td><td>1</td></tr> <tr><td>1003</td><td>InkBottle</td><td>Blue</td><td>35</td><td>1</td><td>1</td><td>1</td></tr> <tr><td>1004</td><td>Pencil</td><td>Grey</td><td>3</td><td>5</td><td>0</td><td>0</td></tr> <tr><td>1005</td><td>Eraser</td><td>White</td><td>2</td><td>2</td><td>0</td><td>0</td></tr> <tr><td>1006</td><td>Sharpner</td><td>Orange</td><td>3</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1006</td><td>Sharpner</td><td>Steel</td><td>5</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1007</td><td>GeometryBox</td><td>Green</td><td>40</td><td>0</td><td>0</td><td></td></tr> </table> And if contents of "**reality**" are - <table border=solid> <tr><th style="background-color:lightgreen">ProductID</th><th>ProductName</th><th style="background-color:lightgreen">Colour</th><th>UnitPrice</th><th>Quantity</th><th>Fragile</th><th>Gift</th></tr> <tr><td>1001</td><td>GelPen</td><td>Blue</td><td>10</td><td>2</td><td>0</td><td>0</td></tr> <tr><td>1001</td><td>GelPen</td><td>Black</td><td>10</td><td style="background-color:yellow">7</td><td>0</td><td>0</td></tr> <tr><td>1001</td><td>GelPen</td><td>Red</td><td>10</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1002</td><td>InkPen</td><td>Blue</td><td>50</td><td>1</td><td>0</td><td>1</td></tr> <tr><td>1003</td><td>InkBottle</td><td>Blue</td><td style="background-color:yellow">3</td><td>1</td><td>1</td><td style="background-color:yellow">0</td></tr> <tr style="background-color:orange"><td>1003</td><td>WaterBottle</td><td>Blue</td><td>20</td><td>2</td><td>0</td><td>0</td></tr> <tr><td>1004</td><td>Pencil</td><td>Grey</td><td>3</td><td>5</td><td>0</td><td>0</td></tr> <tr><td>1005</td><td>Eraser</td><td style="background-color:yellow">Whiteee</td><td>2</td><td>2</td><td>0</td><td>0</td></tr> <tr><td>1006</td><td>Sharpner</td><td>Orange</td><td>3</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1006</td><td>Sharpner</td><td>Steel</td><td>5</td><td>1</td><td>0</td><td>0</td></tr> <tr><td>1007</td><td>GeometryBox</td><td>Green</td><td>40</td><td>0</td><td style="background-color:yellow">1</td><td></td></tr> </table> ### *Output* Then, Effulge will produce an output dataframe with following contents - <table border=solid> <tr><th style="background-color:lightgreen">productid</th><th style="background-color:lightgreen">colour</th><th>EFFULGE_VARIANCE_PROVOKER</th></tr> <tr><td>1007</td><td>Green</td><td>[fragile]</td></tr> <tr><td>1001</td><td>Black</td><td>[quantity]</td></tr> <tr><td>1003</td><td>Blue</td><td>[fragile, gift, productname, quantity, unitprice]</td></tr> <tr><td>1003</td><td>Blue</td><td>[gift, unitprice]</td></tr> <tr><td>1005</td><td>White</td><td>[MISSING_PRIMARY_KEY]</td></tr> <tr><td>1003</td><td>Blue</td><td>[DUPLICATE_PRIMARY_KEY]</td></tr> </table> ----- ## Usage: ```python from effulge import spot_variance # Initialize SparkSession # Load data into dataframes, let's say they are called "df_expectation" and "df_reality" # Declare a tuple with valid primary key, let's say it is called "primary_key" output = spot_variance(df_expectation, df_reality, primary_key) output.show() # to generate variance report from effulge import save_variance_report save_variance_report( variance_df=output, source_df=df_expectation, target_df=df_reality, super_key=primary_key, file_name="effulge_variance_report", src_prefix='SRC', tgt_prefix='TGT' ) ``` -----


نیازمندی

مقدار نام
>=3.0.0 pyspark
>=1.3.0 pandas
>=3.0.3 XlsxWriter


زبان مورد نیاز

مقدار نام
>=3.0 Python


نحوه نصب


نصب پکیج whl Effulge-0.0.1:

    pip install Effulge-0.0.1.whl


نصب پکیج tar.gz Effulge-0.0.1:

    pip install Effulge-0.0.1.tar.gz