معرفی شرکت ها


cpm-analytics-0.0.204


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Investigate relationship on variables pairs in tabular datasets, based on Correlation, PPS and MIC scores.
ویژگی مقدار
سیستم عامل -
نام فایل cpm-analytics-0.0.204
نام cpm-analytics
نسخه کتابخانه 0.0.204
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Fernando Stefankevicius
ایمیل نویسنده fernando_doreto@hotmail.com
آدرس صفحه اصلی -
آدرس اینترنتی https://pypi.org/project/cpm-analytics/
مجوز MIT
## CPM Analytics ADD EMOTICONS `cpm-analytics` goal is to provide insights on major relationships in a tabular dataset. The package analyzes the data by computing the following scores: Correlation levels, Power Predictive Score (PPS) and Maximal Information Coefficient (MIC). Next, for each variable's pair, it plots the scatterplot, boxplot or bar plot. Finally, it shows a heatmap for each score and each variable pair. That gives insights on how variables relate to each other, and is useful in the Exploratory Data Analysis workflow. From there on, you can decide to which additional data visualizations to look after, By the way, CPM is a short for **C**orrelation, **P**PS and **M**IC. The overall logic is Logic - It calculates correlation (Spearman and Person) using with all columns pairs, then filters correlation levels based on pre-defined threshold. As a result, only relevant column pairs for Corrlaion remain. - It calculates PPS using all columns pairs, then filter PPS levels based on pre-defined threshold. As a result, only relevant column pairs for PPS remain. - The list of relevant pairs for both Correlation and PPS are merged, and used as reference to compute MIC. Computing MIC is expensive, and depending on your resources (time, processing etc), it would worth to compute MIC only in the most promising columns pairs. However, the most complete analysis is made considerin all possible columns pairs combinations, although that is more expensive The outputs - it reports the variables pairs with most interesting relationships - as well as a scatter plot for each pair Please visit the documentation Example usage from cpm_analytics import CorrPpsMicAnalytics analytics = CorrPpsMicAnalytics() #corr_threshold=0.4, pps_threshold=0.2) analytics.compute_score(df_raw) analytics.summary_report() analytics.plot_relationships() analytics.plot_heatmaps(figsize=(20,5))


نیازمندی

مقدار نام
==1.3.5 pandas
==3.5.0 matplotlib
==0.11.2 seaborn
==1.3.0 ppscore
==1.2.6 minepy
==1.4.0 feature-engine
==1.1.1 scikit-learn


نحوه نصب


نصب پکیج whl cpm-analytics-0.0.204:

    pip install cpm-analytics-0.0.204.whl


نصب پکیج tar.gz cpm-analytics-0.0.204:

    pip install cpm-analytics-0.0.204.tar.gz