معرفی شرکت ها


TwoSampleHC-0.2.1


Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر
Card image cap
تبلیغات ما

مشتریان به طور فزاینده ای آنلاین هستند. تبلیغات می تواند به آنها کمک کند تا کسب و کار شما را پیدا کنند.

مشاهده بیشتر

توضیحات

Two-sample Higher Criticism
ویژگی مقدار
سیستم عامل OS Independent
نام فایل TwoSampleHC-0.2.1
نام TwoSampleHC
نسخه کتابخانه 0.2.1
نگهدارنده []
ایمیل نگهدارنده []
نویسنده Alon Kipnis
ایمیل نویسنده alonkipnis@gmail.com
آدرس صفحه اصلی https://github.com/alonkipnis/TwoSampleHC
آدرس اینترنتی https://pypi.org/project/TwoSampleHC/
مجوز -
# TwoSampleHC -- Higher Criticism Test between Two Frequency Tables This package provides an adaptation of the Donoho-Jin-Tukey Higher-Critisim (HC) test to frequency tables. This adapatation uses a binomial allocation model for the number of occurances of each feature in two samples, each of which is associated with a frequency table. The exact binomial test associated with each feature yields a p-value. The HC statistic combines these P-values to a global test against the null hypothesis that the two tables are two realizations of the same data generating mechanism. This test is particularly useful in identifying non-null effects under weak and sparse alternatives, i.e., when the difference between the tables is due to few features, and the evidence each such feature provide is realtively weak. More details and applications can be found in [1] Alon Kipnis. (2019). Higher Criticism for Discriminating Word Frequency Tables and Testing Authorship. [2] David Donoho and Alon Kipnis. (2020). Two-sample Testing for Large, Sparse High-Dimensional Multinomials under Rare and WeakPerturbations. [3] Alon Kipnis. (2021). Log-Chisquared P-values under Rare and Weak Departures. ## Example: ``` import numpy as np N = 1000 # number of features n = 5 * N #number of samples P = 1 / np.arange(1,N+1) # Zipf base distribution P = P / P.sum() ep = 0.03 #fraction of features to perturb mu = 0.005 #intensity of perturbation TH = np.random.rand(N) < ep Q = P.copy() Q[TH] += mu Q = Q / np.sum(Q) smp_P = np.random.multinomial(n, P) # sample form P smp_Q = np.random.multinomial(n, Q) # sample from Q pv = two_sample_pvals(smp_Q, smp_P) # binomial P-values hc = HC(pv) hv_val, p_th = HC.HCstar(alpha = 0.25) # Small sample Higher Criticism test print("TV distance between P and Q: ", 0.5*np.sum(np.abs(P-Q))) print("Higher-Criticism score for testing P == Q: ", HC) # (HC score rarely goes above 2.5 if P == Q) ```


نیازمندی

مقدار نام
>=1.6 numpy
>=1.2 scipy
>=0.24 pandas


زبان مورد نیاز

مقدار نام
>=3.6 Python


نحوه نصب


نصب پکیج whl TwoSampleHC-0.2.1:

    pip install TwoSampleHC-0.2.1.whl


نصب پکیج tar.gz TwoSampleHC-0.2.1:

    pip install TwoSampleHC-0.2.1.tar.gz