Computer Age Statistical Inference by Bradley Efron and Trevor Hastie Computer Age Statistical Inference: Algorithms, Evidence and Data Science The twenty-first century has seen a breathtaking expansion of statistical methodology, both in scope and in influence…

\alpha = \text{Pr}_{f_0} \{\bar{x} \ge k\} = \text{Pr}_{f_0} \{\bar{x} - \mu_0 \ge k - \mu_0\},

\frac{\sum_{i = 1}^{n}x_i}{n} \ge \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2},

\text{log } \left( e^{\frac{2\left(\mu_1-\mu_0\right)\sum_{i = 1}^{n}x_i + n\left(\mu_0^2-\mu_1^2\right)}{2\sigma^2}} \right) \ge c,

\left(\frac{1}{n}\right) \sum_{i = 1}^{n}x_i \ge \left(\frac{1}{n}\right) \left( \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1+\mu_0\right)}{2}\right),

\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1^2-\mu_0^2\right)}{2\left(\mu_1-\mu_0\right)},

f\left(x \;\middle\vert\; \mu, \sigma^2 \right) = \prod_{i = 1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{\left(x_i-\mu\right)^2}{2\sigma^2}},

View reading list on Talis Aspire. Computer age statistical inference (Vol. résultant dans le code python ci-dessous: pour obtenir un chiffre et des valeurs pour et très similaires à ma première simulation.

Soit le rapport de vraisemblance ,L(x), 

L(x)=f1(x)f0(x) = e^{\frac{-\sum_{i = 1}^{n} \left(x_i^2 -2x_i\mu_1 + \mu_1^2\right) + \sum_{i = 1}^{n} \left(x_i^2 -2x_i\mu_0 + \mu_0^2\right)}{2\sigma^2}},

\bar{x} \ge \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2},

Computer Age Statistical Inference: Algorithms, Evidence, and Data Science. Supposons que nous essayons de décider entre deux fonctions de densité de probabilité possibles pour les données observées , une densité d'hypothèse nulle et une densité alternative . \begin{array}{ll} \alpha = \text{Pr}_{f_0} \{\bar{x} \ge k\},\\ \beta = \text{Pr}_{f_1} \{\bar{x} \lt k\}.\end{array} \enspace \enspace \text{ where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2},

Past exam papers for ST323 ... with solutions and hints in the appendix, an extensive bibliography, and a link to further literature and notes. "Big data," "data science," and "machine learning" have become familiar terms in the news, as statistical methods are brought to bear upon the enormous data sets of modern science and commerce.

t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if log } L(x) \ge c\\ 0\enspace\text{if log } L(x) \lt c.\end{array} \right. J'ai ensuite édité la question pour résumer mon doute au début du post. 

f_1 \sim \mathcal{N} \left(0.5,1\right),

F( x\mid\mu ,\sigma^2) =\prod_{i = 1}^{n}\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x_i- \mu )^2}{2\sigma^2}}

t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if log } L(x) \ge c\\ 0\enspace\text{if log } L(x) \lt c.\end{array} \right.

The twenty-first century has seen a breathtaking expansion of statistical methodology, both in scope and in influence. CRC press. (dont l'intégralité du code Python est disponible dans cette question) Je suis et pour une coupure comme une confirmation que mon code est correct.

Enfin, lorsque Trevor Hastie a répondu que "... entraînant un seuil pour x de 0,4", cela signifie que dans l'équation ci-dessous (voir la section B de cette question):

Donc, en Python, nous pouvons obtenir pour un seuil de coupure comme ci-dessous:

\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1-\mu_0\right)\left(\mu_1+\mu_0\right)}{2\left(\mu_1-\mu_0\right)},

Il me semble que toute question qui oblige les lecteurs à parcourir 11 pages de code informatique, de sortie statistique et d'algèbre est peu susceptible d'être lue par quiconq Cambridge University Press. Course Objectives, Syllabus, and Notes STAT 5380 aims to provide a solid theoretical foundation for statistical inference (estimation and testing). J'ai donc posté cette question (comme ci-dessous) et reçu de Trevor Hastie la confirmation qu'il y a une erreur dans le livre qui sera corrigée (en d'autres termes, mes simulations et calculs - tels qu'implémentés en Python dans cette question - sont corrects ).

=e^{\frac{2 (\mu_1-\mu_0)\sum_{i = 1}^{n}x_i+ n (\mu_0^2-\mu_1^2)}{2\sigma^2}}

\beta=\text{Pr}_{f_1}\{t(x)=0\}. Si vous êtes intéressé à poursuivre cela, comme vous semblez l'être du temps et de l'attention que vous y avez consacrés, puis-je vous suggérer d'identifier le nœud du problème et de voir si vous pouvez l'expliquer et poser votre question dans l'espace de une ou au plus deux pages de matériel?

\alpha = \text{Pr}_{f_0} \{t(x)=1\},

j'ai donc implémenté le code python ci-dessous:

\beta=\text{Pr}_{f_1}\{\bar{x}< k \} =\text{Pr}_{f_1}\{\bar{x}-\mu_1< k -\mu_1\}

Computer age statistical inference (Vol. Cambridge University Press.

= e^{\frac{-\sum_{i = 1}^{n} \left(x_i-\mu_1\right)^2 + \sum_{i = 1}^{n} \left(x_i-\mu_0\right)^2}{2\sigma^2}},

t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if } \bar{x} \ge k\\ 0\enspace\text{if } \bar{x} \lt k.\end{array} \right.