《概率导论》补充答案

《概率导论》第二版答案补充,书上已给解答的不再赘述。

部分来自:

answer-to-introduction-to-probability (NeilKleistGao/雪岛/HumphreyYang)

http://athenasc.com/ (Athena Scientific, Belmont, Massachusetts)-


第一章 样本空间与概率

1.

令事件A为掷出偶数,即$A = {2, 4, 6}$

令B表示点数大于3的事件,即$B = {4, 5, 6}$

那么:

$A^c = {1, 3, 5}, B^c = {1, 2, 3}$

$A \cup B = {2, 4, 5, 6}, A \cap B = {4, 6}$

所以$(A \cup B)^c = {1, 3} = A^c \cap B^c$

$(A \cap B)^c = {1, 2, 3, 5} = A^c \cup B^c$

2.

(a)

设全集为S,由代数性质:

$\begin{array}{lcr}
A^c = \
A^c \cap S = \
A^c \cap (B \cup B^c) = \
(A^c \cap B) \cup (A^c \cap B^c)
\end{array}$

对$B^c$的结论同理,证毕。

也可以通过韦恩图进行证明:任意一个集合中的元素,要么属于$B$,要么属于$B^c$。上式就是全概率定理的特殊情况。

(b)

设全集为S,由德摩根律:

$\begin{array}{lcr}
(A \cap B)^c = \
A^c \cup B^c = \
(A^c \cap S) \cup (B^c \cap S) = \
(A^c \cap B) \cup (A^c \cap B^c) \cup (A^c \cap B^c) \cup (A \cap B^c) = \
(A^c \cap B) \cup (A^c \cap B^c) \cup (A \cap B^c)
\end{array}$

证毕。

也可以通过韦恩图进行证明:A交B的补集中,只有三种可能:属于A但不属于B、属于B但不属于A、既不属于A也不属于B,整理即可得到上式。

©

令事件A为掷出偶数,即$A = {2, 4, 6}$

令B表示点数大于3的事件,即$B = {1, 2, 3}$

则$(A \cap B)^c = {1, 3, 4, 5, 6}$

$(A^c \cap B) \cup (A^c \cap B^c) \cup (A \cap B^c) = {1, 3} \cup {5} \cup {4, 6} = {1, 3, 4, 5, 6}$

所以$(A \cap B)^c = (A^c \cap B) \cup (A^c \cap B^c) \cup (A \cap B^c)$。

3.

略。

4.

证明略,这里给出一个实例。假设[0, 1]区间中的数可数,那么我们可以列出:
$$\begin{array}{rcl}
x_1 &= 0.3154… \
x_2 &= 0.114514… \
x_3 &= 0.2333… \

\end{array}$$
我们可以找到一个y,使得$y = 0.121…$。由于y的第n位与$x_n$不同,于是这个y不可能在上面的数中。

当然找到y的方式并不止书上一种。

5.

设挑选一个学生,这个学生是天才为事件A,这个学生喜欢巧克力为事件B,那么:

$P(A) = 0.6, P(B) = 0.7, P(A \cap B) = 0.4$

所以$P(\bar A \cap \bar B) = 1 - P(A) - P(B) + P(A \cap B) = 0.1$。

这题是12题容斥原理的应用。

6.

因为偶数的概率是奇数的两倍,又因为$P(even) + P(odd) = 1$,所以$P(even) = \frac{2}{3}, P(odd) = \frac{1}{3}$。

因为不同偶数/奇数面出现的概率相同,于是:

$$\begin{array}{rcl}
P(1) &= \frac{1}{9} \
P(2) &= \frac{2}{9} \
P(3) &= \frac{1}{9} \
P(4) &= \frac{2}{9} \
P(5) &= \frac{1}{9} \
P(6) &= \frac{2}{9}
\end{array}$$

所以点数小于4的概率为$P(1) + P(2) + P(3) = \frac{4}{9}$。

7.

样本空间为:第一次时停止,第二次时停止,第三次时停止…

8.

不妨设第n局获胜的概率为$P_n$,那么最终获胜的概率:

$P = P_1(1 - P_2)P_3 + P_1P_2 + (1 - P_1)P_2P_3$

化简上式得到$P = P_1P_3 + P_2(P_1 + P_3 - 2P_1P_3)$。

对于函数$f(x, y) = x + y - 2xy$在x和y都属于[0,
1]区间内时,$x \geq x^2, y \geq y^2, (x - y)^2 \geq 0$,所以$x + y - 2xy \geq x^2 + y^2 -2xy = (x - y)^2 \geq 0$

所以对于$(P_1 + P_3 - 2P_1P_3)$,这个值永远非负,故$P_2$最大时整个式子最大,且与$P_1,P_3$的顺序无关。

证毕。

9.

(a)

$P(A) = P(A \cap \Omega) = P(A \cap \bigcup_{i = 1}^nS_i) = P(\bigcup_{i = 1}^n(A \cap S_i))$

由于${S_1, S_2, …, S_n}$互不相容,故$P(A) = \sum_{i = 1}^nP(A \cap S_i)$

证毕。

(b)

不难发现,$B^c \cap C^c, B \cap C^c, B^c \cap C, B \cap C$互不相容

所以$P(A) = P(A \cap B^c \cap C^c) + P(A \cap B \cap C^c) + P(A \cap B^c \cap C) + P(A \cap B \cap C)$

由容斥原理,$P(A) = P(A \cap B^c \cap C^c) + P(A \cap B) + P(A \cap C) - P(A \cap B \cap C)$

证毕。

10.

$P(A) + P(B) - 2P(A \cap B) = P(A \cup B) - P(A \cap B) = P((A \cap B^c) \cup (A^c \cap B))$

证毕。

11.

(a)

原文给出的等式应为$P(A \cup B) = P(A) + P(B) - P(A \cap B)$,似乎存在笔误。

(b)

略。

12.

(a)

略。

(b)

当n = 3时,由(a)可知等式成立。

假定n = m时等式依然成立,那么当n = m + 1时:

$P(\bigcup_{k = 1}^{m + 1}) = P(A_{m + 1} \cup \bigcup_{k = 1}^m A_k) =
P(A_{m + 1}) + \sum_{i \in S_1}P(A_i)
- \sum_{(i_1, i_2) \in S_2}P(A_{i_1} \cap A_{i_2}) + … + (-1)^{n - 1}P(\bigcap_{k = 1}^{n}A_k) -P(A_{m + 1} \cap \bigcup_{k = 1}^m A_k)$

整理上式可得:

$P(\bigcup_{k = 1}^{m + 1}) = \sum_{i \in S_1}P(A_i) - \sum_{(i_1, i_2) \in S_2}P(A_{i_1} \cap A_{i_2}) + … + (-1)^nP(\bigcap_{k = 1}^{m + 1}A_k)$

归纳完毕。

13.

略。

14.

(a)

仅有(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6,
6)满足情况,故$P = \frac{1}{6}$

(b)

若总和小于等于4,则有(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (3,
1)六种情况,其中一对的事件有两个,故$P = \frac{1}{3}$。

©

设两个骰子都是6为事件A,恰有一个骰子为6为事件B,则$P(A) + P(B) = \frac{1}{36} + \frac{10}{36} = \frac{11}{36}$即为所求。

(d)

不同的抛掷结果一共有30种,而至少一个骰子为6(也只能有一个骰子为6)有10种情况,所以$P = \frac{1}{3}$

15.

在已知第一次为正面的情况下,两次均正面朝上的概率只取决于第二次抛掷的情况,所以此时的概率为$\frac{1}{2}$。

而两次中至少有一次正面朝上的概率为$\frac{3}{4}$,在已知该前提下,两次正面的概率为$\frac{1}{3}$,所以爱丽丝的结论是正确的。

假定硬币不对称,即$p \ne 1 - p$,那么第一种情况的概率变为$p$;而第二种情况下至少一次正面朝上的概率变为了$1 - (1 - p)^2 = 2p - p^2$,
在该前提下两次正面朝上的概率就应该是$\frac{p}{2 - p}$。因为$p \leq 1$,所以仅当$p = 1$或$p = 0$,即正面始终朝上或朝下时,两个条件概率相等,
其他条件下,前者的概率都要比后者大。

可以将这个结论推广到任意n$(n \geq 2)$次游戏:将前n -
1次游戏抛得正面条件下得到n次正面的概率与至少n-1次得到正面条件下的概率相差,
得到$\frac{(n - 1)p + (1 - n)p^2}{p + n - np}$,由于$p \geq p^2$,可以得到和上面一样的结论。

16.

所有抛掷可以得到正面的概率为$\frac{1}{3} + \frac{1}{6} = \frac{1}{2}$,而选中正常硬币并抛掷得到正面的概率为$\frac{1}{3} \times \frac{1}{2} = \frac{1}{6}$,
于是由条件概率可得$\frac{\frac{1}{6}}{\frac{1}{2}} = \frac{1}{3}$。

也可以考虑所有抛掷的结果:一共是三正三反,而三个正面朝上的情况中只有其中一个是来自于正常硬币,结果也是$\frac{1}{3}$。

17.

设这批产品被接受为事件A,则$P(A) = \frac{C_{96}^{5}}{C_{100}^5}$,那么被拒绝的概率就为$1 - P(A) \approx 0.19$

18.

$P(A \cap B|B) = \frac{P(A \cap B \cap B)}{P(B)} = \frac{P(A \cap B)}{P(B)} = P(A|B)$

证毕。

19.

若$j \ne i$,则在第i个抽屉内找但没有找到的概率为$1 - p_id_i$(要么不在这个抽屉,要么在但是没有找到),而报告在第j个抽屉的概率为$p_j$,
故结果为$\frac{p_j}{1 - p_id_i}$。

若$j = i$,在第i个抽屉内找但没有找到的概率同上,而报告恰好就在第i个抽屉并且没有被找到的概率为$P_i(1 - d_i)$,
故结果为$\frac{p_i(1 - d_i)}{1 - p_id_i}$

证毕。

20.

(a)
(i)

进攻风格下,和局的概率为0,所以我们只需要考虑两种情况:
前两局鲍里斯均获胜,前两局平局,第三局鲍里斯获胜。

所以获胜概率为:$p_w^2 + p_w^2(1 - p_w)$。

(ii)

保守风格下,获胜的概率为0,所以获胜情况只有一种:
前两局和局,第三局获胜。

所以获胜概率为:$p_d^2p_w$。

(iii)

由全概率定理,整理出所有获胜情况:

  • 第一局获胜,第二局平局

  • 第一局获胜,第二局失败,第三局获胜

  • 第一局失败,第二局获胜,第三局获胜

所以获胜概率为:$p_wp_d + p_w^2(1 - p_d) + p_w^2(1 - p_w)$

(b)

由(a)(iii)可知,策略三的获胜概率为$p_w(p_d + 2p_w - p_w^2 - p_wp_d)$。

不难发现若$p_w = 0.49$时,$\exists p_d \approx 0.56$,使得上式可以大于0.5。

21.

  • 若在第一回合获胜,概率为$\frac{m}{m + n}$

  • 若在第二回合获胜,概率为$\frac{n}{m + n}\frac{n - 1}{m + n - 1}\frac{m}{m + n - 2}$

  • 若在第三回合获胜,概率为$\frac{n}{m + n}\frac{n - 1}{m + n - 1}\frac{n - 2}{m + n - 2}\frac{n - 3}{m + n - 3}\frac{m}{m + n - 4}$

  • .…

从上面的式子并不容易看出递推式来,但如果稍作一些改动:

  • 若第一回合前无法决出胜负,概率为$1$

  • 若第二回合前无法决出胜负,概率为$\frac{n}{m + n}\frac{n - 1}{m + n - 1}$

  • 若第三回合前无法决出胜负,概率为$\frac{n}{m + n}\frac{n - 1}{m + n - 1}\frac{n - 2}{m + n - 2}\frac{n - 3}{m + n - 3}$

  • .…

设第i回合前无法决出胜负的概率为$p_i$,那么我们可以得到$p_1 = 1$,递推式$p_i = p_{i - 1}\frac{n - 2i + 4}{m + n - 2i + 4}\frac{n - 2i + 3}{m + n -2i + 3}$

所以获胜概率为:$\sum_{i = 1}^{1 + \lfloor \frac{n}{2} \rfloor}p_i \frac{m}{m + n - 2i + 2}$

22.

当$k = 1$时,取出白球的概率为$\frac{m}{m + n}$显然成立。

不妨假设当$k = p$时,在第k个罐子里取出白球的概率依然是$\frac{m}{m + n}$,
则对于$k = p + 1$时,由全概率定理, 在第k个罐子里取出白球的概率为

$\frac{m}{m + n}\frac{m + 1}{m + n + 1} + \frac{n}{m + n}\frac{n}{m + n + 1}$

整理后得到$\frac{m}{m + n}$,归纳完毕。

证毕。

23.

不妨设罐子里的球的个数为n,分两种情况讨论:

  • 第一次交换两个球,第二次再交换回来,第三第四次亦如此,这样做的概率为$(\frac{1}{n})^4$

  • 第一次第二次一共交换了两组球,第三第四次再交换回来,这样做的概率为$\frac{4(n - 1)^2}{n^6}$

总的概率为二者之和。

24.

$\frac{2}{3}$是先验概率,而$\frac{1}{2}$是后验概率。

25.

不妨设两个信封内的钱数分别为S和L,且$L > S$。

对于S,选中的概率为$\frac{1}{2}$,且只有抛硬币的次数不少于S次时才会换信封。
若第一次选中了该信封,则最后得到的钱数为L的概率为

$\frac{1}{2}(1 - \sum_{i = 1}^{S - 1}(\frac{1}{2})^i) = (\frac{1}{2})^S$

对于L,选中的概率也是$\frac{1}{2}$,且只有抛硬币的次数小于L次时才会选择不换信封。
若第一次选中了该信封,则最后得到的钱数为L的概率为

$\frac{1}{2}\sum_{i = 1}^{L - 1}(\frac{1}{2})^i = \frac{1}{2} - (\frac{1}{2})^L$

所以最后的概率为$\frac{1}{2} - (\frac{1}{2})^L + (\frac{1}{2})^S$。因为$L > S$,所以这个概率大于$\frac{1}{2}$。

26.

(a)

由于A和B独立,由条件概率$P(A|B) = \frac{p(1 - q)}{1 -q} = p$。

(b)

$P© = q(p + \frac{1 - p}{2}) = \frac{q(1 + p)}{2}$

由贝叶斯准则:$P(A|C) = \frac{P(A)P(C|A)}{P©} = \frac{2p}{p + 1}$

27.

  • 当鲍勃的所有硬币均正面朝上时,爱丽丝无论怎么抛都是失败,一共有$2^n$种情况

  • 当鲍勃有一枚硬币朝下时,对于鲍勃来说有$C^1_{n+1}$种可能,而对于爱丽丝来说,除了全正以外都是鲍勃获胜,故有$2^n - C^0_n$种情况

  • 当鲍勃有两枚硬币朝下时,对于鲍勃来说有$C^2_{n+1}$种可能,对于爱丽丝来说,有$2^n - C^0_n - C^1_n$种情况

综上,所有鲍勃获胜的情况的可能数一共是
$2^n + C_{n + 1}^1(2^n - C_n^0) + C_{n + 1}^2(2^n - C_n^0 - C_n^1) + \dots + C_{n + 1}^n(2^n - C_n^0 - \dots - C_n^{n - 1})$

上式化简后得到$2^{2n + 1} - 2^n - \sum_{i = 1}^nC_{n + 1}^i(\sum_{j = 0}^{i - 1}C_n^j)$。

注意到$2^{2n + 1} = 2^{n + 1} \times 2^n = (\sum_{i = 0}^{n + 1}C_{n + 1}^i)(\sum_{i = 0}^{n}C_n^i)$

所以$(\sum_{i = 0}^{n + 1}C_{n + 1}^i)(\sum_{i = 1}^{n}C_n^i) = 2^{2n + 1} - 2^{n + 1}$

因为$\sum_{i = 1}^{n}C_{n + 1}^i(\sum_{j = 0}^{i - 1}C_n^j) = \sum_{i = 1}^{n}C_{n + 1}^i(\sum_{j = i}^{n}C_n^j)$

所以
$2\sum_{i = 1}^{n}C_{n + 1}^i(\sum_{j = 0}^{i - 1}C_n^j) = \sum_{i = 1}^{n}C_{n + 1}^i(\sum_{j = 0}^{i - 1}C_n^j) + \sum_{i = 1}^{n}C_{n + 1}^i(\sum_{j = i}^{n}C_n^j)$

上式就等于$(\sum_{i = 1}^{n}C_{n + 1}^i)(\sum_{i = 0}^{n}C_n^i)$,即$2^{2n + 1} - 2^{n + 1}$

带回原式可知鲍勃获胜的情况总共有$2^{2n}$种,所有情况一共有$2^{2n + 1}$种,故获胜的概率为$\frac{1}{2}$。

证毕。

28.

略。

29.

略。

30.

如果两头猎犬均选择了正确方向,概率为$p^2$;
如果只有一头选择了正确方向,概率为$2p(1 - p)$,此时随机选择到正确方向的概率是$p(1 - p)$,
故在这个策略下选择正确方向的概率为$p^2 + p - p^2 = p$,并不会比只让一条猎犬选择更优。

31.

(a)

由于不同信号之间独立,第k个信号正确传输的概率为$p(1 - \epsilon_0) + (1 - p)(1 - \epsilon_1)$

(b)

1011一共含有三个1和一个0,且彼此独立,所以正确传输的概率为$(1 - \epsilon_0)(1 - \epsilon_1)^3$

©

只有以下的情况数据可以被正常传输:

  • 3个0均没有错误,概率为$(1 - \epsilon_0)^3$

  • 只有一个0发生错误,概率为$C^1_3\epsilon_0(1 - \epsilon_0)^2$

综上,0被正确传输的概率为$(1 - \epsilon_0)^3 + 3\epsilon_0(1 - \epsilon_0)^2$

(d)

将©中的式子变形为$1^3 - 3\epsilon_0^2(1 - \epsilon_0) - \epsilon_0^3 = 1 - 3\epsilon_0^2 + 2\epsilon_0^3$

对上式求导得到$-6\epsilon_0 + 6\epsilon_0^2$,由于$0 \leq \epsilon_0 \leq 1$,所以函数在$\epsilon_0 = 0$时取到最大值。
即:整个传输过程完全不要出错是坠吼的。

(e)

由贝叶斯准则,对方发出的数据为0的概率为$\frac{P(0)}{P(1) + P(0)} = \frac{\epsilon_0^2}{\epsilon_1 + \epsilon_0^2}$

32.

  • 因为各次生育是独立的,所以国王的性别并不会影响他的兄弟姐妹,而生男的概率为$\frac{1}{2}$,故国王有一个兄弟的概率为$\frac{1}{2}$

  • 国王的母亲一共有两个孩子,并且两个都是男性,所以国王有一个兄弟的概率为$\frac{1}{4}$

33.

投一次硬币已经没办法解决这个问题了,那我们考虑投两次。投两次硬币的全部概率为$1^2 = (1 - p + p)^2 = (1 - p)^2 + 2p(1 - p) + p^2$。注意到里面有一个2,
那么我们不妨投两次硬币,如果两次结果相同,则重新开始;剩余的两种情况每个人获胜的概率均为$\frac{1}{2}$。

34.

  • 第一个子系统有效的概率为$p$

  • 第二个子系统有效的概率为$p + 3p^2 - 5P^3 + 2p^4$

  • 第三个子系统有效的概率为$2p - p^2$

由于三个子系统独立,整个系统的有效概率为$p(p + 3p^2 - 5p^3 + 2p^4)(2p - p^2) = 2p^3 + 5p^4 -13p^5 + 9p^6 -2p^7$

35.

由独立性: $\sum_{i = k}^nC^i_np^i(1 - p)^{n - i}$

36.

(a)

只有所有电厂均中断的时候全市才会停电,故由独立性可得:
$\Pi_{i = 1}^np_i$

(b)

如果所有电厂中断,或者只有不到三个电厂在供电,全市会处在停电状态。
设$P(i), P(i, j)$分别为仅第i个电厂工作的概率和仅第i,j个电厂在工作的概率,
即$P(i) = \frac{(1 - p_i)\Pi_{j = 1}^np_j}{p_i}, P(i, j) = \frac{(1 - p_i)(1 - p_j)\Pi_{k = 1}^np_k}{p_ip_j}$,
全市停电的概率为$\Pi_{i = 1}^n + \sum_{i = 1}^nP(i) + \sum_{1 \leq i < j \leq n}P(i, j)$。

37.

$\sum_{i = 0}^{n_1}\sum_{j = 0}^{n_2}\left[r_1i + r_2j > c\right]C_{n_1}^ip_1^i(1 - p_1)^{n_1 - i}C_{n_2}^jp_2^j(1 - p_2)^{n_2 - j}$

38.

考虑泰里思领先的概率$p_T$:只有在剩下的比赛中得到至少6分,才能保证泰里思领先。
所以$p_T = \sum_{i = 6}^8C_8^ip^i(1 - p)^{8 - i}$。

同理对于温迪来说,$P_W = \sum_{i = 4}^8C_8^i(1 - p)^ip^{8 - i} = \sum_{i = 0}^4C_8^ip^i(1 - p)^{8 - i}$。

所以泰里思可以分到的钱为$\frac{10p_T}{p_T + p_W} = \frac{10p_T}{1 - p^5(1 - p)^3}$

39.

设这天是好天气的概率为$p_w$,若当天每个学生的出勤概率为$t$,
则当天出勤人数不少于k的概率$P_k(t) = \sum_{i = k}^nC_n^it^i(1 - t)^{n - i}$,
那么教授可以讲课的概率为$p_wP_k(p_g) + (1 - p_w)P_k(p_b)$。

40.

当$n = 0$时,$p_n = 1$。

当$n > 0$时,$p_n = p(1 - p_{n - 1}) + p_{n - 1}(1 - p)$。

所以$p_n = p_{n - 1}(1 - 2p) + p$。令$p_n’ = p_n - \frac{1}{2}$,则$p_n’ = (1 - 2p)p_{n - 1}‘$,
由等比数列通项公式:$p_n’ = \frac{(1 - 2p)^n}{2}$,所以$p_n = \frac{1 + (1 - 2p)^n}{2}$。

41.

假设第一个人转出来的数字为$p$,则在某一回合内,这个人被淘汰的概率为$p$。
所以第一个人在第n个回合被淘汰的概率等于前n-1回合没被淘汰的概率乘上这个回合被淘汰的概率,
即$P(N = n) = (1 - p)^{n - 1}p$。

42.

略。这个问题在第七章马尔可夫链中还会再遇到。

43.

略。

44.

(a)

略。

(b)

由(a)可知:若A和B独立,则$A$和$B^c$独立,
即$P(A \cap B^c) = P(A)P(B^c)$。

对于事件$B^c$,由全概率公式:
$P(B^c) = P(A \cap B^c) + P(A^c \cap B^c) = P(A)P(B^c) + P(A^c \cap B^c)$,
所以$P(A^c \cap B^c) = (1 - P(A))P(B^c) = P(A^c)P(B^c)$,所以$A^c$和$B^c$独立。

证毕。

45.

略。

46.

略。

47.

略。

48.

略。

49.

第一次投掷:


点数 1 2 3 4 5 6
概率 $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$ $\frac{1}{6}$


第二次投掷:


点数和 2 3 4 5 6 7 8 9 10 11 12
概率 $\frac{1}{36}$ $\frac{2}{36}$ $\frac{3}{36}$ $\frac{4}{36}$ $\frac{5}{36}$ $\frac{6}{36}$ $\frac{5}{36}$ $\frac{4}{36}$ $\frac{3}{36}$ $\frac{2}{36}$ $\frac{1}{36}$


第三次投掷:


点数和 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
概率 $\frac{1}{216}$ $\frac{3}{216}$ $\frac{6}{216}$ $\frac{10}{216}$ $\frac{15}{216}$ $\frac{21}{36}$ $\frac{25}{216}$ $\frac{27}{216}$ $\frac{27}{216}$ $\frac{25}{216}$ $\frac{21}{216}$ $\frac{15}{216}$ $\frac{10}{216}$ $\frac{6}{216}$ $\frac{3}{216}$ $\frac{1}{216}$


从上表来看和为11的概率要大于和为12。

50.

如果$n > 365$,那么根据鸽巢原理,一定有两个人的生日在同一天,所以这个概率是0。

如果$1 < n \leq 365$,那么没有任何两个人在同一天生日的概率为$\frac{C_{365}^n}{365^n}$(每个人选其中的某一天作为自己的生日,可选的所有可能是$365^n$种)。

51.

(a)

样本空间:抽走两个红球(设为事件A),抽走两个白球(设为事件B),抽走一个红球和一个白球(设为事件C)。

基于离散均匀分布律的计数方法,我们有:
$$P(A) = \frac{C_m^2}{C_{m + n}^2}, P(B) = \frac{C_n^2}{C_{m + n}^2},
P© = \frac{C_m^1C_n^1}{C_{m + n}^2}$$

设第一次抽到红球为事件D,第一次抽到白球为事件E,基于乘积规则,我们也可以得到:
$$P(D) = \frac{m}{m + n}, P(E) = \frac{n}{m + n}$$

那么:
$$P(A) = \frac{m - 1}{m + n - 1}P(D) = \frac{C_m^2}{C_{m + n}^2}$$
$$P(B) = \frac{n - 1}{m + n - 1}P(E) = \frac{C_n^2}{C_{m + n}^2}$$
$$P© = \frac{m}{m + n - 1}P(E) + \frac{n}{m + n - 1}P(D) = \frac{C_m^1C_n^1}{C_{m + n}^2}$$

(b)
  • 出现1的时候,全是红球的概率为$\frac{C_m^1}{C_{m + n}^1}$

  • 出现2的时候,全是红球的概率为$\frac{C_m^2}{C_{m + n}^2}$

  • 出现3的时候,全是红球的概率为$\frac{C_m^3}{C_{m + n}^3}$

由全概率公式,取出的球全是红色的概率为$\frac{1}{3}(\frac{C_m^1}{C_{m + n}^1} + \frac{C_m^2}{C_{m + n}^2} + \frac{C_m^3}{C_{m + n}^3})$。

52.

第13张牌正好是老K,意味着前12张牌均不能是老K,故概率为$\frac{C_{48}^{12}}{C_{52}^{12}}\frac{C_4^1}{C_{40}^{1}}$。

53.

我们把90个学生排成一排,前30个学生在一个班,中间30个学生在一个班,最后30个学生在一个班。这样所有的可能有$90!$种。
对于乔和简,他们两个人可以先确定在三个班中的某一个,然后在这个班的30个位置中任意占据两个,其他人再随机排列。
这样满足条件的排列数是$C_3^1C_{30}^298!$。所以分到一个班的概率为$\frac{C_3^1C_{30}^298!}{90!}$。

54.

(a)

$\frac{20!}{10!10!} = 184756‬$

(b)

不难发现只有两种排列方式满足要求(“美国车,外国车,美国车,…,外国车"和"外国车,美国车,外国车,…,美国车”)。
所以这个概率为$\frac{2}{184756}$。

55.

总共可以摆放的方案一共是$C_{64}^8$种。考虑合法的情况,每一个车一定单独占据一行,第一行的车有8种选择,第二行的车只有7种选择…
所以合法的概率为$\frac{8!}{C_{64}^8}$。

56.

(a)

$C_8^4C_{10}^3 = 1680$

(b)
  • 假定所选的所有高水平课程均在$H_1, \dots, H_5$中,那么所有的可能有$C_7^3C_5^3 = 350$种;

  • 假定所选的所有高水平课程均在$H_6, \dots, H_10$中,那么所有的可能有$C_6^2C_5^3 = 150$种;

  • 假设二者均有涉及,那么三门先修课程均需要开设,所有的可能有$C_5^1\sum_{i = 1}^2C_5^iC_5^{3 - i} = 500$种

所以一共有1000种。

57.

将问题换一个方式陈述:将一个26个不同字母随机排列组成的字符串划分为6个部分,有多少种划分方式?

26个字母的总排列数是$26!$,将长度为26的字符串划分为6个部分,只需要在其中的25个间隔处插入空格即可,且不能有连续的空格。
所以最后的结果为$26!C_{25}^5$。

58.

接下来的问题中我们假设一共有52张牌。

(a)

$\frac{C_4^3C_{48}^4}{C_{52}^7}$

(b)

$\frac{C_4^2C_{48}^5}{C_{52}^7}$

©

$\frac{C_4^3C_{48}^4}{C_{52}^7} + \frac{C_4^2C_{48}^5}{C_{52}^7} - \frac{C_4^2C_4^3C_{44}^2}{C_{52}^7}$

59.

$\frac{C_k^nC_{100 - k}^{m - n}}{C_{100}^m}$

柠檬法案:柠檬法(Lemon
Laws)是一种美国的消费者保护法,主要是在保障汽车买主的权益。柠檬法的名称起源于美国经济学家乔治·阿克罗夫(George
A.
Akerlof)所发表的一篇经济学论文,因为这缘故,对于出厂后有瑕疵问题的汽车,通常也会称呼其为柠檬车(Lemon
Car)或直接就称为柠檬。

60.

我们可以使用类似于53题的思路,得到$\frac{13^4 \times \frac{48!}{(4!)^{12}}}{\frac{52!}{(4!)^{13}}} \approx 0.105$

61.

略。

62.

略。

第二章 离散随机变量

1.


得分 0 1 2 3 4
概率 0.18 0.27 0.34 0.14 0.07


2.

假设有k个人与你的生日相同,由二项分布:
$$P_X(k) = C_{500}^kp^k(1 - p)^{500 - k}$$
其中$p = \frac{1}{365}$,则有人生日与你相同的概率为$1 - P_X(0) = 1 - (1 - \frac{1}{365})^{500} \approx 0.75$。

若使用泊松分布逼近,$\lambda = np = \frac{500}{365}$,
那么$1 - P_X(0) = 1 - e^{-\lambda}\frac{\lambda^0}{0!} \approx 0.75$。

3.

(a)

设k为比赛连续平局的局数,则$P(k) = 0.3^k$,那么赢得比赛的概率为$0.4\sum_{i = 0}^9P(i) = 0.5714251972‬$。

(b)

下棋的前9局数满足几何分布,所以$P_X(k) = (1 - p)^{k - 1}p = 0.3^{k - 1}0.7$,
第10局后比赛一定结束, 所以分布列为:


局数 1 2 3 4 5
概率 0.7 0.21 0.063 0.0189‬ 0.00567‬



局数 6 7 8 9 10
概率 0.001701‬ 0.0005103‬ 0.00015309‬ 0.000045927‬ 0.000019683‬


4.

(a)

在使用者的数量小于等于50的时候,调制解调器的数量分布满足二项分布;
使用者数量大于50的时候,由于调制解调器数量不足,故一定是50个。

所以分布列为:


人数 $k \leq 50$ $k > 50$
概率 $C_{1000}^k0.01^k0.99^{1000 - k}$ $1 - \sum_{i = 0}^{50}C_{1000}^i0.01^i0.99^{1000 - i}$


(b)

设使用者人数为k,由泊松分布有$P_X(k) = e^{-\lambda}\frac{\lambda^k}{k!} = e^{-10}\frac{10^k}{k!}$

©

利用精确分布,$P = 1 - \sum_{i = 0}^{50}C_{1000}^i0.01^i0.99^{1000 - i}$,而利用泊松分布,$P = 1 - \sum_{i = 0}^{50}e^{-10}\frac{10^i}{i!}$

5.

(a)

第一时段结束时:


信息包数量k $k < b$ $k = b$
概率 $e^{-\lambda}\frac{\lambda^k}{k!}$ $1 - \sum_{i = 0}^{b - 1}e^{-\lambda}\frac{\lambda^i}{i!}$


第二时段结束时:


信息包数量k $k = 0$ $k > 0$
概率 $\sum_{i = 0}^c e^{-\lambda}\frac{\lambda^i}{i!}$ $\sum_{i = c + 1}^{b - 1} e^{-\lambda}\frac{\lambda^i}{i!} + 1 - \sum_{i = 0}^{b - 1}e^{-\lambda}\frac{\lambda^i}{i!}$


(b)

如果到达的信息包的数量不超过b,是不会发生丢包的,
所以丢包的概率为$1 - \sum_{i = 0}^{b}e^{-\lambda}\frac{\lambda^i}{i!}$。

6.

(a)

对于$n = 5$,凯尔特人队获胜的概率为$p^3 + C_3^1p^3(1 - p) + C_4^2p^3(1 - p)^2 = 10p^3 - 15p^4 + 6p^5$;

对于$n = 3$,凯尔特人队获胜的概率为$p^2 + C_2^1p^2(1 - p) = 3p^2 - 2p^3$

所以当$10p^3 - 15p^4 + 6p^5 > 3p^2 - 2p^3$,时,$n = 5$比$n = 3$合算。
将所有式子移到左侧,消去$p^2(p > 0)$并求导得到$18p^2 - 30p + 12$,不难发现当$p = \frac{1}{2}$或$p = 1$时,原式为0,
且该函数在$[0.5, 1]$上先增后减,所以当$p \in (0.5, 1)$时$n = 5$比$n = 3$合算。

(b)

不难得到$P_N(n = 2k + 1) = p^{k + 1} + C_{k + 1}^1P^{k+1}(1 - p) + \dots + C_{2k}^kp^{k + 1}(1 - p)^k$,
并且对于不同的k,$P_N(0) = 0, P_N(1) = 1, P_N(\frac{1}{2}) = \frac{1}{2}$恒成立(0和1十分显然,对于0.5的证明我们额外放在©部分讲解)。

不妨做差$P_N(2k + 3) - P_N(2k + 1)$并对这个式子求导,不难验证导数在$\frac{1}{2}$处大于0。
由罗尔定理导函数在$[0.5, 1]$之间一定存在值为0的点,且仅有一个(这是一个$2k + 1$重多项式,其中0为k重根,1为k重根,$\frac{1}{2}$为1重根)。
所以导函数在区间上先增后减,原来的差值函数保证大于0,故$p \in (0.5, 1)$。

©

原题不存在,这部分是(b)中$P_N(n)$在$p = \frac{1}{2}$为常数的证明。

因为$P_N(n = 2k + 1) = p^{k + 1} + C_{k + 1}^1p^{k+1}(1 - p) + \dots + C_{2k}^kp^{k + 1}(1 - p)^k$,
将$\frac{1}{2}$带入后$P_N(2k + 1) = (\frac{1}{2})^{k + 1} + C_k^1(\frac{1}{2})^{k + 2} + \dots + C_{2k}^k(\frac{1}{2})^{2k + 1}$。

当$k = 0$时,原式显然成立。假定$k = m$时原式也成立,则$k = m + 1$时,
我们不妨计算$2^{k+2}P_N(2m + 3), 2^{k + 1}P_N(2m + 1)$,将两个式子逐项做差,得到$2^{k + 1}P_N(2m + 1)$,
则$2^{k+2}P_N(2m + 3) = 2^{k + 2}P_N(2m + 1)$,故原式也为$\frac{1}{2}$,归纳完毕。

证毕。

7.

(a)
(1)

由于失败后会做记号,所以尝试的次数最多只有四次(第四次即便失败,剩下的钥匙也没必要再试一次了)。

分布列:


尝试次数 1 2 3 4
概率 $\frac{1}{5}$ $\frac{1}{5}$ $\frac{1}{5}$ $\frac{2}{5}$


(2)

随机尝试的情况下,尝试次数满足几何分布,所以分布律为:$P(k) = (\frac{4}{5})^{k - 1}(\frac{1}{5})^k$。

(b)
(1)

尝试次数 1 2 3 4 5 6 7 8
概率 $\frac{1}{5}$ $\frac{8}{45}$ $\frac{7}{45}$ $\frac{2}{15}$ $\frac{1}{9}$ $\frac{4}{45}$ $\frac{1}{15}$ $\frac{1}{15}$


(2)

$P(k) = (\frac{4}{5})^{k - 1}(\frac{1}{5})^k$

8.

二项随机变量满足$P_X(k) = C_n^kp^k(1 - p)^{n - k}$。

所以 $$P_X(k + 1) = C_n^{k + 1}p^{k + 1}(1 - p)^{n - k - 1} =$$
$$\frac{n!}{(k + 1)!(n - k -1)!}p^{k + 1}(1 - p)^{n - k - 1} =$$
$$\frac{n - k}{k + 1}\frac{n!}{k!(n - k)!}\frac{p}{1 - p}p^k(1 - p)^{n - k} = \frac{p}{1 - p}\frac{n - k}{k + 1}P_X(k)$$

证毕。

9.

由第8题,我们可以得到:
$P_X(k + 1) - P_X(k) = (\frac{p}{1 - p}\frac{n - k}{k + 1} - 1)P_X(k)$。

由于$P_X(k) \geq 0$,我们不妨令$f(k) = \frac{p}{1 - p}\frac{n - k}{k + 1} - 1$,
则$f’(k) = \frac{-p(n + 1)}{(1 - p)(k + 1)^2}$。

不难发现导函数恒为负,且当$k = p(n + 1) - 1$时,原函数为0。所以当$k <= (n + 1)p$时,$P_X(k)$是非降的,而在$k > (n + 1)p$时是单调递减的。

证毕。

10.

因为泊松分布$P_X(k) = e^{-\lambda}\frac{\lambda^k}{k!}$,
所以$P_X’(k) = \frac{\lambda^ke^{-\lambda}}{(k!)^2}(ln\lambda\Gamma(k + 1) - \Gamma’(k + 1))$。

由于括号外的部分恒正,我们解括号内的部分等于0,即$\frac{\Gamma’(k + 1)}{\Gamma(k + 1)} = \Psi(k + 1) = ln\lambda$。

解得近似解为$k = \lambda$。由于$\Psi(x)$是单调递增的,故导函数在$[0, \lambda]$上大于0,在$(\lambda, \infty)$上小于0。

也可以简单地通过$\frac{P_X(k + 1)}{P_X(k)} = \frac{\lambda}{k + 1}$看出单调性。

证毕。

11.

略。

12.

略。

13.


数量 2 3 4 5 6 7
概率 $\frac{1}{32}$ $\frac{5}{32}$ $\frac{10}{32}$ $\frac{10}{32}$ $\frac{5}{32}$ $\frac{1}{32}$


14.

(a)

Y 0 1 2
P $\frac{2}{5}$ $\frac{3}{10}$ $\frac{3}{10}$


(b)

Y 0 1 2 5
P $\frac{1}{5}$ $\frac{1}{5}$ $\frac{1}{10}$ $\frac{1}{2}$


15.

因为$Y = ln(X), X = a^{|k|}$, 所以$Y = |K|lna$。
又因为$K$是$[-n, n]$上的均匀分布,
所以$P_Y(y = |k|lna) = {\begin{array}{lcr}
\frac{2}{2n + 1} & & k \ne 0\
\frac{1}{2n + 1} & & k = 0
\end{array}$

16.

(a)

由归一性可知$2(P_X(3) + P_X(2) +P_X(1)) + P_X(0) = 1$,
解之得$a = \frac{1}{28}$。

由于$P_X$及其定义域关于$x = 0$对称,所以$E[x] = 0$。

(b)

因为$E[x] = 0$,所以$Z = X^2$, 故$P_Z(z) = {\begin{array}{lcr}
\frac{2z}{28} & & z = 0, 1, 4, 9 \
0 & & otherwise
\end{array}$

©

由(b)得,$var(X) = E[Z] = \frac{2}{28} + \frac{32}{28} + \frac{162}{28} = 7$。

(d)

$var(X) = \sum_{x}(x - E[X])^2p_X(x) = 2(\frac{1}{28} + \frac{16}{28} + \frac{81}{28}) = 7$

17.

因为$F = 1.8C + 32$,所以$E[F] = 1.8E[C] + 32 = 40$,$var(F) = 1.8^2var© = 324$,所以$\sigma_F = 18$。

18.

$E[X] = \int_a^b\frac{2^x}{b - a}dx = \frac{2^b - 2^a}{(b - a)ln2}$

$var(X) = \int_a^b(2^x - E[X])^2 = \frac{2^{2b} - 2^{2a}}{2ln2} - \frac{b - a}{ln2} + (2^b - 2^a)^2(b - a)$

19.

略。

20.

设需要购买的数量为随机变量X,则X满足几何分布。所以$P_X(x) = (1 - p)^{x - 1}p$,
故期望$E[X] = \sum_{x = 1}^{\infty}x(1 - p)^{x - 1}p$,计算$E[x] - (1 - p)E[x]$后求得期望为$\frac{1}{p}$。

首先计算$E[X^2]$,然后使用$var(X) = E[X^2] - E[X]^2$计算方差。
因为$\E[X^2] = \sum_{x = 1}^{\infty}x^2(1 - p)^{x - 1}p$,
不难发现可以利用积分得到类似$E[X]$的形式。最后求得$E[X^2] = \frac{2 - p}{p^2}$,
故$var(X) = \frac{1 - p}{p^2}$。

几何分布的期望也可以通过第6节的全期望定理完成。

21.

由题意得,这是一个几何分布,所以$P_N(n) = (\frac{1}{2})^n$。
于是我们可以求得期望$E[X] = \sum_{x = 1}^{\infty}(\frac{1}{2})^x2^x = \infty$。

这个级数并不收敛,所以理论上你可以得到无穷多的钱,但是事实上这并不可能发生。

22.

(a)

$$P_X(x) = (1 - p - q + 2pq)^{x - 1}(p + q - 2pq)$$
$$E[X] = \frac{1}{p + q -2pq}$$
$$var(X) = \frac{1 - p - q + 2pq}{(p + q - 2pq)^2}$$

(b)

由条件概率得: $\frac{p(1 - q)}{p + q - 2pq}$

23.

(a)

抛掷k次,前$k - 1$次必定是正反交替,最后一次和倒数第二次相同。抛掷k次结束可以有两种情况(最后一次为正面和最后一次为反面),
所以分布列为$P_X(k) = (\frac{1}{2})^{k - 1}$。

期望值$E[X] = \sum_{x = 2}^{\infty}x(\frac{1}{2})^{x - 1}$,利用积分可得$E[X] = 3$。

同理方差$var(X) = E[X^2] - E[X]^2 = 12 - 9 = 3$。

这个问题在条件一节的习题33中有对任意p值下期望值公式的推广。

(b)

抛掷k次,一定先出现若干次(可以为0)反面朝上,接下来若干次正面朝上I(至少有一次),最后一次反面朝上。
所以分布列为$P_X(k) = (k - 1)(\frac{1}{2})^k$。

期望值$E[X] = \sum_{x = 2}^{\infty}x(x - 1)(\frac{1}{2})^x = 4$。

方差$var(X) = E[X^2] - E[X]^2 = 80 - 16 = 64$

24.

(a)

由题意得:X,Y是$-2 \leq x \leq 4, x - 1 \leq y \leq x + 1$上的均匀分布,所以:


Y/X -2 -1 0 1 2 3 4
-3 $\frac{1}{21}$ 0 0 0 0 0 0
-2 $\frac{1}{21}$ $\frac{1}{21}$ 0 0 0 0 0
-1 $\frac{1}{21}$ $\frac{1}{21}$ $\frac{1}{21}$ 0 0 0 0
0 0 $\frac{1}{21}$ $\frac{1}{21}$ $\frac{1}{21}$ 0 0 0
1 0 0 $\frac{1}{21}$ $\frac{1}{21}$ $\frac{1}{21}$ 0 0
2 0 0 0 $\frac{1}{21}$ $\frac{1}{21}$ $\frac{1}{21}$ 0
3 0 0 0 0 $\frac{1}{21}$ $\frac{1}{21}$ $\frac{1}{21}$
4 0 0 0 0 0 $\frac{1}{21}$ $\frac{1}{21}$
5 0 0 0 0 0 0 $\frac{1}{21}$


所以边缘分布列$$P_X(x) = \left{\begin{array}{lcr}
\frac{1}{7} & & -2 \leq x \leq 4 \
0 & & otherwise
\end{array}\right.$$

$$P_Y(y) = \left{\begin{array}{lcr}
\frac{1}{21} & & y = -3/y = 5\
\frac{2}{21} & & y = -2/y = 4\
\frac{1}{7} & & -1 \leq y \leq 3\
0 & & otherwise
\end{array}\right.$$

期望$E[X] = 1, E[Y] = 1$。

(b)

$$E[100X + 200Y] = \sum_{(x, y)}(100x + 200y)P_{X, Y}(x, y) = \frac{8200}{21} \approx 390$$

25.

(a)

因为答案被选中的可能性相等,故$P_{I, J}$满足均匀分布,所以
$$P_{I, J}(i, j) = \left{
\begin{array}{lcr}
\frac{1}{\sum_{k = 1}^{n}m_k} & & 0 < j \leq m_i\
0 & & otherwise
\end{array}
\right.$$

不难得到边缘分布列$P_I(i) = \frac{m_i}{\sum_{k = 1}^{n}m_k}, P_J(j) = \frac{\sum_{k = 1}^{n}[j \leq m_k]}{\sum_{k = 1}^{n}m_k}$。

(b)

对于第i个学生,可以将其回答情况视为$m_i$个独立的题目的得分期望的和,所以总分的期望值为$\sum_{k = 0}^{m_i}ap_{i, k} + b(1 - p_{i, k})$。

26.

(a)

因为最低分不小于x的分布列$P(X_1 \geq x, X_2 \geq x, X_3 \geq x) = \Pi_{i = 1}^3\frac{111 - x}{10}$

所以$P_X(x) = (\frac{111 - x}{10})^3 - (\frac{110 - x}{10})^3$

(b)

三天的平均得分为$\frac{x_1 + x_2 + x_3}{3}$,而X的期望$E[X] = \sum_{i = 101}^{110}x((\frac{111 - x}{10})^3 - (\frac{110 - x}{10})^3)$。

平均分的期望值为$105.5$,而X的期望为$103.025$。

27.

略。

28.

换一种方式陈述书上的答案,使得答案更加容易理解。

我们如果按照原来的顺序答题,奖金的期望$E[L] = p_1v_1 + p_1p_2v_2 + \dots + p_1p_2\dots p_nv_n$。

假定我们尝试着交换相邻两道题的顺序(交换任意两道题的顺序可以通过若干次相邻交换实现),
则交换后的期望值变为$E[L’] = p_1v_1 + \dots + p_1p_2\dots p_{k + 1}v_{k + 1} + p_1p_2\dots p_kp_{k + 1}v_k + \dots + p_1p_2\dots p_nv_n$。
将两个式子做差,可以得到$p_1p_2\dots p_{k - 1}(p_kv_k + p_kp_{k + 1}v_{k + 1} - p_{k + 1}v_{k + 1} - p_kp_{k + 1}v_k)$。括号外的式子一定为正,
我们只看括号内:$p_kv_k(1 - p_{k + 1}) + p_{k + 1}v_{k + 1}(p_k - 1)$,提出一个$(1 - p_{k + 1})(1 - p_{k})$,得到
$\frac{p_kv_k}{1 - p_k} - \frac{p_{k + 1}v_{k + 1}}{1 - p_{k + 1}}$。所以先选$\frac{p_iv_i}{1 - p_i}$是明智的。

证毕。

29.

略。

30.

略。

31.

因为$P_{X, Y}(x, y) = P_Y(y)P_{X|Y}(x|y)$,所以 $P_{X,Y}(x, y) =\
C_4^y(\frac{1}{6})^y(\frac{1}{6})^{4 - y}C_{4 - y}^x(\frac{1}{6})^x(\frac{5}{6})^{4 - y - x}$。

如果不满足$0 \leq x,y \leq 4$且$0 \leq x + y \leq 4$,则$P_{X, Y}(x, y) = 0$。

32.

$$E[S|A = a] = \sum_{s}sP_{S|A = a}(s) = \sum_{s}\frac{sC_{m}^sC_{m - s}^{a - 2s}}{C_{2m}^a}$$

33.

略。

34.

35.

略。

36.

略。

37.

略。

38.

设每个路口遇到红灯的概率为p。

(a)

$$P_X(x) = C_4^xp^x(1 - p)^{4 - x}$$ $$E[X] = 4p$$
$$var(X) = \sum_{i = 0}^4var(X_i) = 4p(1 - p)$$

(b)

$$var(2X) = 16p(1 - p)$$

39.

由独立性,有: $$E[X] = \sum_{i = 1}^{10}E[X_i] = 35$$
$$var(X) = \sum_{i = 1}^{10}var(X_i) = \frac{175}{6}$$

40.

由于论文之间的成绩完全独立,我们不妨在论文与论文之间插入隔板,以此区分不同成绩的两批论文。
如果上交了k篇论文,每种评分的论文至少有一篇的概率就为$P(k) = \frac{5!C_{k - 1}^5}{(k + 1)^5}$
(一共需要安插5个隔板,分为6个不同评分的区间,所有的可能安插的位置一共是$k + 1$个,而合法的安插位置只能在中间的$k - 1$个中选择,且不能重复,隔板自身的顺序有$5!$种)。

其中$P(24) \approx 0.5$,$\lim_{k \to \infty} = 1$。

41.

(a)

不难得到$P(x) = C_{250}^x0.02^x0.98^{250 - x}$,所以$E[X] = 50$。

所以罚单数刚好等于50的概率为$P(50)$。

(b)

利用泊松分布近似(a)中的结果:$P(50) \approx e^{-50}\frac{(50)^{50}}{50!} \approx 0.056$。

©

$$E[0.5 \times 10X + 0.3 \times 20X + 0.2 \times 50X] = 1050$$
$$var(0.5 \times 10X + 0.3 \times 20X + 0.2 \times 50X) = 2160.9$$

(d)

因为$\sigma(X) \approx 2.21$,所以$p \in [0, 0.064]$。

42.

(a)

因为$P_{X_i} = S$,所以$E[X_i] = S$,故$E[S_n] = \frac{nS}{n} = S$。

对于单个点的方差$var(X_i) = S(1 - S)$是有限值,
所以由独立性$\\lim_{n \to \infty}var(S_n) = \frac{nS(1 - S)}{n^2} = 0$。

证毕。

(b)

$$S_n = \frac{(n - 1)S_{n - 1} + X_n}{n}$$

©

由于单位正方形的内切圆的半径为$\frac{1}{2}$,所以
$$\pi = 4E[S_n] = \frac{4}{n}\sum_{i = 1}^{10000}P_{X_i}$$
只要计算落在圆形内部的点的数量即可确定$\pi$的值。

(d)

类似于©。

43.

略。

44.

略。

45.

略。

46.

略。

第三章 一般随机变量

1.

因为X是$[0, 1]$上的均匀分布,所以$p_X(x) = 1, x \in [0, 1]$。
所以Y的分布列为 $$P_Y(y) = \left{
\begin{array}{lcr}
\int_{0}^{\frac{1}{3}}p_X(x)dx = \frac{1}{3} & & y = 1\
\int_{\frac{1}{3}}^{1}p_X(x)dx = \frac{2}{3} & & y = 2\
0 & & otherwise
\end{array}
\right.$$

所以$E[Y] = \frac{5}{3}$,根据期望规则,
$E[Y] = \int_{0}^{\frac{1}{3}}dx + \int_{\frac{1}{3}}^{1}2dx = \frac{5}{3}$,
可以验证我们的结果是正确的。

2.

$\int_{-\infty}^{\infty}\frac{\lambda}{2}e^{-\lambda |x|} = \int_{0}^{\infty}\lambda e^{-\lambda x}$,
可见积分值与指数分布相同,归一化得证。

所以拉普拉斯随机变量的期望$E[X] = \int_{-\infty}^{\infty}\frac{x\lambda}{2}e^{-\lambda |x|} = 0$,
则$var(X) = E[X^2] = \int_{-\infty}^{\infty}\frac{x^2\lambda}{2}e^{-\lambda |x|}dx = \frac{2}{\lambda^2}$。

拉普拉斯分布的更普遍形式为$p_X(x) = \frac{1}{2\lambda}e^{-\frac{|x - \mu|}{\lambda}}$,
这个形式下的$\E[X] = \mu, var(X) = 2\lambda^2$。

3.

略。

4.

略。

5.

不妨设三角形的高为H,对应的底边长度为L,
则分布函数$P_X(x)$可以用梯形的面积除以三角形面积得到:
$P_X(x) = \frac{\frac{H - x}{H}L + L}{2}\frac{2}{HL} = \frac{x(2H - x)}{H^2}, x \in [0, H]$。

所以概率密度函数$f_X(x) = P_X’(x) = \frac{2(H - x)}{H^2}$。

6.

有0个顾客的时候,等候的时间为0;有一个顾客的时候,等候时间是一个指数随机变量。
所以: $$P_X(x) = \left{
\begin{array}{lcr}
0 & & x < 0\
\frac{1}{2} & & x = 0\
\frac{1}{2}(1 + \int_{0}^{x}\lambda e^{-\lambda t}dt) & & x > 0
\end{array}
\right.$$

解之得: $$P_X(x) = \left{
\begin{array}{lcr}
0 & & x < 0\
\frac{1}{2} & & x = 0\
\frac{1}{2}(2 - e^{-\lambda x}) & & x > 0
\end{array}
\right.$$

7.

(a)

X的分布函数为两个圆形面积的比值,所以$P_X(x) = \frac{x^2}{r^2}, x \in [0, r]$。
求导后可以得到概率密度函数$f_X(x) = \frac{2x}{r^2}$。所以$E[X] = \int_{0}^{r}\frac{2x^2}{r^2}dx = \frac{2r}{3}$,
$var(X) = E[X^2] - E[X]^2 = \frac{r^2}{18}$。

(b)

由上一问可知: $$P_S(s) = \left{
\begin{array}{lcr}
0 & & s < 0\
\frac{r^2 - t^2}{r^2} & & s = 0\
\frac{r^2 - t^2}{r^2} & & 0 < s < \frac{1}{t}\
\frac{r^2 - t^2}{r^2} + \frac{t^2 - (\frac{1}{s})^2}{r^2} & & s \geq \frac{1}{t}
\end{array}
\right.$$

是连续随机变量。

8.

(a)

X的分布函数为$P_X(X \leq x)$,由全概率公式,可以得到$P_X(X \leq x) = pP_Y(Y \leq x) + (1 - p)P_Z(Z \leq x)$。
对式子两侧分别求导可得$f_X(x) = pf_Y(x) + (1 - p)f_Z(x)$。

证毕。

(b)

$$P_X(x) = \left{
\begin{array}{lcr}
pe^{\lambda x} & & x < 0\
1 + (p - 1)e^{-\lambda x} & & x \geq 0
\end{array}
\right.$$

9.

略。

10.

略。

11.

(a)

因为$\sigma_X = 1, \mu_X = 0$,所以X服从标准正态分布。
所以我们根据标准正态分布表,可以得到: $P(X \leq 1.5) \approx 0.9332,\
P(X leq -1) = 1 - \Phi(1) \approx 0.1587$。

(b)

因为$\sigma_Y = 2, \mu_Y = 1$,而$Z = \frac{Y - 1}{2}$,所以
$\sigma_Z = 1, \mu_Z = 0$,所以
$f_Z(z) = \frac{1}{\sqrt{2\pi}}e^{\frac{-x^2}{2}}$。

©

由(b)可知:$P(-1 \leq Y \leq 1) = P(-1 \leq Z \leq 0) =\ 0.5 - P(Z \leq -1) \approx 0.3413$。

12.

$P(X \geq k\sigma) = 1 - P(X \leq k\sigma)$,令$Y = \frac{X}{\sigma}$,
则$P(X \geq k\sigma) = 1 - P(Y \leq k)$,于是:$P(X \geq \sigma) \approx 0.1587,
P(X \geq 2\sigma) \approx 0.0228, P(X \geq 3\sigma) \approx 0.0013$。

由于$\mu = 0$,所以$P(|X| \leq k\sigma) = 1 - 2P(X \geq k\sigma)$,
所以$P(X \geq \sigma) \approx 0.6826,
P(X \geq 2\sigma) \approx 0.9544, P(X \geq 3\sigma) \approx 0.9974$。

13.

因为$C = \frac{F - 32}{1.8}$,所以$P(F \leq 59) = P(C \leq 15)$,
其中C满足正态分布,$\mu_C = 10, \sigma_C = 10$。

再令$X = \frac{C - \mu_C}{\sigma_C}$,则$P(F \leq 59) = P(X \leq 0.5) \approx 0.6915$。

14.

略。

15.

(i)

$$f_{X,Y}(x, y) = \left{
\begin{array}{lcr}
\frac{2}{\pi r} & & x^2 + y^2 \leq r, y > 0\
0 & & otherwise
\end{array}
\right.$$

(ii)

由(i)得:$f_Y(y) = \int_{-\sqrt{r - y^2}}^{\sqrt{r - y^2}}\frac{2}{\pi r}dx = \frac{4}{\pi r}\sqrt{r - y^2}$,
所以$E[Y] =\ \int_{0}^{\sqrt{r}}\frac{4y}{\pi r}\sqrt{r - y^2}dy = \frac{4\sqrt{2}}{3 \pi}$。

(iii)

利用期望规则直接积分:
$E[Y] = \int_{0}^{\sqrt{r}}ydy\int_{-\sqrt{r - y^2}}^{\sqrt{r - y^2}}\frac{2}{\pi r}dx = \frac{4\sqrt{2}}{3 \pi}$。

16.

不妨设针的中点到最近的水平线的距离为X,到最近的垂直线的距离为Y,针与水平线的夹角为$\Theta$,
根据布丰抛针问题,我们可以得到: $$f_{X, Y, \Theta} = \left{
\begin{array}{lcr}
\frac{8}{ab\pi} & & x \in [0, \frac{b}{2}], y \in [0, \frac{a}{2}], \theta \in [0, \frac{\pi}{2}]\
0 & & otherwise
\end{array}
\right.$$

所以针与水平线相交的概率为
$\P(X \leq \frac{l}{2}sin\Theta) = \frac{8}{ab\pi}\int_{0}^{\frac{a}{2}}\int_{0}^{\frac{\pi}{2}}\int_{0}^{\frac{l}{2}sin\theta}dxd\theta dy = \frac{2l}{b\pi}$。

同理,针与垂直线相交的概率为:
$\P(Y \leq \frac{l}{2}cos\Theta) = \frac{8}{ab\pi}\int_{0}^{\frac{b}{2}}\int_{0}^{\frac{\pi}{2}}\int_{0}^{\frac{l}{2}cos\theta}dyd\theta dx = \frac{2l}{a\pi}$。

所以相交边数的期望值为$\frac{2l}{b\pi}(1 - \frac{2l}{a\pi}) + \frac{2l}{a\pi}(1 - \frac{2l}{b\pi}) + 2\frac{2l}{a\pi}\frac{2l}{b\pi} = \frac{2l}{b\pi} + \frac{2l}{a\pi}$,
至少交于一条边的概率为$\frac{2l}{b\pi} + \frac{2l}{a\pi} - \frac{2l}{a\pi}\frac{2l}{b\pi}$。

17.

略。

18.

(a)

$$E[X] = \int_{1}^{3}\frac{x^2}{4}dx = \frac{13}{6}$$
$$P(A) = 1 - P(X \leq 2) = 1 - \int_{1}^{2}\frac{x}{4}dx = \frac{5}{8}$$
$$f_{X|A}(x) = \left{
\begin{array}{lcr}
\frac{2x}{5} & & 2 \leq x \leq 3\
0 & & otherwise
\end{array}
\right.$$
$$E[X|A] = \int_{2}^{3}\frac{2x^2}{5}dx = \frac{38}{15}$$

(b)

$$E[Y] = E[X^2] = \int_{1}^{3}\frac{x^3}{4}dx = 5$$
$$var(Y) = E[Y^2] - E[Y]^2 = \int_{1}^{3}\frac{x^5}{4}dx - 25 = \frac{16}{3}$$

19.

(a)

由归一性:$\int_{1}^{2}cx^{-2}dx = 1$,解得$c = 2$。

(b)

$$P(A) = 1 - P(X \leq 1.5) = 1 - \int_{1}^{1.5}\frac{2dx}{x^2} = \frac{1}{3}$$
$$f_{X|A}(x) = \left{
\begin{array}{lcr}
\frac{6}{x^2} & & 1.5 \leq x \leq 2\
0 & & otherwise
\end{array}
\right.$$

©

$$E[Y|A] = E[X^2|A] = \int_{1.5}^{2}6dx = 3$$
$$var(Y|A) = E[Y^2|A] - E[Y|A]^2 = \frac{1}{4}$$

20.

因为共同的分布为指数分布,且期望值为30,所以$f_X(x) = \frac{1}{30}e^{-\frac{x}{30}}$。
第二个学生到达时,第一个学生已经到达了5分钟,所以$P(X \geq 5) = 1 - \int_{0}^{5}f_X(x) = e^{-\frac{1}{6}}$。
所以第一个学生答疑时间的概率密度函数变为$f_{X|A}(x) = \frac{e^{\frac{1}{6}}}{30}e^{-\frac{x}{30}}$,
其期望值为$E[X|A] = \int_{5}^{\infty}\frac{e^{\frac{1}{6}}x}{30}e^{-\frac{x}{30}}dx = 35$,所以所花时间的期望值为65。

21.

(a)

$$f_{X, Y}(x, y) = \left{
\begin{array}{lcr}
\frac{1}{xl} & & y \leq x \leq l\
0 & & otherwise
\end{array}
\right.$$

(b)

$$f_{Y}(y) = \left{
\begin{array}{lcr}
\int_{y}^{l}\frac{dx}{xl} & & 0 \leq y \leq l\
0 & & otherwise
\end{array}
\right.$$

解之得: $$f_{Y}(y) = \left{
\begin{array}{lcr}
\frac{lnl - lny}{l} & & 0 \leq y \leq l\
0 & & otherwise
\end{array}
\right.$$

©

$$E[Y] = \int_{0}^{l}\frac{y(lnl - lny)}{l}dy = \frac{l}{4}$$

(d)

$E[Y] = E[X\frac{Y}{X}] = E[X]E[\frac{Y}{X}] = \frac{l}{2}\frac{1}{2} = \frac{l}{4}$。

22.

(i)

设随机选取的两个点距离左侧的距离为X和Y,不妨认为X为更靠右侧的那个点,则概率密度函数为:
$$f_{X, Y}(x, y) = \left{
\begin{array}{lcr}
\frac{1}{x} & & 0 \leq y \leq x \leq 1\
0 & & otherwise
\end{array}
\right.$$

由于三角形的两边之和大于第三边,我们可以列出满足条件的三个式子:
$$\begin{array}{lcr}
Y + X - Y & > & 1 - X\
Y + 1 - X & > & X - Y\
X - Y + 1 - X & > & Y\
\end{array}$$

整理后得到: $$\begin{array}{lccrr}
X & > & \frac{1}{2} & \rightarrow & A\
Y & < & \frac{1}{2} & \rightarrow & B\
X - Y & < & \frac{1}{2} & \rightarrow & C\
\end{array}$$

所以$P(A) = 1 - \int_{0}^{\frac{1}{2}}\int_{0}^{x}\frac{dydx}{x} = \frac{1}{2}$,
$P(B|A) = \int_{\frac{1}{2}}^{1}\int_{0}^{\frac{1}{2}}\frac{2}{x}dydx = ln2$,
$P(C|(B|A)) = \int_{\frac{1}{2}}^{1}\int_{x - \frac{1}{2}}^{\frac{1}{2}}\frac{dydx}{xln2} = 1 - \frac{1}{2ln2}$。

(ii)

本质上和(i)是一样的,仅仅只是选取方向的不同。

(iii)

设Y为第一次选取的点距离最近的一端的距离,X为第二次选区的点距离Y的距离,则概率密度函数为:
$$f_{X, Y}(x, y) = \left{
\begin{array}{lcr}
\frac{2}{1 - y} & & 0 \leq y \leq \frac{1}{2}, y \leq x \leq 1\
0 & & otherwise
\end{array}
\right.$$

同(i),我们可以列出以下的条件(注意,此时的三段杆的距离已经变成了$X, Y, 1 - X - y$):
$$\begin{array}{lccrr}
X & < & \frac{1}{2} & \rightarrow & A\
Y & < & \frac{1}{2} & \rightarrow & B\
X + Y & > & \frac{1}{2} & \rightarrow & C\
\end{array}$$

所以$P(A) = \int_{0}^{\frac{1}{2}}\int_{y}^{\frac{1}{2}}\frac{2}{1 - y}dxdy = 1 - ln2$,
$P(B|A) = 1$,$P(C|(B|A)) = 2ln\frac{4}{3} + \frac{1}{2}ln\frac{3}{2} - \frac{1}{4}$。

23.

(a)

$$f_{X, Y}(x, y) = \left{
\begin{array}{lcr}
2 & & x \geq 0, y \geq 0, x + y \leq 1\
0 & & otherwise
\end{array}
\right.$$

(b)

$$f_Y(y) = \int_{0}^{1 - y}2dx = 2(1 - y)$$

©

$$f_{X|Y = y}(x) = \frac{1}{1 - y}$$

(d)

$$E[X|Y = y] = \frac{1 - y}{2}$$
$$E[X] = \int_{0}^{1}E[X|Y = y]F_{Y}(y)dy = \int_{0}^{1}(1 - y)^2dy = \frac{1}{3}$$

(e)

利用对称性,$E[Y] = E[X] = \frac{1}{3}$。

24.

概率密度函数: $$f_{X, Y}(x, y) = \left{
\begin{array}{lcr}
1 & & x \geq 0, y \geq 0, 2x + y \leq 2\
0 & & otherwise
\end{array}
\right.$$

边缘概率密度函数: $$f_X(x) = \int_{0}^{-2x + 2}dy = -2x + 2$$
$$f_Y(y) = \int_{0}^{\frac{2 - y}{2}}dx = \frac{2 - y}{2}$$

条件期望: $$E[X|Y = y] = \frac{2 - y}{4}$$ $$E[Y|X = x] = 1 - x$$

所以由全期望定理可得:
$$E[X] = \int_{0}^{1}E[X|Y = y]f_Y(y)dy = \frac{5}{24}$$
$$E[Y] = \int_{0}^{2}E[Y|X = x]f_X(x)dx = \frac{4}{3}$$

25.

$(X, Y)$离原点的距离至少为c,故$\sqrt{X^2 + Y^2} \geq c$,
所以$P(A) =\ P(\sqrt{X^2 + Y^2} \geq c) = 1 - \int_{0}^{2\pi}\int_{0}^{c}\frac{\rho}{2\pi \sigma^2}e^{\frac{-\rho^2}{2\sigma^2}}d\rho d\theta = e^{\frac{-c^2}{2\sigma^2}}$。

于是得到条件联合概率密度函数:
$$f_{(X, Y)|A} = \frac{1}{2\pi \sigma^2}e^{\frac{-x^2 - y^2 + c^2}{2\sigma^2}}$$

26.

略。

27.

(a)

$$\int_{(x, y) \in A}f_{X,Y|C}(x, y)dxdy = \frac{1}{P©}\int_{(x, y) \in A}f_{X, Y}(x, y)dxdy = \frac{P©}{P©} = 1$$
所以$f_{X,Y|C}(x, y)$是一个合格的联合概率密度函数。

(b)

令$C = \bigcup_{i = 1}^{n}C_i$,因为$A_i$是二维平面的分割,所以$C_i$也是$C$的一个分割。
由(a)可知:$f_{X, Y}(x, y) = P©f_{X, Y|C}(x, y)$,所以由全概率公式即可得到
$f_{X, Y}(x, y) = \sum_{i = 1}^{n}P(C_i)f_{X, Y|C_i}(x, y)$。

28.

略。

29.

略。

30.

略。

31.

略。

32.

略。

33.

略。

34.

(a)

不妨设硬币正面朝上为事件A,由连续的全期望定理:$P(A) =\ \int_{0}^{1}p^2e^pdp = e - 2$

(b)

$$f_{P|A}(p) = \left{
\begin{array}{lcr}
\frac{pe^p}{e - 2} & & p \in A\
0 & & otherwise
\end{array}
\right.$$

©

由连续贝叶斯准则:
$f_{P|X}(p|x) = \frac{f_{P}(p)P(X = x|P = p)}{P(x)} = \frac{p^2e^p}{e - 2}$,
所以第二次抛掷正面朝上的条件概率为$\int_{0}^{1}\frac{p^3e^p}{e - 2}dp = \frac{6 - 2e}{e - 2}$

35.

略。

第四章 随机变量的深入内容

1.

由题意得,$f_X(x) = \frac{1}{2}$,所以
$F_Y(y) = P(Y \leq y) = P(\sqrt{|X|} \leq y) = P(|X| \leq y^2)$。

$$F_Y(y) = \left{
\begin{array}{lcr}
y^2 & & y \in [0, 1]\
0 & & otherwise
\end{array}
\right.$$

求导后即可得到: $$f_Y(y) = \left{
\begin{array}{lcr}
2y & & y \in [0, 1]\
0 & & otherwise
\end{array}
\right.$$

因为$F_Z(z) = P(Z \leq z) = P(-ln|X| \leq z) = P(|X| \geq e^{-z})$

$$F_Z(z) = \left{
\begin{array}{lcr}
1 - e^{-z} & & z \in [0, \infty]\
0 & & otherwise
\end{array}
\right.$$

所以 $$f_Z(z) = \left{
\begin{array}{lcr}
e^{-z} & & z \in [0, \infty]\
0 & & otherwise
\end{array}
\right.$$

2.

令$Y = e^X$,则$F_Y(y) = P(Y \leq y) = P(e^X \leq y) = P(X \leq lny)$,
所以$F_Y(y) = \int_{-\infty}^{lny}f_X(x)dx$,求导后$f_Y(y) = \frac{f_X(lny)}{y}$。

当X服从$[0, 1]$上的均匀分布时: $$f_Y(y) = \left{
\begin{array}{lcr}
\frac{1}{y} & & y \in [1, e]\
0 & & otherwise
\end{array}
\right.$$

3.

令$Y = |X|^{\frac{1}{3}}, Z = |X|^{\frac{1}{4}}$,则:
$F_Y(y) = P(Y \leq y) = P(|X|^{\frac{1}{3}} \leq y) = P(|X| \leq y^3) = \int_{0}^{y^3}f_{|X|}(|x|)dx$,
所以$f_Y(y) = 3y^2f_{|X|}(y^3)$,同理$f_Z(z) = 4z^3f_{|X|}(y^4)$。

4.

因为$F_Y(y) = P(Y \leq y)$,当$0 \leq y \leq 5$时,由全概率公式,
$P(Y \leq y) = \frac{1}{4}P(X \leq y) + \frac{3}{4}P(X - 5 \leq y) = \frac{1}{4}P(X \leq y) + \frac{3}{4}P(X \leq y + 5)$,
所以$P(Y \leq y) = \frac{1}{4}(\int_{0}^{y}f_{X_A}(x)dx + 3\int_{0}^{y + 5}f_{X_B}(x)dx) = \frac{y}{10} + \frac{1}{4}$,故$f_Y(y) = \frac{1}{10}$;
同理当$5 < y \leq 15$时,$P(Y \leq y) = \frac{3}{4}\int_{0}^{y + 5}f_{X_B}(x)dx = \frac{y + 5}{20}$,所以$f_Y(y) = \frac{1}{20}$。

5.

$|z| = 0.5$的情况

由于$X, Y$均服从均匀分布,两个随机变量的联合概率可以用以上的正方形区域面积表示。
考虑$|X - Y| \leq z$,这个式子可以被拆开为两个式子$X - Y \leq z$和$Y - X \leq z$,在图中做出这两个函数的图像。
不难发现$P(Z \leq z)$就是两条平行线与正方形所包围的图形的面积,即$P(Z \leq z) = 2z - z^2$,所以$f_Z(z) = 2 - 2z$。

6.

使用和第五题类似的做法:$P(Z \leq z) = P(|X - Y| \leq z) = \frac{\sqrt{2}z}{2}(\sqrt{2}z + \frac{\sqrt{2}}{2}(1 - z) * 2) = \frac{z}{2}$,
所以$f_Z(z) = \frac{1}{2}$。

7.

不难看出这题的随机变量就是第五题中的Z。所以$E[Z] = \int_{0}^{1}2z^2 - z^3dz = \frac{1}{3}$。

证毕。

8.

$$f_Z(z) = \int_{-\infty}^{\infty}f_X(x)f_Y(z - x)dx = \int_{0}^{z}\lambda^2e^{-\lambda x}e^{-\lambda (z - x)}dx = \lambda^2ze^{-\lambda z}$$

9.

当$z \leq 0$, $$\begin{array}{l}
F_Z(z) = P(X - Y \leq z) = 1 - P(X - Y > z)\
= 1 - \int_{0}^{\infty}\mu e^{-\mu y}dy\int_{z + y}^{\infty}\lambda e^{-\lambda x}dx\
= 1 - \frac{\mu}{\lambda + \mu}e^{-\lambda z}
\end{array}$$

当$z < 0$时,$-z \leq 0$,所以$F_Z(z) = 1 - F_Z(-z) = \frac{\mu}{\lambda + \mu}e^{\lambda z}$。

10.

由离散卷积公式$f_Z(z) = \sum f_X(x)f_Y(z - x)$可以求得:
$$p_Z(z) = \left{
\begin{array}{lcr}
\frac{1}{6} & & z = 1\
\frac{5}{18} & & z = 2\
\frac{1}{3} & & z = 3\
\frac{1}{6} & & z = 4\
\frac{1}{18} & & z = 5
\end{array}
\right.$$

11.

设$P_X(k) = e^{-\lambda}\frac{\lambda^k}{k!}, P_Y(k) = e^{-\mu}\frac{\mu^k}{k!}$,
由卷积公式,有$P_Z(z) =\ \sum P_X(k)P_Y(z - k)$,因为$C_z^k = \frac{z!}{k!(z - k)!}$,
所以$P_Z(z) = \frac{e^{(-\lambda + \mu)}}{z!}\sum C_z^k \lambda^k \mu^{z - k}\ = e^{-(\lambda + \mu)}\frac{(\lambda + \mu)^z}{z!}$。

证毕。

12.

先求$W = X + Y$的概率密度函数: $$f_W(w) = \left{
\begin{array}{llccr}
\int_{0}^{w}dx & = & w & & 0 \leq w \leq 1\
\int_{w - 1}^{1}dx & = & 2 - w & & 1 < w \leq 2\
0 & & & & otherwise
\end{array}
\right.$$

再求$R = W + Z$: $$f_R® = \left{
\begin{array}{llccr}
\int_{0}^{r}wdw & = & \frac{r^2}{2} & 0 \leq r \leq 1\
\int_{r - 1}^{1}wdw + \int_{1}^{r}2-wdw & = & 3r - r^2 - \frac{3}{2} & 1 < r \leq 2\
\int_{r - 1}^{2}2 - wdw & = & \frac{r^2}{2} - 3r + \frac{9}{2} & 2 < r \leq 3\
0 & & & otherwise
\end{array}
\right.$$

13.

因为概率密度函数的对称轴为$\frac{a + b}{2}$,所以有$f(x) = f(a + b - x)$,
而$X + Y$和$X - Y$的积分区间正好差着$a + b$的距离,所以只需要将$f_{X + Y}$平移即可。

14.

$$\begin{array}{l}
P_Z(z) = P(min{X, Y} \leq z)\
= 1 - P((min{X, Y} > z)\
= 1 - P(X > z)P(Y > z)\
= 1 - (1 - P(X \leq z))(1 - P(Y \leq z))\
= 1 - (1 - \int_{0}^{z}\lambda e^{-\lambda x}dx)(1 - \int_{0}^{z}\mu e^{-\mu y}dy)\
= 1 - e^{-(\lambda + \mu)z}
\end{array}$$

所以$Z = min{X, Y}$服从参数为$\lambda + \mu$的指数分布。

证毕。

15.

略。

16.

略。

17.

因为$var(X) = var(Y)$,所以 $$\begin{array}{l}
cov(X + Y, X - Y) = cov(X + Y, X) - cov(X + Y, Y)\
= cov(X, X) + cov(Y, X) - cov(X, Y) - cov(Y, Y)\
= cov(X, X) - cov(Y, Y)\
= var(X) - var(Y)\
= 0
\end{array}$$

所以$X + Y, X - Y$不相关。

证毕。

18.

由题意得:
$cov(W, X) = cov(W, Y) = cov(W, Z) = cov(X, Y) =\ cov(X, Z) = cov(Y, Z) = 0$,
所以: $$\begin{array}{l}
\rho(R, S) = \frac{cov(R, S)}{\sqrt{var®var(S)}}\
= \frac{cov(W + X, X + Y)}{\sqrt{var(W + X)var(X + Y)}}\
= \frac{cov(W, X) + cov(W, Y) + cov(X, X) + cov(X, Y)}{\sqrt{(var(W) + var(X) + 2cov(W, X))(var(X) + var(Y) + 2cov(X, Y))}}\
= \frac{var(X)}{\sqrt{(var(W) + var(X))(var(X) + var(Y)}}\
= \frac{1}{2}
\end{array}$$

同理$\rho(S, T) = \frac{1}{2}$

19.

$$\begin{array}{l}
\rho(X, Y) = \frac{cov(X, Y)}{\sqrt{var(X)var(Y)}}\
= \frac{cov(X, a + bX + cX^2)}{\sqrt{var(X)var(a + bX + cX^2)}}\
= \frac{cov(X, bX) + cov(X, cX^2)}{\sqrt{var(X)(var(a + bX) + var(cX^2) +2cov(a + bX, cX^2))}}\
= \frac{b\times var(X) + c \times cov(X, X^2)}{\sqrt{var(X)(a^2var(X) + c^2var(X^2) + 2bc \times cov(X, X^2))}}\
= \frac{b}{\sqrt{a + 2c^2}}
\end{array}$$

20.

略。

21.

略。

22.

设第i次赌博的收益比率为常量$R_i$,资产值为随机变量$X_i$,我们可以得到:

  • $E[X_1] = (pR_1 + 2(1 - p)^2)x$

  • $E[X_2] = E[E[X_2|X_1]] = (pR_2 + 2(1 - p)^2)X_1$

  • $E[X_3] = E[E[X_3|X_2]] = (pR_3 + 2(1 - p)^2)X_2$

综上:$E[X_n] = x\Pi_{i = 1}^n(pR_i + 2(1 - p)^2)$

23.

(a)

当$X \leq 1$时,纳特的等待时间为0;当$X > 1$时,等待时间的期望值为$\int_{1}^{2}\frac{x - 1}{2}dx = \frac{1}{4}$,
所以总的等待时间的期望值为15分钟。

(b)

当$X \leq 1$时,约会的时长是3小时;当$X > 1$时,约会时间的期望值为$E[Y] = E[E[Y|X]]$,
因为$E[Y|X] = \frac{3 - X}{2}$,所以$E[Y] = \frac{3}{2} - \frac{E[X]}{2} = 1$。
所以总的约会时间的期望值为2小时。

©

TODO:

24.

(a)

由重期望法则: $$\begin{array}{l}
E[X] = E[E[X|Y]] \
= E[5 - Y] \
= 5 - E[Y] \
= 3
\end{array}$$

(b)

$E[X + Y] = E[X] + E[Y] = 3 + 2 = 5$小时,所以是下午两点。

©

TODO:

25.

略。

26.

略。

27.

略。

28.

略。

29.

$$\begin{array}{l}
M(s) = \sum_{x}e^{sx}p_X(x)\
= e^s \times \frac{1}{2} + e^{2s} \times \frac{1}{4} + e^{3s} \times \frac{1}{4}\
\end{array}$$

所以:

  • $E[X] = \frac{d}{ds}M(s)|_{s = 0} = \frac{7}{4}$

  • $E[X^2] = \frac{d^2}{ds^2}M(s)|_{s = 0} = \frac{15}{4}$

  • $E[X^3] = \frac{d^3}{ds^3}M(s)|_{s = 0} = \frac{37}{4}$

30.

标准正态分布$f_X(x) = \frac{1}{\sqrt{2\pi}}e^{\frac{-x^2}{2}}$,
其矩母函数为 $$\begin{array}{l}
M(s) = \int_{-\infty}^{\infty}e^{sx}f_X(x)dx\
= \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}e^{\frac{-x^2}{2} + sx}dx\
= \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}e^{-\frac{x^2 - 2sx + s^2 - s^2}{2}}dx\
= \frac{e^{\frac{s^2}{2}}}{\sqrt{2\pi}}\int_{-\infty}^{\infty}e^{-\frac{(x - s)^2}{2}}dx\
= e^{\frac{s^2}{2}}
\end{array}$$

所以$E[X^3] = 0, E[X^4] = 3$。

31.

$M(s) = \int_{0}^{\infty}\lambda e^{-\lambda x + sx}dx = \frac{-\lambda}{s - \lambda}$,
所以$E[X^3] = \frac{6}{\lambda^4}, E[X^4] = \frac{24}{\lambda^5},\ E[X^5] = \frac{120}{\lambda^6}$

32.

(a)

第二个不是矩母函数。根据矩母函数的定义$M_X(s) = E[e^{sX}]$,$M_X(0) = E[1] = 1$,
很明显第二个函数不满足这个条件。

(b)

设N为满足$\lambda = 2$的泊松分布的随机变量,Y为满足$\lambda = 1$的泊松分布的随机变量,
所以X为N个Y之和(见4.5节),$P(X = 0) = \sum_{n = 0}^{\infty}p_N(n)p_Y(0)\ = e^{-1}$

33.

不难看出加号两侧是指数分布的矩母函数的形式,所以概率密度函数:
$$f_X(x) = \left{
\begin{array}{lcr}
\frac{1}{3} \times 2e^{-2x} + \frac{2}{3} \times 3e^{-3x} & & x \geq 0\
0 & & otherwise
\end{array}
\right.$$

34.

利用卷积计算的分布列: $$p(x) = \left{
\begin{array}{lcr}
1 - p_1 - p_2 - p_3 + p_1p_2 + p_1p_3 + p_2p_3 - p_1p_2p_3 & & x = 0\
3p_1p_2p_3 + p_1 + p_2 + p_3 - 2(p_1p_2 + p_1p_3 + p_2p_3) & & x = 1\
p_1p_2 + p_1p_3 + p_2p_3 - 3p_1p_2p_3 & & x = 2\
p_1p_2p_3 & & x = 3
\end{array}
\right.$$

对于某一个球员,其矩母函数为$M_{X_i}(s) = 1 - p_i + p_ie^s$,
又因为独立随机变量的和的矩母函数是和项的矩母函数的乘积,
所以$M_X(s) = \Pi_{i = 1}^{3}(1 - p_i + p_ie^s)$,展开后去掉$e^{sk}$,
形式与上面的分布列是一样的。

35.

由$M(0) = 1$,可以计算得$c = \frac{2}{9}$,所以$E[X] = \frac{d}{ds}M(s)|_{s = 0} = \frac{37}{18}$;
令$\alpha = \frac{e^s}{3}$,那么$M(s) = \frac{c(3 + 4e^2 + 2e^3)}{3(1 - \alpha)} = \frac{2}{27}(3 + 4e^2 + 2e^3)(1 + \alpha + \alpha^2 + \dots)$,
所以$p_X(1) = \frac{2}{27}, p_X(0) = \frac{2}{9}$,由条件期望:$E[X|X \ne 0] = \frac{E[X]}{1 - p_X(0)} = \frac{37}{14}$。

36.

(a)

由题意得:$M_{XY}(s) = \frac{1}{3}M_Y(s) = \frac{1}{3}\frac{s}{2 - s}$,
$M_{(1 - X)Z} = \frac{2}{3}M_Z(s) = \frac{2}{3}e^{3(e^s - 1)}$,所以$M_{U}(s) = \frac{2s}{9(2 - s)}e^{3(e^s - 1)}$。

(b)

$M_{2Z + 3}(s) = M_{2Z}(s)M_{3}(s) = e^{3(e^{2s} - 1) + 3s}$

©

$M_{Y + Z}(s) = \frac{s}{2 - s}e^{3(e^s - 1)}$

37.

TODO:

38.

略。

39.

略。

40.

略。

41.

(a)

因为$X_i$服从$[0, 1]$上的均匀分布,所以$M_X(s) = \frac{e^s - 1}{s}$,
由于人数服从泊松分布,所以$M_N(s) = e^{\lambda(e^s - 1)}$,将$e^s$替换后得到
$M_Y(s) = e^{\lambda(\frac{e^s - 1}{s} - 1)}$

(b)

由(a)中的矩母函数可得:$E[Y] = \frac{d}{ds}M_Y(s)|_{s = 0} = \frac{\lambda}{2}$

©

由重期望法则:$E[Y] = E[E[Y|N]] = E[X]E[N] = \frac{\lambda}{2}$,与(b)中的结果一致。

42.

个数服从参数为$\lambda$的泊松分布的情况下,
$M_X(s) = e^{\lambda(e^{\frac{\sigma^2s^2}{2}} + \mu s) - 1}$,
显然不满足正态分布的矩母函数的形式。

43.

(a)

由全概率定理: $P(X \leq x) =
\frac{1}{16}(1 + 4\int_{0}^{x}f_Y(y)dy + 6\int_{0}^{x}f_{2Y}(y)dy + 4\int_{0}^{x}f_{3Y}(y)dy + \int_{0}^{x}f_{4Y}(y)dy)$
混合分布的对应的矩母函数为:
$M_X(s) = \frac{1}{16}(1 + 4e^{\frac{s^2}{8} + s} + 6e^{\frac{s^2}{4} + 2s} + 4e^{\frac{3s^2}{8} + 3s} + e^{\frac{s^2}{2} + 4s})$,
所以超过4分钟的概率为$1 - P(X \leq 4) \approx 0.06$。X不是正态的。

(b)

二项分布的矩母函数:$M_N(s) = (\frac{1}{2} + \frac{1}{2}e^s)^4$,用正态分布的矩母函数替换:
$M_X(s) = \frac{1}{16}(1 + e^{\frac{s^2}{8}} + s)^4$,展开后与(a)中结果一致。

44.

(a)

$E[N] = E[M]E[K], var(N) = E[M]var(K) + E[K]^2var(M)$

(b)

$E[Y] = E[X]E[N] = E[X]E[M]E[K], var(Y) = E[N]var(X) +\ E[X]^2var(N) = E[M]E[K]var(X) + E[X]^2(E[M]var(K) + E[K]^2var(M))$

©

由题意得:$E[K] = \mu, E[X] = \frac{1}{\lambda}, E[M] = \frac{1}{p}, var(K) = \mu, var(X) = \frac{1}{\lambda^2}, var(M) = \frac{1 - p}{p^2}$,
由(b)中的公式,我们可以得到:$E[Y] = \frac{\mu}{p\lambda}, var(Y) = \frac{\mu}{p\lambda^2} + \frac{\mu p + \mu^2 - \mu^2p}{\lambda^2p^2}$

45.

略。

第五章 极限理论

1.

(a)

因为$\sigma = 1, var(M_n) = \frac{\sigma^2}{n}$,
要求$var(M_n) = \frac{\sigma^2}{n} \leq 0.0001$, 所以$n \geq 10000$。

(b)

由切比雪夫不等式:
$P(|X - h| \geq 0.05) \leq \frac{1^2}{0.05^2n} \leq 0.01$,
解之得$n \geq 40000$。

©

令$\sigma = \frac{(b - a)}{2} = 0.3$,
则(a)中的不等式变为$\frac{0.09}{n} \leq 0.0001$,解之得$n \geq 900$;
(b)中的不等式变为$\frac{0.09}{0.0025n} \leq 0.01$,解之得$n \geq 3600$。

2.

略。

3.

略。

4.

由弱大数定律和切比雪夫不等式,我们可以得到:
$P(|M_n - \mu| \geq \epsilon) \leq \frac{\sigma^2}{n\epsilon^2} = \delta$:

(a)

当$\epsilon$缩小为原来的一半时,为了维持不等号不变,n至少要扩大到原来的4倍。

(b)

当$\delta$缩小为原来的一半时,为了维持不等号不变,n至少要扩大到原来的2倍。

5.

由题意得:$f_{X_i}(x) = \left{
\begin{array}{lcr}
\frac{1}{2} & & x \in [-1, 1]\
0 & & otherwise
\end{array}
\right.$

(a)

$Y_n$依概率收敛于0。 $$\begin{array}{l}
\lim_{n \to \infty}P(|Y_n - a| \geq \epsilon)\
= \lim_{n \to \infty}2P(Y_n \geq \epsilon)\
= P(0 \geq \epsilon)\
= 0
\end{array}$$

利用夹逼定理,容易得出极限值为0。

(b)

$Y_n$依概率收敛于0。 $$\begin{array}{l}
\lim_{n \to \infty}P(|Y_n - a| \geq \epsilon)\
= \lim_{n \to \infty}P(|X_n^n| \geq \epsilon)\
= \lim_{n \to \infty}2P(X_n \geq \epsilon^n)\
= \lim_{n \to \infty}2P(X_n \geq 1)\
= 0
\end{array}$$

不难看出$Y_n$的极限不存在。

©

$Y_n$依概率收敛于0。 $$\begin{array}{l}
\lim_{n \to \infty}P(|Y_n - a| \geq \epsilon)\
= \lim_{n \to \infty}2P(Y_n \geq \epsilon)\
= P(0 \geq \epsilon)\
= 0
\end{array}$$

$Y_n$的极限为0。

(d)

$Y_n$依概率收敛于0。 $$\begin{array}{l}
\lim_{n \to \infty}P(|Y_n - a| \geq \epsilon)\
= \lim_{n \to \infty}2P(Y_n \geq \epsilon)\
= \lim_{n \to \infty}P(max{X_1, X_2, \dots X_n}) \geq \epsilon)\
= \lim_{n \to \infty}(\frac{1 - \epsilon}{2})^n\
= 0
\end{array}$$

$Y_n$的极限为1。

6.

略。

7.

略。

8.

我们设第i次转动的结果为$X_i$,当转到奇数的时候值为1,偶数时为0。
如果轮盘公正,那么$\mu = 0.5, \sigma^2 = 0.25$,
则由中心极限定理,转到奇数的次数大于55次的概率为
$P(Z_n > x) = P(Z_n > \frac{55 - 100\mu}{10\sigma}) = 1 - P(Z_n \leq 1) = 2 - \Phi(1) \approx 0.1587$

9.

(a)

设第i天内是否死机为$X_i$,当死机发生时记为1,没有发生记为0。
由题意得$\mu = 0.95, \sigma^2 = 0.0475$,
所以由中心极限定理,至少有45天没有死机的概率为
$P(Z_n > \frac{45 - 50\mu}{\sqrt{50}\sigma}) \approx \Phi(1.62) = 0.9474$

(b)

由题意得:$\lambda = np = 47.5$,
那么$P(Z_n \leq 5) = \sum_{k = 0}^{5}e^{-\lambda}\frac{\lambda^k}{k!} \approx 1$

10.

(a)

$P(Z_n > x) = P(Z_n > \frac{440 - 100\mu}{90}) = 1 - P(Z_n \leq -0.667) = \Phi(0.667) \approx 0.7454$

(b)

由题意得:$P(X_1 + \dots + X_n \leq 200 + 5n) = P(X_1 + \dots + X_n \leq \frac{200}{3\sqrt{n}}) \geq 0.95$,
所以$\frac{200}{3\sqrt{n}} \geq 1.65$,解得n的最大值为1632。

©

若恰好220天生产到第1000个,则每天平均需要生产约4.55个;
若219天就可以生产到第1000个,则每天平均需要生产约4.57个。
所以,由中心极限定理,我们有 $P(N \geq 220) \approx
P(4.55 \times 220 \leq S_n \leq 4.57 \times 220) \approx
\Phi(-2.12) - (1 - \Phi(2.22)) = \Phi(2.22) - \Phi(2.12) \approx 0.0038$

11.

不妨令$W_i = X_i - Y_i$,由于$X_i, Y_i$都是$[0, 1]$上的均匀分布,
所以$E[W_i] = E[X_i] - E[Y_i] = 0,
var(W_i) = var(X_i) + var(Y_i) + 2cov(X_i + Y_i) = 1$。
由中心极限定理,原式$P(|W - E[W]| < 0.001) = P(|W| \leq 0.001)
= 2P(W \leq 0.001) \approx 2\Phi(0) = 1$。

12.

略。

13.

略。

14.

略。

15.

略。

16.

略。

17.

略。

18.

略。


《概率导论》补充答案
https://lijianxiong.work/2021/20210122(1~5)/
作者
LJX
发布于
2021年1月22日
许可协议