经常用类似的题目来面试我们部门的应聘者。这个问题其实没有那么复杂,可以直接积分求解。
N(x)n(x) 分别为正态分布的累积分布函数和密度分布函数。
要求的是
E\left[ X | X < N^{-1} (\alpha) \right]
利用 x n(x) dx = -d n(x) (这个很容易验证),可以得到
E\left[ X | X < N^{-1} (\alpha) \right] =\frac{1}{\alpha} \int_{-\infty }^{\alpha} x n(x) dx = -\frac{1}{\alpha} \int_{-\infty }^{\alpha}  d n(x)=-\frac{1}{\alpha} n\left(N^{-1}(\alpha)\right)
这就是答案。通过这个公式可以可容易的对不同的\alpha通过Excel等计算出数值。
比如当\alpha=0.258 时, 可求得E\left[ X | X < N^{-1} (\alpha) \right] =-2.326, 很接近N(0.01)的数值。这个结论在金融风险分析中很常用到。因为这说明当风险分布接近正态时可以用2.58%的tail average去计算1%的value at risk. 这在观测数据量不足的时候非常有用,因为比起直接求percentile, 尾部期望更有效的利用了数据, 估值更稳定。风险管理中常用的一个近似是从264天(一年的交易天数)的历史观测值取最小的7个值求平均计算1%VaR就是利用了这个性质。

— 完 —

本文作者:Steven Li

【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)

此问题还有 2 个回答,查看全部。
延伸阅读:
连续均匀分布的概率密度?
6σ 对应的百分比是多少?是不是说人类可以达到的正态分布的极限是 6 个标准差?

分享到