精算模型1 一元生存分析2 参数生存模型

it2024-04-01  51

精算模型1 一元生存分析2 参数生存模型

均匀分布 (de Moivre 1724)指数分布Gompertz分布 (1825)Makeham分布 (1860)Weibull分布 (Frechet,1927; Weibull 1951)Gamma函数Weibull分布的基本生存函数

这一讲介绍几个常用的剩余寿命 T T T的分布。

均匀分布 (de Moivre 1724)

假设 w w w表示极限年龄,则 T ∼ U ( 0 , w ) T \sim U(0,w) TU(0,w), f T ( t ) = 1 w I 0 ≤ t ≤ w f_T(t) = \frac{1}{w}I_{0 \le t \le w} fT(t)=w1I0tw

特点:第一个寿命的连续概率模型;剩余寿命均匀分布,随着年龄增长危险率上升,达到极限年龄时必死无疑; 适用性:长时间区间不适用。

性质:

生存函数 S ( t ) = w − t w S(t)=\frac{w-t}{w} S(t)=wwt危险率函数 h ( t ) = 1 w − t h(t)=\frac{1}{w-t} h(t)=wt1平均剩余寿命(期望) E [ T ] = w 2 E[T]=\frac{w}{2} E[T]=2w方差 V a r [ T ] = w 2 12 Var[T]=\frac{w^2}{12} Var[T]=12w2

指数分布

假设 T ∼ f ( t ) T \sim f(t) Tf(t), f T ( t ) = 1 θ e − 1 θ t , t > 0 f_T(t)=\frac{1}{\theta}e^{-\frac{1}{\theta}t},t>0 fT(t)=θ1eθ1t,t>0

特点:常值死亡力(危险率函数为常数);一段时间内的死亡概率与当前年龄无关;是Gamma分布与Weibull分布的特例; 适用性:一般用在一年、一年以内的年龄区间。

性质

生存函数 S ( t ) = e − 1 θ t S(t)=e^{-\frac{1}{\theta}t} S(t)=eθ1t危险率函数 h ( t ) = 1 θ h(t)=\frac{1}{\theta} h(t)=θ1期望 E [ T ] = θ E[T]=\theta E[T]=θ方差 V a r [ T ] = θ 2 Var[T]=\theta^2 Var[T]=θ2无记忆性 P ( T ≥ y + t ∣ T ≥ y ) = P ( T ≥ t ) P(T\ge y+t|T\ge y)=P(T\ge t) P(Ty+tTy)=P(Tt)

Gompertz分布 (1825)

Gompertz分布通过直接定义危险率函数得到: h ( t ) = B c t , t ≥ 0 , c > 1 , B > 0 h(t) = Bc^t,t \ge 0, c >1 ,B>0 h(t)=Bct,t0,c>1,B>0

它的适用性不强,因为相关的生存分析基本函数的形式非常复杂,生存函数稍微简单一点 S ( t ) = exp ⁡ ( B ln ⁡ c ( 1 − c t ) ) S(t)=\exp \left( \frac{B}{\ln c}(1-c^t) \right) S(t)=exp(lncB(1ct))

Makeham分布 (1860)

Makeham分布是对Gompertz分布的修正,Gompertz分布用幂函数对与年龄相关的危险率进行建模,但没有考虑到所有年龄段共有的一些死亡风险,于是Makeham分布的危险率函数修正为 h ( t ) = A + B c t , t ≥ 0 , c > 1 , B > 0 , A > − B h(t) = A+Bc^t,t \ge 0, c >1 ,B>0, A>-B h(t)=A+Bct,t0,c>1,B>0,A>B

这个形式比Gompertz分布的形式还要复杂一点,因此相关的生存分析基本函数的形式也非常复杂,生存函数为 S ( t ) = exp ⁡ ( B ln ⁡ c ( 1 − c t ) − A t ) S(t)=\exp \left( \frac{B}{\ln c}(1-c^t) -At\right) S(t)=exp(lncB(1ct)At)

Weibull分布 (Frechet,1927; Weibull 1951)

Weibull分布参数为 θ , γ \theta,\gamma θ,γ,概率密度函数为 f ( x ) = γ θ x γ − 1 e − 1 θ x γ , x > 0 , γ , θ > 0 f(x)=\frac{\gamma}{\theta}x^{\gamma-1}e^{-\frac{1}{\theta}x^{\gamma}},x>0,\gamma,\theta>0 f(x)=θγxγ1eθ1xγ,x>0,γ,θ>0

Gamma函数

Gamma函数是阶乘在实数域的延拓,它由如下的积分形式定义: Γ ( x ) = ∫ 0 ∞ t x − 1 e − t d t , x > 0 \Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt,x>0 Γ(x)=0tx1etdt,x>0

Gamma函数及其相关计算技巧在概率统计中非常重要,

性质

Γ ( x ) = x Γ ( x − 1 ) \Gamma(x)=x\Gamma(x-1) Γ(x)=xΓ(x1) Γ ( 1 / 2 ) = π \Gamma(1/2)=\sqrt{\pi} Γ(1/2)=π Γ ( x ) ∼ 2 π e − x x x − 1 2 \Gamma(x) \sim \sqrt{2\pi}e^{-x}x^{x-\frac{1}{2}} Γ(x)2π exxx21 (Stirling’s Formula)

证明 这里用概率论的思路给出性质3的简单证明,也可以查阅任何一本数学分析的教材,学习用分析的思路证明性质3的方法。

We try to proof it using probability theory. Suppose X 1 X_1 X1, X 2 X_2 X2, … , X n X_n Xn independently follow Poisson distribution with mean of each is 1. Define S n = ∑ i = 1 n X i S_n = \sum_{i=1}^n X_i Sn=i=1nXi, then E ( S n ) = V a r ( S n ) = n E(S_n)=Var(S_n)=n E(Sn)=Var(Sn)=n. So P ( S n = n ) = e − n n n n ! P(S_n = n) = \frac{e^{-n}n^n}{n!} P(Sn=n)=n!ennn According CLT, S n − n n → d N ( 0 , 1 ) \frac{S_n-n}{\sqrt{n}} \to_d N(0,1) n SnndN(0,1) which means ∀ n ∈ N \forall n \in \mathbb{N} nN, ∀ ϵ > 0 \forall \epsilon >0 ϵ>0, ∃ δ > 0 \exists \delta>0 δ>0 such that ∀ x ∈ B ( n , δ ) \forall x \in B(n,\delta) xB(n,δ), ∣ P ( S n = n ) − [ F ( 0 ) − F ( − 1 x ) ] ∣ < ϵ 2 |P(S_n=n)-[F(0)-F(-\frac{1}{\sqrt{x}})]|<\frac{\epsilon}{2} P(Sn=n)[F(0)F(x 1)]<2ϵ Here F ( x ) F(x) F(x) is the CDF of standard normal distribution.Since P ( S n = n ) = P ( n − 1 < S n ≤ n ) = P ( − 1 / n < S n ≤ 0 ) P(S_n=n) = P(n-1<S_n\le n) = P(-1/\sqrt{n}<S_n \le 0) P(Sn=n)=P(n1<Snn)=P(1/n <Sn0), this is approximately F ( 0 ) − F ( − 1 / n ) F(0)-F(-1/\sqrt{n}) F(0)F(1/n ) according to convergence in distribution. Notice F ( x ) F(x) F(x) is continuous, so ∀ x ∈ B ( n , δ ) \forall x \in B(n,\delta) xB(n,δ), ∣ [ F ( 0 ) − F ( − 1 x ) ] − [ F ( 0 ) − F ( − 1 n ) ] ∣ < ϵ 2 |[F(0)-F(-\frac{1}{\sqrt{x}})]-[F(0)-F(-\frac{1}{\sqrt{n}})]|<\frac{\epsilon}{2} [F(0)F(x 1)][F(0)F(n 1)]<2ϵ So ∣ P ( S n = n ) − [ F ( 0 ) − F ( − 1 n ) ] ∣ ≤ ∣ P ( S n = n ) − [ F ( 0 ) − F ( − 1 x ) ] ∣ − ∣ F ( x ) − [ F ( 0 ) − F ( − 1 n ) ] ∣ < ϵ |P(S_n=n)-[F(0)-F(-\frac{1}{\sqrt{n}})] | \\ \le |P(S_n=n)-[F(0)-F(-\frac{1}{\sqrt{x}})]| -|F(x)-[F(0)-F(-\frac{1}{\sqrt{n}})]| <\epsilon P(Sn=n)[F(0)F(n 1)]P(Sn=n)[F(0)F(x 1)]F(x)[F(0)F(n 1)]<ϵ Notice F ( x ) F(x) F(x) is also bounded, so ∃ M > 0 \exists M>0 M>0 such that ∀ x ,   F ( x ) ≤ M \forall x,\ F(x) \le M x, F(x)M ∣ P ( S n = n ) F ( 0 ) − F ( − 1 n ) − 1 ∣ < ϵ M |\frac{P(S_n=n)}{F(0)-F(-\frac{1}{\sqrt{n}})}-1| <\frac{\epsilon}{M} F(0)F(n 1)P(Sn=n)1<Mϵ F ( 0 ) − F ( − 1 n ) = ∫ − 1 n 0 1 2 π e − x 2 2 d x = ∫ − 1 n 0 1 2 π ( 1 − x 2 2 + o ( x 3 ) ) d x = 1 2 π n − 1 12 π n 3 + o ( 1 n 2 ) F(0)-F(-\frac{1}{\sqrt{n}}) = \int_{-\frac{1}{\sqrt{n}}}^0 \frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} dx \\ = \int_{-\frac{1}{\sqrt{n}}}^0 \frac{1}{\sqrt{2 \pi}}( 1-\frac{x^2}{2}+o(x^3)) dx \\ = \frac{1}{\sqrt{2 \pi n}} - \frac{1}{\sqrt{12 \pi n^3}} + o(\frac{1}{n^2}) F(0)F(n 1)=n 102π 1e2x2dx=n 102π 1(12x2+o(x3))dx=2πn 112πn3 1+o(n21) According to the two equations and inequality, when n is large enough, we can ignore − 1 12 π n 3 + o ( 1 n 2 ) - \frac{1}{\sqrt{12 \pi n^3}} + o(\frac{1}{n^2}) 12πn3 1+o(n21), so e − n n n n ! → 1 2 π \frac{e^{-n}n^n}{n!} \to \frac{1}{\sqrt{2\pi}} n!ennn2π 1

证毕

Weibull分布的基本生存函数

性质

生存函数 S ( x ) = e − 1 θ x γ , x ≥ 0 S(x)=e^{-\frac{1}{\theta}x^{\gamma}},x \ge 0 S(x)=eθ1xγ,x0危险率函数 h ( x ) = γ θ x γ − 1 , x ≥ 0 h(x)=\frac{\gamma}{\theta}x^{\gamma-1},x \ge 0 h(x)=θγxγ1,x0显然 γ \gamma γ控制 h h h的单调性期望 E X = θ 1 / γ Γ ( 1 + 1 / γ ) EX=\theta^{1/\gamma}\Gamma(1+1/\gamma) EX=θ1/γΓ(1+1/γ) r r r阶矩 E X r = θ r / γ Γ ( 1 + r / γ ) EX^r=\theta^{r/\gamma}\Gamma(1+r/\gamma) EXr=θr/γΓ(1+r/γ)
最新回复(0)