物流保险中理赔次数的分布规律
——浅析双参数泊松分布模型和混合三参数伽玛分布模型的应用
李恒琦1 刘家养2
(1.西南财经大学保险学院,四川 成都 610074;2.广西财经学院金融系,广西 南宁 530003)
[摘要]现代物流业的发展迫切要求保险提供支持,把经营过程中涉及的赔偿风险转嫁给保险公司,将经营过程中的风险降到最低。物流中的风险基本上是不同质的,加之物流过程中多环节,跨地域特点,其保险费的计算具有更多的不确定性。这里讨论了费率厘定中的重要因素理赔次数的双参数泊松分布模型和混合三参数伽玛分布模型及应用。
[关键词]现代物流保险;理赔次数;双参数泊松分布;混合三参数伽玛分布
在我国,物流业是一个方兴未艾的新兴产业,有着广阔的发展前景。据近几年的资料统计,2004年和2005年我国物流行业承担的社会物流总额分别为38.4万亿元和48.1万亿元,物流总费用分别为29 114亿元和33 860亿元,而保险费用在同期分别为90亿元和110亿元。只占物流总费用的0.31%和0.32%,这些保险费用中大部分都是运输保险收入。因此开发出适销对路的物流保险产品是目前保险业所面临的迫切问题,也是物流行业为了转移自身风险的强烈需求。
现代物流自身风险种种,既有法律的不完善的风险,也有操作层面上的风险,还有传统运输环节保险、仓储环节保险以及承运人责任保险构成传统运输物流领域“三足鼎立”的物流保险格局,给现代物流保险带来的尴尬局面。
然而,制约保险业不能大胆而又有效地去开展物流保险的另一重要原因,就是保险业面临的是一个崭新的保险市场,既缺乏历史资料数据可查,又没有完善的案例可循。因此在种种风险面前,要做到心中有数,必须借助精算方法,对现代物流面临的风险进行分析,寻找和建立现代物流保险的费率厘定模型。
一、现代物流保险及其费率厘定分析
(一)现代物流保险
所谓现代物流,也称第三方物流。由于现代物流的服务性质是多功能的,它的物流成本较低,增值服务较多,供应链因素也较多,因此质量难以控制,运营风险也大。加之各种无法预测的自然灾害、意外事故和经营管理的疏忽,都有可能造成物流企业的重大损失。因此现代物流业的发展迫切要求保险提供支持,把经营过程中涉及的赔偿风险转嫁给保险公司,从而将经营过程中的风险降到最低,解决其后顾之忧。所以物流综合保险正是适应现代物流发展的理想险种。这一理想险种在物流业发达的欧美国家,已经被广为接受。而在我国,由于种种原因,还未被广泛地接受和应用。
所谓现代物流保险,指物流综合保险试图整合物流活动过程中的各种风险。这些风险各种各样,公司规模不同,经营业务不同,地理位置不同,管理水平不同等等都会具有不同的风险水平和风险性质。可见物流
[作者简介]李恒琦,西南财经大学保险学院教授;刘家养,广西财经学院金融系讲师。
保险当中的风险基本上是不同质的。这种风险的非同质性以及物流过程中多环节、跨地域特点的保险,其保险费的计算具有更多的不确定性。这就要求我们,在保险费率模型中采用一个包括运输、仓储、装卸搬运、包装、产品流通加工、配送、信息处理服务等全部物流活动中发生的事故总次数进行拟合,作为更好地描述物流活动过程中的整体风险,更准确地计算物流综合保险保费的理论基础。
(二)现代物流保险费率厘定分析
费率厘定是保险公司的一项重要工作,制订出准确、合理的费率结构对财产保险公司的经营有着重要而深远的影响。
谁都知道,在厘定纯保费的过程中需要考虑两个十分重要的因素就是索赔次数和索赔额。从理论上讲,无论是哪一种财产保险纯保费都是期望索赔次数和期望索赔额的乘积。物流保险也不例外,其费率厘定的基础,主要还是讨论索赔次数和索赔额这两个最基本的因素以及其分布规律。物流保险的索赔次数和索赔量具有不确定性,这使得物流保险的费率厘定更加复杂和更加困难。
在非寿险精算研究中,要准确描述一个非同质保单组合的索赔次数分布,首先需要确定这一保单组合中泊松参数的变化规律。由于保险公司的保单数是大规模的,因此可以假定一个保单组合的泊松参数服从连续分布。这种用以描述一个保单组合泊松参数变化规律的分布也被称为结构函数。一些常用的索赔次数模型为以伽玛分布、逆高斯分布和离散型分布等作为结构函数的负二项分布模型、泊松-逆高斯模型、二元(三元)风险模型、二项-贝塔分布模型、负二项-贝塔分布模型。索赔额分布是费率厘定中的另一个重要方面,最常用的索赔额分布有指数分布、伽玛分布、帕累托分布、对数正态分布、对数伽玛分布、韦伯分布以及布尔分布等等。
在我国物流业蓬勃发展的背景下,根据物流保险风险非同质性特点,通过对其费率模型中的理赔次数模型的研究,提出了混合三参数伽玛分布模型,较好地刻画了物流保险中的理赔次数的分布规律,为物流保险的费率厘定提供了更科学的和准确的理论依据。
二、物流保险的费率模型
索赔次数分布的研究无论是对于研究经典风险模型理论还是对于保险公司的实务都是很有意义的工作。Poisson分布在风险理论研究中具有非常重要的地位,在一般的研究中,我们通常都假设某类事件(事故)的发生次数服从Poisson分布。小于物流保险中也不例外,我们可以通过泊松分布模型来模拟理赔发生的次数。
(一)双参数泊松分布模型
我们知道,Poisson分布的一个重要性质是方差等于均值,但是在物流保险当中,由于风险的非同质性以及分布右尾的特性,实际上索赔次数并不完全遵循Poisson分布的规律,方差往往大于均值。因此我们有必要对单参数泊松分布进行进一步的研究。对于方差不等于均值的这种现象,相对于Poisson分布来说我们称之为散度偏大(overdispersion)。刻画散度偏大的模型很多,如:准似然模型(quasilikelihood)、广义Poisson回归模型、混合Poisson模型及随机效应模型等。在现实的物流保险中引起散度偏大现象有其他多方面的原因:如受自然环境及各种客观条件的影响,使得个体保单实际出事故的次数偏离Poisson分布。其次是保险公司及投保人增强了风险意识使得出事故的次数在0处有更大的概率。另外一个重要原因是保险公司采用了回避风险机制,如免赔制度、无赔款折扣(NCD)制度等,使得投保人在发生事故时会权衡其利益得失而是否进行索赔,这样,索赔次数小于事故发生次数。针对物流保险中这一客观背景,研究物流保险在这种特性下的理赔次数的分布,可采用双参数泊松分布模型。它的散度参数一般大于1,用散度参数来刻画方差与均值的偏离程度。
1.双参数泊松分布
(1)定义:若随机变量X的母函数为G(t)=expλ(t-1)[]1-ρt,其中λ,ρ为参数,则称X服从参数λ,ρ为双参数泊松分布,记DP(λ,ρ)。
(2)定理:设随机变量X为双参数Poisson分布,则:
1)X的概率分布为:
P(ξ=0)=e-λ;
P(ξ=k)=e-λ∑k[]j=1(k-1)!(k-j)!j!(λ(1-ρ))jρk-j,k=1,2,…(1)
2)X的数学期望和方差分别为:
E(ξ)=λ[]1-ρ,Var(ξ)=λ(1+ρ)[](1-ρ)2
3)X的散度参数为:
=Var(ξ)[]E(ξ)=1+ρ[]1-ρ
4)X的偏度参数为:
γ=E(ξ-E(ξ))3[](Varξ)3/2=1[]λ 1+4ρ+ρ2[](1+ρ)3/2
2.用双参数泊松分布模型的散度参数来刻画索赔次数
(1)假设随机变量X为个体保单在单位时间内发生事故次数且P(X=0)=1-α,P(X≥1)=α。又设Y为保单实际索赔次数,由前面的讨论得出,一般来说,P(Y=0)要比P(X=0)来得大,当然P(Y≥1)要比P(X≥1)小。
设P(Y=0)=1-α+ρα,则P(Y≥1)=α(1-ρ),ρ∈(1-1/α,1),称ρ为偏离参数,用以刻画实际索赔次数偏离实际事故发生次数的程度。由于:
P(Y≥1)=α(1-ρ)=∑∞[]k=1α(1-ρ)2ρk-1
根据上式的性质的特点,可以假设发生1次索赔、2次索赔、3次索赔……,其频率呈几何递减趋势。所以设P(Y=k)=α(1-ρ)2ρk-1,且设π=α(1-ρ),则Y的分布可写为:
P(Y=0)=(1-π),P(Y=k)=π(1-ρ)ρk-1,k=1,2,3……(2)
所以,Y的母函数为:
GY(t)=∑∞[]k=0tkP(Y=k)=1-π(1-t)[]1-ρt
(2)设Xk(k=1,2,……,n)独立同分布且它们的概率分布是:
P(Y=0)=(1-π),P(Y=k)=π(1-ρ)ρk-1,k=1,2,3……
则发生事故的总次数:Sn=∑n[]k=1Xk,其母函数为:
GSn(t)=1-π(1-t)[]1-ρtn(3)
设n→∞,π→0,nπ→λ,则有:
G(t)=expλ(t-1)[]1-ρt(4)
在这里采用散度参数来刻画方差与均值的偏离程度,而不用变异参数(即用标准差与均值的比值),主要原因是因为泊松分布当中的方差等于均值,变异参数为1/λ,而在实际当中方差往往大于均值,即散度参数一般大于1,如果λ>1,变异参数就小于1,不能正确地描述方差偏大的实际情况,因此采用散度参数。
说明:(1)当ρ=0时,由(4)知,DP(λ,ρ)退化为参数为λ的Poisson分布,因此DP(λ,ρ)是Poisson分布的一个推广。
(2)由于0<ρ<1时,散度系数Φ>1,所以双参数Poisson分布有更大的散度系数。
(3)当0<ρ<1时,偏度系数1/λ,这说明其偏度系数也要比Poisson分布的偏度系数大。
下面给出双参数泊松分布DP(λ,ρ)的部分数值计算结果,以供参考。
(二)混合三参数伽玛分布模型
在非寿险精算中,保单持有人每年向保险公司索赔次数的分布一般假设为泊松分布P(λ),λ的大小反映了保单持有人的风险状况.风险状况越糟,λ的值越大。考察某一保险责任,如果这项责任中某些保单持有人的风险状况较好(即他们的λ值较小)。而某些保单持有人的风险状况不好(即他们的λ值较大),则称这项保险责任中的风险非同质。物流保险中的风险就是这样的一种非同质风险
双参数Poisson分布DP(λ,ρ)的部分数值结果
表1
K[]λ=0.1
ρ=0.1[]0.1
0.5[]0.1
1.0[]0.5
0.1[]0.5
0.5[]0.5
1.0[]0.9
0.1[]0.9
0.5[]0.9
1.00[]0.904 83[]0.606 53[]0.367 87[]0.904 83[]0.606 53[]0.367 87[]0.904 83[]0.606 53[]0.367 871[]0.017 37[]0.097 04[]0.176 58[]0.023 75[]0.094 77[]0.137 95[]0.008 18[]0.028 05[]0.034 942[] 0.004 13[]0.035 58[]0.090 25[]0.012 46[]0.058 44[]0.099 63[]0.007 41[]0.025 94[]0.033 173[]0.000 97[]0.012 29[]0.041 59[]0.006 53[]0.035 63[]0.069 93[]0.006 70[]0.023 98[]0.031 454[]0.000 22[]0.004 06[]0.017 79[]0.003 42[]0.021 52[]0.047 99[]0.006 06[]0.022 17[]0.029 805[] 0.000 05[]0.001 29[]0.007 19[]0.001 79[]0.012 89[]0.032 34[]0.005 49[]0.020 48[]0.028 216[] 0.000 01[]0.000 40[]0.002 78[]0.000 93[]0.007 66[]0.021 46[]0.004 97[]0.018 92[]0.026 697[] 2.8E-6[]0.000 12[]0.001 03[]0.000 49[]0.004 53[]0.014 05[]0.004 49[]0.017 48[]0.025 238[]6.5E-7[]0.000 03[]0.000 37[]0.000 25[]0.002 66[]0.009 10[]0.004 07[]0.016 14[]0.023 839[]1.5E-7[]0.000 01[]0.000 13[]0.000 13[]0.001 55[]0.005 83[]0.003 68[]0.014 91[]0.022 5010[]3.4E-8[]3.0E-6[]0.000 04[]0.000 06[]0.000 9[]0.003 70[]0.003 33[]0.013 76[]0.021 23在物流保险中,风险非同质时,保单持有人每年向保险公司索赔次数的分布假设为泊松分布P(λ),泊松参数λ值的分布称为结构函数,这样准确描述一个非同质保单组合的索赔次数的分布称为含有结构函数的混合泊松分布。
1.两参数伽玛分布为结构函数的混合泊松分布模型
在物流保险中,假设给定个体保单的索赔次数X服从参数为λ的泊松分布:
Pk(λ)=λk[]k!e-λ(k=1,2,…)
而保单组合中每份保单的λ又有所不同。假设它们服从参数为(α,β)的伽玛分布:
u(λ)=βαe-βλλα-1[]Γ(α)α,β>0
那么随机个体保单(即从保单组合中随机抽取的个体保单)的索赔次数服从参数为(α,β[]1+β)负二项分布即:
Pk=∫∞[]0λk[]k!e-λu(λ)dλ=∫∞[]0λk[]k!e-λβαe-βλλα-1[]Γ(α)dλ
=k+α-1
k β[]1+βα 1[]1+βk
上述u(λ)也称作保单组合的结构函数。
其密度函数为:
f(λ)=γα[]Γ(α)λα-1e-λγ,λ≥0
混合后的分布称结构函数为伽玛分布的混合泊松分布,推证结果恰是负二项分布。在这种情况下,部分保单持有人的风险状况可能很好(λ很小),甚至可能几乎没有风险(λ=0)。而实际上保单持有人一般都会面临一定的风险,即反映保单持有人的风险状况的λ值至少不小于正数β。显然,如果采用λ的分布为两参数伽玛分布,不太合理。一般还可以取两参数结构函数的混合泊松分布为帕累托分布等做同样的讨论。
2.三参数伽玛分布为结构函数的混合泊松分布模型
在这里,进一步取混合泊松分布的结构函数为三参数伽玛分布。
(1)混合三参数伽玛分布模型
三参数伽玛分布的密度函数为:
f(λ)=γα[]Γ(α)(λ-β)α-1e-γ(λ-β),λ>β
这里α>0是形状参数,γ>0是尺度参数,β是位置参数。两参数伽玛分布和两参数指数分布分别是三参数伽玛分布中β=0和α=1时的特殊情况。给定λ后,索赔次数K是参数为λ的Poisson分布,则混合后的分布:
P(K=k)=∫∞[]βλk[]k!•e-λγα[]Γ(α)•(λ-β)α-1•e-γ(λ-β)•dλ
我们称三参数伽玛分布为结构函数的混合泊松分布模型,简称混合三参数伽玛分布。
假设一共有n份物流保险保单,每份保单在一年中索赔K次,而观察到的最大索赔次数为m。这n份保单中一年索赔次数为i=0,1,2,……,m次的保单持有人数分别为n0,n1,n2,……nm。显然∑m[]i=0ni=n。从而我们可以求得:
样本均值:x=∑m[]i=1ini[]n
样本方差为:
2=∑m[]i=1i2ni[]n-n∑m[]i=1ini[]n2
三阶样本中心矩为:
=∑m[]i=0ni(i-x)3[]n
四阶样本中心矩为:
=∑m[]i=0ni(i-x)4[]n
(2)三参数伽玛分布的参数估计
混合后的分布的均值μ、方差σ2和三阶中心矩δ分别为:
μ=E(K)=E(E(K|λ))=E(λ)=β+α/γ,
σ2=Var(K)=E(Var(K|λ))+Var(E(K|λ))=E(λ)+Var(λ)=β+α/γ+α/γ2,
δ=E(K-E(K))3=E(K3)-3E(K2)E(K)+2(E(K))3
=E(E(K3|λ))-3E(E(K2|λ))•E(λ)+2(E(λ))3
=E(λ(λ+1)(λ+2))-3E(λ(λ+1))E(λ)+2(E(λ))3
=β+α/γ+3α/γ2+2α/γ3
由此得到这些参数分别为:
α=(σ2-μ)3/[(δ-σ2)/2-(σ2-μ)]2
γ=(σ2-μ)/[(δ-σ2)/2-(σ2-μ)]
β=μ-(σ2-μ)2/[(δ-σ2)/2-(σ2-μ)]
用矩估计法就可估计未知参数。则在2>x,δ^+2x>32时,混合三参数伽玛分布的参数的矩估计为:
α^=(σ^2-x)3/[(δ^-σ^2)/2-(σ^2-x)]2
γ^=(σ^2-x)/[(δ^-σ^2)/2-(σ^2-x)]
β^=x-(σ^2-x)2/[(δ^-σ^2)/2-(σ^2-x)]
(3)位置参数β的检验
在K的混合三参数伽玛分布中:
P(K=0)=∫∞[]βe-λγα[]Γ(α)(λ-β)α-1e-γ(λ-β)dλ
=e-β∫∞[]0γα[]Γ(α)tα-1e-(γ+1)tdt=e-βγ[]γ+1α
对于一个样木容量为n的样本,索赔的次数为0的保单持有人数为n0,则可认为n0服从参数为P=P(k=0)的二项分布。若P(k=0)随β的增大而减小,则对于位置参数β的水平为b的检验:
H0∶β=β0,H1∶β>β0
就可以化为对二项分布的参数P的检验:
H0∶P=P0,H1∶P>P0
其中:
P0=e-β0γ[]γ+1α。
在α与γ给定时,显然P0随β0的增大而减小。那么在正态近似的情况下,建立统计量:T=n0-nP0[]nP0(1-P0),在检验水平为b时,T=n0-nP0[]nP0(1-P0)<ub。
所以拒绝域为:
n0<ubnP0(1-P0)+nP0
其中uS为标准正态分布的上b分位数①。
虽然P0中含有未知参数α与γ仍可以对β进行检验。由
μ=β0+α/γ
σ2=β0+α/γ+α/γ2
得:
α=(μ-β0)2[](σ2-μ),γ=(μ-β0)[](σ2-μ)
从而可得:
P0=e-β0μ-β0[]σ2-β0(μ-β0)2[](σ2-μ)
然后,当x<σ^2时,α与γ的矩估计为:
α^=(x-β0)2[](σ^2-x),γ^=(x-β0)[](σ^2-x)
从而有P0的矩估计:
P^0=e-β0x-β0[]σ^2-β0(x-β0)2[](σ^2-x)
定理1对于混合三参数伽玛分布,在β=β0,σ^2>x时,P^0为β0的减函数。
证明:对于混合三参数伽玛分布,当β=β0时,显然有0<β<x,要证P^0为β0的减函数,只须证P0=P^0[]β0<0,而:
①设X•N(0,1),若Zb满足P(X>Zb)=b,0<b<1,称Zb为标准正态分布的上b分位数。P^′0=P^0•-1-2•(x-β0)[](σ^2-x)ln(x-β0)[](σ^2-β0)-(x-β0)[](σ^2-β0)
因为P^0>0,故只须证:
-1-2•(x-β0)[](σ^2-x)ln(x-β0)[](σ^2-β0)-(x-β0)[](σ^2-β0)<0
设U=(x-β0),V=(σ^2-β0),由于σ^2>x>β0>0,所以0<U[]V<1,故只须证明:
-1-2U[]V-UlnU[]V-U[]V<0
即:
-2U/V[]1-U/VlnU[]V<1+U[]V
再令T=1-U/V,则0<T<1,只须证明:
-2(1-T)[]Tln(1-T)<2-T
而:
-2(1-T)[]Tln(1-T)=2(1-T)[]TT+T2[]2+T3[]3+…<2-T-T+(1-T)T+(1-T)T2+…=2-T
从而证明了P^0为β0的减函数。
定理2在原假设成立时,即β=β0时,有:
nn0[]n-P^0~N(0,∑)
其中:
∑=σ2h(θ1,θ2,θ3)[]θ12+2δh(θ1,θ2,θ3)[]θ1 h(θ1,θ2,θ3)[]θ2-2μP0h(θ1,θ2,θ3)[]θ1
+(ν-σ4)h(θ1,θ2,θ3)[]θ22+2•(μ2-σ2)h(θ1,θ2,θ3)[]θ2+P0(1-P0)θ1=μ
θ2=σ2
θ3=P0
其中δ、ν分别为K的三阶中心矩与四阶中心矩。
证明:令
Yi=1,ki=0时
0,ki≥1时,i=1,2,3,…,n
则有∑n[]i=1Yi=n0,P^0=n0/n是基于Yi(i=1,2,…,n)的P0的矩估计,令:
h(θ1,θ2,θ3)=θ3-e-β0θ1-β0[]θ2-β0(θ1-β0)2[](θ2-θ1)
那么有:
h(x,σ^2,P^0)=n0[]n-e-β0x-β0[]σ^2-β0(x-β0)2[](σ^2-x)=n0[]n-P^0
而h(u,σ2,P0)=0
nx
σ^2
P^0-u
σ2
P0~N0
0
0,σ2[]δ[]-uP0
δ[]υ-σ4[](u2-σ2)P0
-uP0[](u2-σ2)P0[]P0(1-P0)①
则有:
①P J比克尔,K A道克苏著,李泽慧等译.数理统计——基本概念及专题 .兰州大学出版社,1991。n(h(x,σ^2,P^0)-h(u,σ2,P0))=nn0[]n-P0~N(0,∑)
其中,
∑=∑ ∑σijh(θ1,θ2,θ3)[]θ1 h(θ1,θ2,θ3)[]θj
则:
h(θ1,θ2,θ3)[]θ1θ1=μ
θ2=σ2
θ3=P0=-g(μ,σ2)•2μ•(σ2-μ-β0)+(μ-β0)2[](σ2-μ)2lnμ-β0[]σ2-β0+μ-β0[](σ2-μ)
h(θ1,θ2,θ3)[]θ2θ1=μ
θ2=σ2
θ3=P0=g(μ,σ2)•(μ-β0)2[](σ2-μ)2lnμ-β0[]σ2-β0+(μ-β0)2[](σ2-μ)•(σ2-β0)
其中
g(u,σ2)=e-β0u-β0[]σ2-β0(u-β0)2[](σ2-u)
由于x、σ^2、δ^、υ^与P^0为均值μ、方差σ2、三阶中心矩δ、四阶中心矩υ与P0的相应估计,则有:
nn0[]n-P^0~N(0,∑^)
其中,∑^为把∑中的参数μ、σ2、δ、υ与P0用x、σ^2、δ^、υ^与P^0替换后的估计值。那么置信水平为1-b的检验的拒绝域为:
n0<ubn∑^+nP^0
用上述方法对H0∶β=β0,H1∶β>β0做出检验。当拒绝原假设时,表明β>0。否则我们只有接受原假设。
3.实例模拟
由于我国的物流保险目前品种单一,费率是按被保险人的物流营业收入为基础收保险费(详见中国人保物流责任保险条款),造成物流保险的保费非常高,按此计算一个大型物流公司一年所付的保险费高达五六百万元,而物流公司所需的保险也就一两百万元。这么高的费率,物流公司是无法承受的,所以国内目前的物流保险业务开展得并不好,业务量也不大。到目前为止,我国物流没有足够的数据积累进行数据模拟。因此,在这里,我们采用物流公司的事故次数来近似模拟理赔次数。这里采用的事故次数包括了物流公司在装卸、搬运、运输、仓储以及信息服务等所有的物流活动过程中发生的事故次数,能够很好地体现了物流公司的整体风险。所以用事故次数来近似理赔次数进行模拟是合理的、可靠的、可行的。
表2是100 000次某物流公司的事故次数,经计算可得样本参数如下:样本均值x=0.12 318,
样本方差σ^2=0.127 507
样本三阶中心矩δ^=0.137 492,
四阶样本中心矩υ^=0.2 110 565。
为了更好地评价三参数伽玛分布在物流保险上更好的拟合特性,选用了混合分布为两参数伽玛和混合分布为帕累托分布这两个以前常用的模型进行对比拟合。对于混合分布为两参数伽玛的详细拟合过程和混合分布为帕累托分布的详细拟合过程,在这里不再演示详细的拟合过程,下面进行混合三参数伽玛分布的拟合。
(1)参数拟合
对于混合三参数伽玛分布,由前面的讨论,知道:
E(K)=β+α/γ=x=0.12 318
Var(K)=β+α/γ+α/γ2=σ^2=0.127 507
E(K-E(K))3=β+α/γ+3α/γ2+2α/γ3=δ^=0.137 492
由此得出:
α^=0.1 825 885,γ^=6.496 193,β^=0.095 073
这样就可以计算出拟合的混合三参数伽玛分布的值(见表2)。
(2)水平检验
下面对β做水平检验,选取检验水平b=0.05。
H0∶β=β0,H1∶β>β0
在H0成立的情况下,经计算,P^0=P(K=0)=0.88 597
而∑^=0.000 707,因此
n^0=-u0.05n∑^+nP^0=88 583.16
而n0=88 585,n0>n^0,所以不能拒绝H0。所以本例中可以用混合三参数伽玛分布来拟合保单的索赔次数。
从以上例子中可以看出,用混合三参数伽玛分布的拟合值与实际值的差别相对较小,其良好的拟合特性得到了证实。
100 000次保单索赔次数的分布拟合
表2
索赔次数[]0[]1[]2[]3[]4[]5[]≥6[]总数观察的次数[]88 585[]10 577[]779[]54[]4[]1[]-[]100 000负二项分布[]拟合值[]88 597[]10 544[]806[]50[]3[]-[][]100 000拟合值与观察值之差[]12[]33[]27[]4[]1[]1[]-帕累托分布[]拟合值[]88 568[]10 615[]758[]52[]5[]1[]1拟合值与观察值之差[]17[]38[]21[]2[]1[]0[]1三参数
伽玛分布[]拟合值[]88 584[]10 580[]776[]56[]4[]-[]-拟合值与观察值之差[]1[]3[]3[]2[]0[]1[]-从表2中我们可以看出,通过对负二项分布、帕累托分布和混合三参数伽玛分布的拟合结果进行比较,拟合值与实际值之差绝对值的累计总数,负二项分布为78次,帕累托分布为80次。而混合三参数伽玛分布仅为10次,远远优于负二项分布和帕累托分布。所以用混合三参数伽玛分布模型来描述物流保险中的理赔次数更加合理,更接近实际情况,可以更准确地计算出物流保险的基础费率,大大降低保险公司的风险和物流公司的成本,对促进物流保险的健康持续发展具有重要的意义。
[参考文献]
[1]Grandell, J.C., Aspects of Risk Theory, Springerverlag, New York,1991.
[2]Breslow.N.E.and Clayton,D.G., Approximate inference in generalized linear mixed models. Journal of the America statistical Association,88(1993),9-25.
[3]McCullagh,P. and Nelder, J.A., Generalized Linear Models (Second edition),London: Chapman and Hal,1989.
[4]Consul, P.C.and Famoye,F., Generalized Poisson regression model, Communications in StatisticsTheory and Methods,21(1992),89-109.
[5]Ludwig Fahrmeir and Gerhard Tutz, Multivariate Statistical Modelling Based on Generalized Linear Models, SpringerVerlag, New York, Inc., 1994.
[6]Nelder, J.A. and Pregibon, D., An extended quasilikelihood function, Biometrika, 74(1987), 221-232.
[7]李恒琦.保险统计[M].成都.西南财经大学出版社,2003.
[8]李恒琦.非寿险精算[M].成都.西南财经大学出版社,2004.
[9]谢志刚,韩天雄.风险理论与非寿险精算[M].天津.南开大学出版社,2000.
[10]陈希孺,数理统计引论[M].科学出版社,1999.
[11]汉斯U•盖伯,数学风险论导引[M].世界图书出版公司,1997.(中译本:成世学,严颖译).
[12]IB霍萨克等著,王育宪等译. 非寿险精算基础[M]. 中国金融出版社,1992.
[13]P J比克尔,K A道克苏著,李泽慧等译.数理统计―基本概念及专题[M].兰州大学出版社,1991.
[14]C R劳著,张燮等译, 线性统计推断及应用[M],1987.
[15]张贺林,非寿险精算基础[M].北京,中国财经出版社,1994.240- 267.
[16]项可风,线性统计推断及应用[M].岭南大学出版社,1987.102- 166.
[17]林慧如,风险理论及其应用[M].北京,北京人学出版社,1999.322- 356.
[18]Jean Lemaire. BonusMalus Systems in Automobile Insurance. Kluwer Academic Publishers, 1995.
[19]孟生叶.负二项分布的特性及其在风险管理中的应用[J].数理统计与管理., 1998, ( 2) ,9-12.
[20]成世学,严颖,程侃,保险精算方法(一)[J].数理统计与管理,第15卷,1996,(3)
[21]成世学,严颖,程侃,保险精算方法(二)[J].数理统计与管理,第15卷,1996,(5)
[22]冯士雍,黄向阳,保险统计的基本原理和方法,(Ⅰ)-( V)[J].数理统计与管理,第14卷第1-6期,1995.
[23]刘家养,马绍东. 论物流企业风险管理与保险[J]. 现代管理科学,2004,(10).
Abstract:There is an urgent need for the support of the insurance industry as modern logistic industry develops. It can shift damages risk in its operation process to insurance companies in order to reduce risks to the minimum level. Risks in logistic industry are mostly heterogeneous. Moreover, there are multiple links and multiple locations involved in the process of logistics. These factors increase the uncertainty of premium calculation. This paper discussed important factors to be considered in premium pricing, the Double Parameters Poisson Distribution model and Mixed Three Parameters Gamma Distribution model of the number of claim and their application.
Key words:modern logistic insurance; number of claim; Double Parameters Poisson Distribution; Mixed Three Parameters Gamma Distribution
[编辑:李芳]保险研究2008年增刊2