R代表精算师

玛丽亚·普罗科菲耶娃博士

玛丽亚·普罗科菲耶娃博士是R /业务该工作组正在推动在会计、审计和精算工作中使用R。她还是澳大利亚维多利亚大学商学院的教授,并与澳大利亚注册会计师协会合作。

什么是精算科学

精算数据科学是数学和商业研究的交叉点,结合了来自保险和金融领域的统计知识和方法。与数据科学家相比,精算师在收集和分析数据的同时,更关注金融和商业知识。

精算师这个职业的需求量很大,根据美国劳工统计局(BLS)的数据,预计从2020年到2020年,精算师的职位将会有24%的增长。这远远快于所有职业的平均水平。此外,精算师的工资中位数估计超过10万美元。

该领域的重点是评估未来事件的可能性,特别是在商业环境中(特别是金融和保险),以计划结果和降低风险。考虑到这一点,概率分析和统计被应用到许多领域,例如预测一项健康保险的子女数量或人寿保险的支付。精算师的一些常见任务包括计算死亡率和发病率产品的保险费率、评估财务损失或回报的可能性、业务风险咨询、养老金和退休计划等等。基本上,精算师执行包括风险建模在内的任何任务,无论是在保险、财务规划还是能源和环境领域。在这篇文章的后面,我们将介绍一些这样的例子!

回顾特定领域的应用程序,我们可以提到:

  • 人寿保险、信用和抵押贷款保险、小企业关键人保险、长期护理保险、健康储蓄账户等领域的保险。这里的重点是死亡率的分析,生命表的制作,计算复利人寿保险,年金和养老或有。
#为个人声称模拟使用幻想者的包#提取的小插图set.seed (12345) tbl_policy <——policies_simulate (2, 2001:2005) tbl_claim_transaction <——claims_by_wait_time (tbl_policy claim_frequency = 2, payment_frequency = 3, occurrence_wait = 10, report_wait = 5, pay_wait = 5, pay_severity = 50) kableExtra:: kbl (tbl_claim_transaction[1:8,],标题=“等待时间与政策模拟模型”)% > % kableExtra:: kable_classic (full_width = F, html_font =“威尔士”)
表1:带有策略模拟的等待时间建模
policy_effective_date policy_expiration_date 曝光 policyholder_id claim_id occurrence_date report_date number_of_payments payment_date payment_amount
2001-05-23 2002-05-22 1 1 1 2001-06-02 2001-06-07 3. 2001-06-12 50
2001-05-23 2002-05-22 1 1 1 2001-06-02 2001-06-07 3. 2001-06-17 50
2001-05-23 2002-05-22 1 1 1 2001-06-02 2001-06-07 3. 2001-06-22 50
2001-05-23 2002-05-22 1 1 2 2001-06-02 2001-06-07 3. 2001-06-12 50
2001-05-23 2002-05-22 1 1 2 2001-06-02 2001-06-07 3. 2001-06-17 50
2001-05-23 2002-05-22 1 1 2 2001-06-02 2001-06-07 3. 2001-06-22 50
2001-02-21 2002-02-20 1 2 3. 2001-03-03 2001-03-08 3. 2001-03-13 50
2001-02-21 2002-02-20 1 2 3. 2001-03-03 2001-03-08 3. 2001-03-18 50
#从小标题中提取死亡率表。load("奥地利年金")死亡率表。load("奥地利人口普查")plot死亡率表(标题="使用死亡率表的维度信息",死亡率. at。census[c("m", "w"), c("1951", "1991", "2001", "2011")] + aes(color = as.factor(year), linetype = sex) + labs(color =" Period", linetype =" sex ")+ scale_fill_brewer(palette="PiYG")

  • 人寿保险和社会保险。这一领域的主要任务包括分析残疾率、发病率、死亡率、生育率等,分析有关使用医疗服务和程序的因素(如地理和消费者特征)。
#获取1977年出生的奥地利养老金人的队列死亡概率:qx。coh1977 =死亡概率;#获取在2020年观察到的奥地利年金持有人的期间死亡概率:qx。per2020 = periodeathprobability (AVOe2005R;获取1977年出生的奥地利养老金人的队列死亡概率作为死亡率表。句点对象:表。coh1977 = getCohortTable(AVOe2005R.)获取在2020年观察到的奥地利年金持有人的期间死亡概率:表格。per2020 = getPeriodTable(AVOe2005R.)男性,周期= 2020)#比较这两个在一个情节:coh1977、表。per2020,标题=“1977年队列与2020年时期的比较”,图例。position = c(1,0))+ scale_fill_brewer(调色板="PiYG")

  • 养恤金:设计、筹资、会计、管理、维持或重新设计养恤金计划,并对可能影响计算和支付的各种因素进行估值和建模
#使用生命应急包#插图摘录# 25岁的投保人的延期到期年金的福利准备金计算示例,当年金延期到65岁时。yearlyRate <- 12000 irate <- 0.02 APV <- yearlyRate*axn(soa08Act, x=25, i=irate,m=65-25,k=12) levelPremium <- APV/axn(soa08Act, x=25,n=65-25,k=12) annuityReserve<-function(t) {out<- null if(t<65-25) out<- yearlyRate*axn(soa08Act, x=25+t, i=irate,m=65- (25+t),k=12)-levelPremium*axn(soa08Act, x=25+t, n=65-(25+t),k=12) else {out<- yearlyRate*axn(soa08Act, x=25+t, i=irate,k=12)} return(out)} years <- seq(from=0,to= getomga (soa08Act)-25-1,by=1) annuityRes <- numeric(length(years)) for(i in years) annuityRes[i+1] <- annuityReserve(i) dataAnnuityRes <- data.frame(years=years, reserve=annuityRes) dataAnnuityRes%>%ggplot(aes(years, reserve))+ geom_line(color="blue")+ labs(x =" years ", y= "Amount", title ="Deferred annuity benefit reserve")

还有更多!看看这些例子!

历史上,精算科学起源于数学领域(这并不奇怪!),可以追溯到17世纪,当时欧洲数学的发展与人们对丧葬、人寿保险和年金计算的风险进行更精确估计的需求增长相一致。这是发展生命表技术(向人口统计学之父约翰·格兰特致敬)和现值计算贴现值的开始,现值计算是当今金融和会计的关键概念之一。这一领域发展非常迅速,但计算方面却变得越来越复杂:没有计算机,这是一项乏味的任务。但是…

精算科学为什么需要R

那些所有的计算都是手工完成的日子已经一去不复返了……目前在这个领域使用的是什么?

显然,Excel仍然占据着主导地位(如果不是统治的话?)

2022年3月,伤亡精算协会(CAS)发布结果与分析这是对精算师使用技术的首次调查。从1200多名参与者的反馈中,结果显示超过94.3%的受访者使用Excel,而且至少每天一次,但是!它不仅仅是一个工具!考虑到这一点,对新技能的需求很大——R(47.2%)、Python(39.1%)和SQL(30.8%)。

为了支卡塔尔世界杯欧洲预选赛赛程表持这一点,“浪费的时间”的最新结果(2020年)调查展示一个精算师浪费了大部分时间的惊人结果……

  • 等待excel处理结果

  • 从模型复制数据

  • 重新创建先前的模型值

  • 等待供应商支持卡塔尔世界杯欧洲预选赛赛程表

还有相当多的其他任务可以通过开源和可复制的建模方法轻松解决。

survey<-read_csv(" survey_actuges .csv") survey%>%pivot_longer(-Tasks, names_to="Time", values_to="Score")%>% group_by(Tasks) %>% mutate(sum_response = sum(Score))%>% ungroup()%>% ggplot(aes(x=fct_reorder(Tasks, sum_response), Score, fill=Time))+ geom_col(show. csv)legend = TRUE)+ coord_flip()+ scale_fill_brewer(palette="PiYG")+ labs(y =" Responses", x =" Tasks", title ="Data and model management Tasks - waste time")

障碍是什么?时间!(80.5%的精算师表示肯定)..但还缺少什么?

学习资源

要让人们使用可用的工具,学习资源总是一个问题。精算(数据)科学也不例外。好消息是,有一些人开始使用R作为精算数据,也有一些可用的材料来建立进一步的资源。

可用的学习资源从R入门开始。这是一个一般的类别,包括熟悉R、RStudio和主要的R包的资源。英格兰vs伊朗让球tidyverse).

数据科学R

英格兰vs伊朗让球RStudio。云引物

由热心支持的R社区建立的一个众所周知的列表:RStudio Education英格兰vs伊朗让球卡塔尔世界杯欧洲预选赛赛程表education.英格兰vs伊朗让球rstudio.com

与此同时,热诚的R精算师开发了越来越多的R资源宝库,以解决具体问题。

他们的工作“数据科学”小组瑞士精算师协会(SAA)的会议非常棒,准备了很多资源,包括讲座而且R中的实践教程

常用的和特定的R包

除了教育资源外,社区还可获得专门的一揽子计划,包括:

这样的包分散在CRAN和github中,因为CRAN目前没有精算数据科学的任务视图(提示!)…

精算数据科学有很大的潜力,R / Business非常乐意邀请对R有热情的社区开始对话,促进和开发这一领域的R资源!

你可以在下面留言或者在论坛里讨论帖子community.英格兰vs伊朗让球rstudio.com