•  J9集团国际首页
  •  讲授项目
    本科 学术硕博 MBA EMBA 高层治理教育 管帐硕士 金融硕士 贸易分析硕士 数字教育 课程推荐
  •  北大主页
  •  用户登录
    教人员登录 学生登录 J9集团国际邮箱
  •  教怨匦聘  捐赠
English
J9集团国际(中国)-官方网站
swtjyjjjlx

最新信息

首页 > 最新信息 > 正文

最新信息

涂云东:大数据时期 ,若何应对经济和金融数据的不不变性 ?|学术J9集团国际

数据采集和存贮技术的飞跃发展 

功夫:2023-06-14

数据采集和存贮技术的飞跃发展 ,生长了多多领域的大数据 。大数据呈此刻蕴含金融、经济、治理等各类领域 ,为计量经济学的发展带来了前所未有的机缘和挑战 。在从前的二十年间 ,大型因子模型被宽泛地用来分析高维数据 。经济学和金融学中的高维数据集通常以较大的横截面维度N和较长的功夫维度T为特点 。而高维因子模型能够用少数几个潜在的因子来捉拿到高维变量中的大部门信息 ,因而得到了经管学科的宽泛关注 。


关于高维因子模型的理论钻研和数据分析时时是基于线性的如果 。然而现实的宏观经济运作、企业经营治理时时受到国度政策、新技术改革、全球金融;鹊挠跋 ,因而其数据结构时时产生变动 。另表 ,思考到大数据观测功夫长 ,样本容量大的特点 ,经济学模型很容易拥有结构不不变性和非线性的特点 。因而 ,结构不不变性的分析在经济数据 ,出格是高维功夫序列数据上起到至关沉要的作用 。忽略高维因子模型中出现的结构不不变性 ,将会导致谬误的揣度和预测 。


J9集团国际商务统计与经济计量系涂云东教授在因子模型及其结构不不变性领域进行了深刻钻研 。由涂云东教授与其领导的博士生马辰辰共同撰写的两篇论文“Group Fused Lasso for large factor model with structural breaks”和“Shrinkage Estimation of Multiple Threshold Factor Models先后颁发在计量经济学国际顶级期刊Journal of Econometrics 《计量经济学杂志》)上 。两篇论文针对经济和金融数据的结构不不变性 ,在高维因子模型的框架下 ,提出了关于结构变点和门限效应参数的全新估计步骤 ,力求提升参数估计的正确性和推算效能 ,进而展示计量经济学和统计学的步骤在分析经济问题中的宽泛利用 。



undefined




Part.1

高维因子模型及其结构不不变性

因子模型选取少数因子即可捉拿到高维观测变量中的大部门信息 ,因而成为分析高维功夫序列数据的一个沉要的工具 。尤其是在目前的大数据时期 ,因子模型受到了越来越多的关注 ,其模型表白如下:


39E5B2A2E807DE1AE842A714716_20DE2935_1309.png?e=

其中xit是我们观测到的高维功夫序列数据 ,ft是潜在的因子 ,λi是相应的因子载荷 ,it是残差项 。自从Stock和Watson(2002)以及Bai和Ng(2002)的有影响力的钻研以来 ,计量经济学领域和统计学界对高维因子模型中揣度的钻研兴致激增 ,最新发展蕴含Bai和Li(2016)、Chen等人(2021)等 。


在现有的文件里 ,对因子模型理论钻研和数据分析大多都是基于线性模型如果(Bai 和 Ng ,2002;Bai 和 Li ,2012;Bai 和 Liao ,2016) ,也就是说这里的因子载荷λi是一个不随功夫变动的常数 。然而 ,现实的经济环境经;崾艿娇萍纪黄啤⒄策颁布、金融;鹊挠跋 ,因而其数据结构时时产生变动 ,这使得上述的线性因子模型的如果在现实的数据分析中变得极度脆弱  K伎嫉酱笫莨鄄夤Ψ虺 ,样本容量大 ,因子模型可能拥有结构不不变性和非线性特点 。因而 ,为相识决真实复杂大数据中的因子降维 ,带有结构性变动的大型因子模型和非线性因子模型成为近年来钻研的热点 。


Part.2

高维因子模型中的结构变点估计

Stock 和 Watson(2002, 2009)钻研得出结论 ,当因子载荷出现幼的(部门收敛到0)突变时 ,通过主成分分析估计的因子同样拥有一致性 。但是Breitung 和 Eickmeier(2011)发现若是忽视因子载荷中的突变 ,将可能会导致鉴别出更多因子的谬误了局 。因而学者针对因子模型中的结构变点陆续提出了分歧的检验和估计的步骤(Chen et al. ,2014;Han 和 Inoue ,2015;Su 和 Wang ,2017;Ma 和 Su ,2018;Baltagi et al. ,2017 ,2020) 。大部门的钻研仅仅关注于因子载荷中只存在一个变点的情况 。但是在大数据时期 ,钻研者越来越致力于钻研更高维的数据集 ,这些数据会蕴含数百个变量 ,并蕴含极大的功夫跨度 ,部门甚至所有的变量都可能在采样周期产生超过一个突变 。但是目前关于多个变点的钻研中 ,通;岽嬖诘鹘诓问虼啦问嗟奈侍 ,从而使得步骤过于复杂 ,理论钻研难度较大 。所以当因子模型中存在多个结构性变点时 ,单一易行的估计和检验步骤亟待提出 。 


涂云东教授等2023年颁发的论文很好地解决了这一问题 (Ma 和 Tu,2023a) 。他们思考在大型因子模型中 ,因子载荷中存在的多个变点的估计问题 。也就是说因子载荷λi在功夫维度上被划分成多个时段:

996C5EAC88ADF4872DFE1CC387D_598517D4_1CAF.png?e=

这里结构变点为t1, ... ,tm ,αi1, ... , αim+1 ,为因子载荷λi在分歧时段上的取值 ,相邻两段上的因子载荷互不一样 。


该论文拓展了Chen等人(2014)关于单一变点的了局 ,将因子载荷中结构变点的鉴别问题转化为因子回归方程中系数的结构变点估计 ,而后提出了一种基于group Lasso 的估计步骤来鉴别变点日期 。这里思考的因子模型允许变点的数量和日期都未知 。此表 ,这篇论文允许因子个数随着功夫的变动而变动 ,也就是说变点前后可能有新的因子出现 ,也可能有旧的因子隐没 。估计步骤能够通过单一的两个步骤实现:首先 ,忽略变点 ,用主成分步骤估计因子 ,并用Bai 和 Ng(2002)提出的信息准则估计因子的数量 。其次 ,用其中的一个估计的因子(例如 ,占有最大特点值的因子)作为因变量 ,其余的因子作为自变量进行线性回归 。将因子载荷中突变点的估计转换为线性回归方程的突变点的估计问题 。因而能够用Group Fused Lasso的步骤(Qian 和 Su, 2016)将回归方程中所有突变点同时估计出来 。


该论文在理论上成立了变点估计量的一致性并推导了其渐进散布 。同时 ,数值仿照批注 ,与现有步骤的了局进行比力 ,该步骤在大幅度提升估计效能的同时得到相对较幼的估计误差 。最后 ,论文将该步骤使用到美国宏观经济的数据进行实证钻研 。这个数据集蕴含108个美国月度的宏观经济数据集 ,蕴含现实经济活动指标、价值、利率、钱币和信贷总量、股票价值和汇率等变量 。其功夫跨度从1959年1月份到2006年12月份 。通过建模和分析 ,该钻研鉴别出5个变点 ,别离是1979年9月、1983年9月、1990年11月、1995年7月和2000年5月 。这些变点对应于伊朗革命、大缓和时期、劳动出产率的提升和经济衰退等 。


Part.3

高维因子模型的多门限估计

思考高维因子模型结构不不变性的另表一种模型是最近被频仍钻研的门限因子模型 。门限因子模型和带有多变点的因子模型类似却又分歧 。一个重要的区别在于 ,变点模型的变动是产生在功夫维度上的 ,而门限模型则是允许因子载荷凭据门限变量的大幼产生变动 。所以 ,门限因子模型更适合于描述一些汗青沉复的景象 。在文件中 ,Ng和Wright(2013)仿照了一个切合高维门限因子模型的数据 ,以钻研非线性对贸易周期动态的影响 。Massacci(2017)和Liu和Chen(2020)思考了高维功夫序列的门限因子模型 ,其中如果功夫序列在两种状态之间切换 。Wu(2021)进一步将Massacci(2017)的分析拓展到一个带有多个门限的因子模型中 。门限因子模型不仅为降维提供了一个壮大的工具 ,还加强了建模的矫捷性 ,提供了一个更易于诠释和预测的框架 ,能够轻松捉拿潜在的非线性 。


高维多门限因子模型中载荷的建模具体为:

 

4560A00C6CDE80CA8331D786EC2_FD9B511A_1FD4.png?e=

这里的zt是可观测的门限变量 ,凭据其取值大幼因子模型被分成分歧的区造 。γ1, ... , γm是待估的门限值 。αi1, ... , αim+1为因子载荷λi在分歧区造上的取值 ,且相邻区造上的取值分歧 。


涂云东教授及其合作者2023年的另一篇文章对这种门限驱动的结构不不变性进行了具体地论述 ,并提供了一种创新的估计步骤(Ma和Tu, 2023b) 。仅仅借助于沉排、主成分分析和压缩估计 ,该步骤可能将门限的个数和参数值一致地估计出来 ,并且在操作上单一易执行 ,推算上也能大大提高效能 。估计步骤蕴含两个重要的步骤 。第一 ,文章通过将可观测的功夫序列xt依照门限变量zt的大幼进行沉排 ,将多门限因子模型转化为多变点因子模型;第二步使用涂云东教授提出的因子模型变点估计步骤 (Ma and Tu,2023a)鉴别变点 ,继而凭据变点的地位找到相应门限变量的致否决门限值进行估计 。具体的步骤介绍拜见Ma和Tu(2023b) 。


理论方面 ,他们证了然门限数量和估计值的一致性 。蒙特卡洛仿照批注该步骤在有限样本中估计得很好 。进而 ,文章将提出的步骤使用到分析美国金融市场数据的分析中 。数据跨度为1985年1月到2011年12月 ,共有324个月度观测值 。这里使用的门限变量zt是Baker等人在2016年提出的关于经济政策不确定性的衡量指标 。正如Baker等人所说 ,经济政策不确定性指数与国防、医疗保健、金融和基础设施建设等政策敏感部门的股价颠簸和就业有关 。倒佝策不确定性分歧时 ,金融市场的行为也相应有所分歧 ,因而文章中通过提出的多门限因子模型来钻研经济政策不确定性是若何影响金融市场 ,推算了多元非线性动态系统中的连通性(connectedness) (Massacci, 2017),评估了每个区造中因子的沉要性 ,最后也对比了门限因子模型和结构变点因子模型的有效性 。


图片




该表格截取自涂云东教授文章中(Table 5, Ma 和 Tu, 2023b) 。从该表能够看出 ,随着经济政策不确定性的增长 ,连通性逐步增长 ,这注明经济变量之间的有关性变强 ,可能会增长系统风险水平 。这一发现有利于风险的衡量和治理 。因子的个数在分歧区造中也有所分歧 。涂云东教授在文章中也分析了每段中因子所代表的具体寓意 ,发现与市场风险有关的变量在金融市场中阐扬着关键作用 。尤其是在第二个区造中 ,7个因子中有5个与风险有关 。此表 ,随着经济政策不确定性的增长 ,一些行业投资组合 ,如食品和煤炭行业 ,在金融市场中占据着越来越沉要的职位 。



J9集团国际(中国)-官方网站


涂云东 ,J9集团国际商务统计与经济计量系和北京大学统计科学中心联席教授 ,钻研员 。入选首批“日出东方”北大J9集团国际青年人才 ,教育部“长江学者嘉奖打算”青年长江学者 ,两次获评北京大学优良博士学位论文领导老师 。2012年获美国加州大学河边分校经济学博士学位 ,同年6月参与北大J9集团国际 。三十余篇学术论文颁发在Journal of Econometrics , Econometric Reviews , Journal of Business and Economic Statistics ,Oxford Bulletin of Economics and Statistics ,Statistica Sinica ,Journal of Empirical Finance ,Computational Statistics and Data Analysis等国际一流专业杂志 。理论钻研领域涵盖非参数/半参数计量经济模型 ,模型选择和模型均匀 ,网络数据建模 ,金融计量 ,信息计量经济学 ,模型设定检验等;利用钻研蕴含宏观经济预测 ,价值指数建模 ,网络数据分析 ,股票市场预测 ,新冠肺炎预测等 。


分享

010-62747206

J9集团国际2号楼

?2017 J9集团国际 版权所有 京ICP备05065075-1
【网站地图】