Skip to content
This repository has been archived by the owner on Jun 13, 2024. It is now read-only.

Commit

Permalink
再见,本科
Browse files Browse the repository at this point in the history
  • Loading branch information
Ernest DONG committed Apr 15, 2022
1 parent c212a46 commit 9c620f6
Show file tree
Hide file tree
Showing 14 changed files with 118 additions and 84 deletions.
20 changes: 11 additions & 9 deletions chap/chap1.tex
Original file line number Diff line number Diff line change
Expand Up @@ -10,15 +10,17 @@ \section{我国信用债违约回顾}
\caption{近年来部分影响较大的违约事件}
\centering
\begin{tabular}{lccc}
债券名称 & 违约日期 & 原因 & 影响 \\ \hline
11超日债 & 2014-03-05 & 过度扩张资金链断裂 & 打破刚兑的开始 \\
11天威MTN2 & 2015-04-21 & 经营亏损资不抵债 & 打破国企刚兑 \\
14波鸿CP001 & 2015-04-12 & “技术性”违约 & 首例“技术性违约” \\
15五洋债 & 2018-08-16 & 欺诈发行 & 首例公司债券欺诈发行案 \\
16民生投资PPN001 & 2019-01-29 & “技术性”违约 & AAA 债券违约第一例 \\
20永煤SCP003 & 2020-11-26 & 逃废债 & 河南全省融资环境恶化 \\
15天安人寿 & 2020-12-29 & 股东抽血 & 金融机构破刚兑付 \\
17幸福基业MTN001 & 2021-02-27 & 过度扩张遇宏观调控 & 地产债违约潮的开始 \\
\toprule
债券名称 & 违约日期 & 原因 & 影响 \\ \midrule
11超日债 & 2014-03-05 & 过度扩张资金链断裂 & 打破刚兑的开始 \\
11天威MTN2 & 2015-04-21 & 经营亏损资不抵债 & 打破国企刚兑 \\
14波鸿CP001 & 2015-04-12 & “技术性”违约 & 首例“技术性违约” \\
15五洋债 & 2018-08-16 & 欺诈发行 & 首例公司债券欺诈发行案 \\
16民生投资PPN001 & 2019-01-29 & “技术性”违约 & AAA 债券违约第一例 \\
20永煤SCP003 & 2020-11-26 & 逃废债 & 河南全省融资环境恶化 \\
15天安人寿 & 2020-12-29 & 股东抽血 & 金融机构破刚兑付 \\
17幸福基业MTN001 & 2021-02-27 & 过度扩张遇宏观调控 & 地产债违约潮的开始 \\
\bottomrule
\end{tabular}
\label{tab:defaults_in_history}
\end{table}
Expand Down
2 changes: 1 addition & 1 deletion chap/chap2.tex
Original file line number Diff line number Diff line change
Expand Up @@ -37,7 +37,7 @@ \subsection{评级指标}
如图\ref{fig:rating}所示,新发行债券有一半为最高评级 AAA 。
\begin{figure}[ht]
\centering
\includegraphics[width=0.9\linewidth]{./data/rating_from_2014.png}
\includegraphics[width=0.7\linewidth]{./data/rating_from_2014.png}
\caption{\label{fig:rating}信用债发行评级统计}
\end{figure}

Expand Down
23 changes: 14 additions & 9 deletions chap/chap4.tex
Original file line number Diff line number Diff line change
Expand Up @@ -19,12 +19,13 @@ \section{基准模型回归结果}
我国宏观政策很多是以稳为主的逆周期调节。因此大多数属逆周期的宏观政策对违约的解释力较低。
但是波动率显著,说明稳定的经济可以降低违约事件的发生,侧面显示出经济以稳为主的重要性。
\begin{figure}[ht]
\centering
\includegraphics[width=0.9\linewidth]{./data/渤海银行.png}
\caption{标记处为渤海租赁预测点}
\caption{预测违约概率分布}
\label{fig:bhyh}
\qquad \small{注:将6000余家企业按预测违约概率排序,标记处为渤海租赁预测点}
\end{figure}


\section{机器学习验证与比较}
违约实际上并非线性的因素叠加,包含了非线性的因素,如华夏幸福违约,既存在过度扩张导致现金流承压,又存在重要股东拒绝为其扩张买单,最终资金链断裂。虽然可以通过加入交互项刻画这种“同时发生”的作用,但会发生“维度灾难”,可用数据变得稀疏。
机器学习适合于提取其中非线性因素。但违约样本是偏态分布的,违约债只占约 1\%,通过神经网络等方式的机器学习极有可能会欠拟合或过拟合,使机器判断有误。
Expand All @@ -35,7 +36,7 @@ \section{机器学习验证与比较}

\begin{figure}[ht]
\centering
\includegraphics[width=.9\linewidth]{./data/decision_tree.png}
\includegraphics[width=\linewidth]{./data/decision_tree.png}
\caption{\label{fig:decision_tree}决策树}
\end{figure}

Expand All @@ -47,21 +48,25 @@ \section{机器学习验证与比较}
\caption{\label{tab:acc}不同模型的比较}
\centering
\begin{tabular}{lrrrrr}
\toprule
& accuracy & error rate & precision & recall & \(F_1\) \\
\hline
\midrule
全部预测不违约 & 0.99 & 0.01 & - & 0 & - \\
Logistic(全样本) & 0.99 & 0.01 & 0.86 & 0.72 & 0.78 \\
Decision Tree(测试集) & 0.99 & 0.01 & 0.93 & 0.73 & 0.82 \\
Random Forest(测试集) & 0.99 & 0.01 & 0.85 & 0.70 & 0.76 \\
\bottomrule
\end{tabular}
\end{table}

\ref{tab:acc}中准确率 accuracy 为预测正确的概率,精确率 precision 为预测违约的样本中确实违约的概率,召回率 recall 为事实违约样本中预测正确的概率。精确率和召回率是两个不同方面的分类器评价指标,他们的调和平均 \(F_1\) > 0.5 则说明该分类器是有效的。表\ref{tab:acc}中准确率与全部预测不违约的 0.99 相同,这是由于样本分布偏态造成的。但 \(F_1\) 值均高于 0.5 ,证明本文使用的三个分类器都有一定的价值。且决策树算法相对优于其他算法。
决策树优于 Logit 模型算法在于其包含了非线形因素分枝。
而随机森林可能存在一定的训练集上的过拟合,因而表现出的性能较决策树更低。
如图\ref{fig:roc}所示,ROC 曲线的含义是设定任意阈值,得到的真阳性率和假阳性率。随后不断更改阈值,得到 ROC 曲线。AUC 定义为 ROC 曲线下的阈值,AUC面积越大一般认为模型拟合越好。可以看出在训练集上随机森林模型可能存在一定的过拟合,导致 AUC 达到 0.99 ,而 Logit 模型在训练集上表现不佳。
\begin{figure}[ht]

\begin{figure}[H]
\centering
\includegraphics[width=.9\linewidth]{./data/roc.png}
\includegraphics[width=.7\linewidth]{./data/roc.png}
\caption{\label{fig:roc}ROC曲线与AUC值}
\end{figure}

决策树优于 Logit 模型算法在于其包含了非线形因素分枝。
而随机森林可能存在一定的训练集上的过拟合,因而表现出的性能较决策树更低。
如图\ref{fig:roc}所示,ROC 曲线的含义是设定任意阈值,得到的真阳性率和假阳性率。随后不断更改阈值,得到 ROC 曲线。AUC 定义为 ROC 曲线下的阈值,AUC面积越大一般认为模型拟合越好。可以看出在训练集上随机森林模型可能存在一定的过拟合,导致 AUC 达到 0.99 ,而 Logit 模型在训练集上表现不佳。
2 changes: 1 addition & 1 deletion chap/chap5.tex
Original file line number Diff line number Diff line change
Expand Up @@ -18,7 +18,7 @@ \chapter{稳健性检验}

稳健性经验的部分结果如表
\ref{tab:robust}
所示,与表 \ref{tab:Logitresult} 相比基本一致,仅 SHIBOR 利率变为显著,\(X_1\)\(X_4\) 均显著,说明 \(Z\) 值中的其他成分均具有一定的预测能力,而非只是受到主营收入的影响导致显著,假设 H\ref{hyp:1}不成立。
所示,与表 \ref{tab:Logitresult} 相比基本一致,且\(X_1\)\(X_4\) 均显著,说明 \(Z\) 值中的其他成分均具有一定的预测能力,而非只是受到主营收入的影响导致显著,假设 H\ref{hyp:1}不成立。

事实上,\(Z\) 值反应了公司的变现能力、获利能力和财务结构,因而 Altman 使用其来对企业的运行状况进行分析。
公司的变现能力高意味着短期可以依靠出售资产回笼流动资金,避免流动性危机。典型的反例是土储集中在城郊地区的提前于行业倒下的泰禾地产,暴雷之后低价甩卖资产进一步恶化财务状况引发更多违约。
Expand Down
41 changes: 23 additions & 18 deletions chap/desc_table.tex
Original file line number Diff line number Diff line change
@@ -1,10 +1,12 @@
%!TEX root = ../thesis.tex
全局性描述结果如表\ref{globaldesc}与表 \ref{virtual}\footnote{所有变量均为虚拟变量} 所示

\begin{table}[ht]
\caption{主要变量及其描述性统计 I }
\label{globaldesc}
\begin{tabular}{p{0.15\linewidth}p{0.1\linewidth}p{0.15\linewidth}p{0.15\linewidth}p{0.15\linewidth}p{0.15\linewidth}}
\textbf{变量名} & \textbf{样本数} & \textbf{平均值} & \textbf{标准差} & \textbf{最小值} & \textbf{最大值} \\\hline
\toprule
\textbf{变量名} & \textbf{样本数} & \textbf{平均值} & \textbf{标准差} & \textbf{最小值} & \textbf{最大值} \\ \midrule
\(Fiscal\) & 6412 & 0.211069 & 0.04211 & 0.092627 & 0.286154 \\
\(Monetary\) & 6412 & 3.117273 & 0.64046 & 1.885274 & 4.774387 \\
\(Volatility\) & 6412 & 23.51951 & 4.769809 & 11.29499 & 41.50071 \\
Expand All @@ -16,32 +18,35 @@
\(Conversion\) & 6412 & 0.021204 & 0.123949 & 0 & 0.99 \\
\(Assets\) & 6412 & 1877755 & 9023818 & -3594115 & 5.64E+08 \\
\(Cash\) & 6412 & 0.99765 & 37.29003 & 0 & 2982.515 \\
\(Z\) & 6412 & 1.373761 & 3.01916 & -56.178 & 202.0643
\(Z\) & 6412 & 1.373761 & 3.01916 & -56.178 & 202.0643 \\
\bottomrule
\end{tabular}
\end{table}
\begin{table}[ht]
\caption{主要变量及其描述性统计 II }
\label{virtual}
\begin{tabular}{p{0.3\linewidth}p{0.3\linewidth}p{0.3\linewidth}}
\textbf{变量名} & \textbf{样本数} & \textbf{占比} \\\hline
\(R_0=Rating is AA\) & 1127 & 0.175764 \\
\(R_1=Rating is A\) & 5082 & 0.7925764 \\
\(R_2=Rating is B\) & 78 & 0.012165 \\
\(R_3=Rating is C\) & 125 & 0.019495 \\
\toprule
\textbf{变量名} & \textbf{样本数} & \textbf{占比} \\ \midrule
\(R_0=Rating is AA\) & 1127 & 0.175764 \\
\(R_1=Rating is A\) & 5082 & 0.7925764 \\
\(R_2=Rating is B\) & 78 & 0.012165 \\
\(R_3=Rating is C\) & 125 & 0.019495 \\
\(E_0=Enterprise is\)民营企业 & 1146 & 0.178727 \\
\(E_1=Enterprise is\)国有企业 & 4938 & 0.770119 \\
\(E_2=Enterprise is\)外资企业 & 178 & 0.02776 \\
\(E_3=Enterprise is\)集体企业 & 126 & 0.019651 \\
\(Listed=1\) & 1393 & 0.217249 \\
\(Estate=1\) & 173 & 0.026981 \\
\(Y_1=Year is 2015\) & 320 & 0.049906 \\
\(Y_2=Year is 2016\) & 418 & 0.06519 \\
\(Y_3=Year is 2017\) & 346 & 0.053961 \\
\(Y_4=Year is 2018\) & 307 & 0.047879 \\
\(Y_5=Year is 2019\) & 451 & 0.070337 \\
\(Y_6=Year is 2020\) & 927 & 0.144573 \\
\(Y_7=Year is 2021\) & 2767 & 0.431535 \\
\(Y_8=Year is 2022\) & 674 & 0.105115 \\
\(default=1\) & 173 & 0.026981 \\
\(Listed=1\) & 1393 & 0.217249 \\
\(Estate=1\) & 173 & 0.026981 \\
\(Y_1=Year is 2015\) & 320 & 0.049906 \\
\(Y_2=Year is 2016\) & 418 & 0.06519 \\
\(Y_3=Year is 2017\) & 346 & 0.053961 \\
\(Y_4=Year is 2018\) & 307 & 0.047879 \\
\(Y_5=Year is 2019\) & 451 & 0.070337 \\
\(Y_6=Year is 2020\) & 927 & 0.144573 \\
\(Y_7=Year is 2021\) & 2767 & 0.431535 \\
\(Y_8=Year is 2022\) & 674 & 0.105115 \\
\(default=1\) & 173 & 0.026981 \\
\bottomrule
\end{tabular}\\
\end{table}
14 changes: 8 additions & 6 deletions chap/logit_table.tex
Original file line number Diff line number Diff line change
@@ -1,10 +1,11 @@
%!TEX root = ../thesis.tex
\begin{table}
\caption{Logit 模型回归结果\label{tab:Logitresult}}
\begin{center}
\begin{longtable}{lllll}
\hline
\caption{Logit 模型回归结果\label{tab:Logitresult}}
\begin{tabular}{lllll}
\toprule
& Default I & Default II & Default III & Default IIII \\
\hline
\midrule
\(Const\) & -5.8949*** & -2.5416** & -2.5158** & -7.4246*** \\
\(R_1\) & 0.2259 & 0.1437 & 0.1731 & 0.1555 \\
& (0.6159) & (0.7092) & (0.7098) & (0.7104) \\
Expand Down Expand Up @@ -46,7 +47,8 @@
& & & & (0.4002) \\
\(Volatility\) & & & & 0.0670** \\
& & & & (0.0335) \\
\hline
\end{longtable}
\bottomrule
\end{tabular}
\end{center}
\qquad \small{注:括号中为异方差稳健标准误下的 Z 值;***,**,*分别表示回归系数在1\%、5\%和10\%的水平上显著,下同。}
\end{table}
33 changes: 8 additions & 25 deletions chap/robust_table.tex
Original file line number Diff line number Diff line change
@@ -1,33 +1,16 @@
\begin{center}
%!TEX root = ../thesis.tex
\begin{table}
\captionof{table}{稳健性检验结果\label{tab:robust}}
\begin{longtable}{p{0.1\linewidth}p{0.18\linewidth}p{0.1\linewidth}p{0.1\linewidth}p{0.1\linewidth}p{0.12\linewidth}p{0.1\linewidth}}
\midrule
\begin{tabular}{p{0.1\linewidth}p{0.18\linewidth}p{0.1\linewidth}p{0.1\linewidth}p{0.1\linewidth}p{0.12\linewidth}p{0.1\linewidth}}
\toprule
& \textbf{coef} & \textbf{std err} & \textbf{z} & \textbf{P$> |$z$|$} & \textbf{[0.025} & \textbf{0.975]} \\
% \textbf{const} & -3.8725 & 1.252 & -3.092 & 0.002 & -6.327 & -1.418 \\
% \textbf{评级\_A以上} & -0.0382 & 0.318 & -0.120 & 0.904 & -0.661 & 0.585 \\
% \textbf{评级\_B} & 1.4849 & 0.187 & 7.938 & 0.000 & 1.118 & 1.852 \\
% \textbf{评级\_C} & 3.6740 & 0.228 & 16.102 & 0.000 & 3.227 & 4.121 \\
% \textbf{国有企业} & -1.6422 & 0.398 & -4.128 & 0.000 & -2.422 & -0.862 \\
% \textbf{外资企业} & -1.1744 & 0.467 & -2.514 & 0.012 & -2.090 & -0.259 \\
% % \textbf{民营企业} & -0.7078 & 0.385 & -1.839 & 0.066 & -1.462 & 0.046 \\
% \textbf{集体企业} & -1.2313 & 0.534 & -2.307 & 0.021 & -2.277 & -0.185 \\
% \textbf{上市企业} & -0.1945 & 0.192 & -1.014 & 0.310 & -0.570 & 0.181 \\
% \textbf{持有基金占比} & -0.0783 & 0.080 & -0.973 & 0.331 & -0.236 & 0.079 \\
% \textbf{大股东持股比例} & -0.0013 & 0.003 & -0.508 & 0.611 & -0.006 & 0.004 \\
% \textbf{应付账款(万元)} & 1.409e-12 & 2.48e-12 & 0.567 & 0.570 & -3.46e-12 & 6.28e-12 \\
% \textbf{标准券折算率} & -0.3647 & 0.651 & -0.560 & 0.575 & -1.640 & 0.911 \\
% \textbf{净资产(万元)} & 9.314e-09 & 1.1e-08 & 0.847 & 0.397 & -1.22e-08 & 3.09e-08 \\
% \textbf{现金短债比} & -0.1082 & 0.133 & -0.816 & 0.415 & -0.368 & 0.152 \\
% \textbf{流动性} & -5.276e-11 & 6.63e-11 & -0.796 & 0.426 & -1.83e-10 & 7.72e-11 \\
% \textbf{政府支出/GDP} & 1.2248 & 2.087 & 0.587 & 0.557 & -2.866 & 5.315 \\
% \textbf{SHIBOR} & 0.3573 & 0.190 & 1.881 & 0.060 & -0.015 & 0.730 \\
% \textbf{波动率} & 0.0341 & 0.016 & 2.135 & 0.033 & 0.003 & 0.065 \\
% \textbf{房地产政策} & 0.7415 & 0.411 & 1.805 & 0.071 & -0.064 & 1.547 \\
\midrule
\textbf{X1} & -0.0083*** & 0.003 & -3.009 & 0.003 & -0.014 & -0.003 \\
\textbf{X2} & -0.0037** & 0.002 & -2.375 & 0.018 & -0.007 & -0.001 \\
\textbf{X3} & -0.0062* & 0.004 & -1.638 & 0.091 & -0.014 & 0.001 \\
\textbf{X4} & -0.0064*** & 0.002 & -3.917 & 0.000 & -0.010 & -0.003 \\
\textbf{X5} & 0.0005 & 0.001 & 0.530 & 0.596 & -0.001 & 0.002 \\
\bottomrule
\end{longtable}
\end{center}
\end{tabular}
\qquad \small{注:括号中为异方差稳健标准误下的 Z 值;***,**,*分别表示回归系数在1\%、5\%和10\%的水平上显著,下同。}
\end{table}
Loading

0 comments on commit 9c620f6

Please sign in to comment.