Skip to content

Commit

Permalink
添加生存回归
Browse files Browse the repository at this point in the history
  • Loading branch information
endymecy committed Jul 3, 2017
1 parent 4230f81 commit d48dce2
Showing 1 changed file with 5 additions and 5 deletions.
10 changes: 5 additions & 5 deletions 分类和回归/生存回归/survival-regression.md
Original file line number Diff line number Diff line change
Expand Up @@ -11,16 +11,16 @@

  生存期不同于一般指标,他有二个特点:

- 1 有截尾数据(censored data)
- 1 有截尾数据(`censored data`)

  例如我们在疾病预测的实验中,随访未能知道病人的确切生存时间,只知道病人的生存时间大于某时间。

(1)病人失访或因其他原因而死亡---失访
(2)到了研究的终止期病人尚未死亡---终访

  例如,一个人的寿命。假设我关心1949年出生的人群的平均寿命。这群人可以被分成两部分。一部分是已经离世了,所以他们的死亡时间是准确知道的。因此,他们的寿命是非常清晰的。
另一部分,是所有健在的人群,他们从1949年出生到现在,已经走过了将近70个春秋岁月,但是他们还活着!到2017年为止,他们已经生存了68年,但是他们最终的寿命是多少?我们是不知道的。
我们知道他们的寿命一定会比68大,数学上可以被记作68+。但是,到底“+”多少,不清楚。
  例如,一个人的寿命。假设我关心`1949`年出生的人群的平均寿命。这群人可以被分成两部分。一部分是已经离世了,所以他们的死亡时间是准确知道的。因此,他们的寿命是非常清晰的。
另一部分,是所有健在的人群,他们从`1949`年出生到现在,已经走过了将近70个春秋岁月,但是他们还活着!`2017`年为止,他们已经生存了`68`,但是他们最终的寿命是多少?我们是不知道的。
我们知道他们的寿命一定会比`68`大,数学上可以被记作`68+`。但是,到底“+”多少,不清楚。

  虽然截尾数据提供的信息是不完全的,但不能删去,因为这不仅损失了资料,而且会造成偏性。

Expand Down Expand Up @@ -49,7 +49,7 @@
- 3 风险函数(`Hazard Function`)

  其定义为:`h(t)=lim(在时间t生存的病人死于区间(t,△t)的概率/△t)`,由于计算`h(t)`时,用到了生存到时间`t`这一条件,故上式极限式中分子部分是一个条件概率。
可将`h(t)`称为生存到时间`t`的病人在时间t的瞬时死亡率或条件死亡速率或年龄别死亡速率。当用t作横坐标`h(t)`为纵坐标所绘的曲线,如递增,则表示条件死亡速率随时间而增加,如平行于横轴,
可将`h(t)`称为生存到时间`t`的病人在时间`t`的瞬时死亡率或条件死亡速率或年龄别死亡速率。当用`t`作横坐标`h(t)`为纵坐标所绘的曲线,如递增,则表示条件死亡速率随时间而增加,如平行于横轴,
则表示没有随时间而加速(或减少)死亡的情况。

## 2 加速失效时间模型(AFT)
Expand Down

0 comments on commit d48dce2

Please sign in to comment.