中文医学NLP公开资源整理:术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/etc
- medical-news 中文医学新闻爬虫
- medical-books 中文LaTex开源医学书籍
- THUOCL 清华大学thunlp组医学词汇
- ICD-10-CN ICD-10中文对应
- OMAHA七巧板医学术语集样例数据
- 中文糖尿病标注数据集 包含实体标注和关系标注
- PKUSEG PKUSEG分词工具,模型支持选择医学
- cMeKG Chinese Medical Knowledge Graph
- 瑞金医院人工智能辅助构建知识图谱大赛 糖尿病相关的学术论文以及糖尿病临床指南的实体标注和抽取实体关系任务
- OMAHA知识图谱(药品适应症) 开放医疗与健康联盟(Open Medical and Healthcare Alliance,OMAHA)构建的药品与药品适应证的知识图谱数据
- 医疗知识图谱数据 医疗知识图谱数据(ownthink)
- 病人事件图谱数据集 病人事件图谱是一种新的基于RDF的医疗观察性数据表示模型,可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。使用三家上海三甲医院的电子病历数据,构建了包括3个专科、173395个医疗事件、501335个事件时序关系以及与5313个知识库概念链接的医疗数据集。
- 中文症状库 这是一个包含症状实体和症状相关三元组的数据集。中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。它还包含了中文症状与UMLS中概念的链接结果。
- 中医医案知识图谱 从医案中抽取临床知识构建知识图谱,帮助用户了解中医特色疗法,以及疾病(如“慢性胃炎”)的临床表现、相关疗法、相关养生保健方法等
- herbnet 面向中药研究,根据中药领域模型的特点,构建了一个包括中医疾病,方剂,中药, 中药化学成分,药理作用,中药实验,化学实验方法在内的中药本体。 进而,基于本体实现了一系列数据库的集成,从而构建了一个中药知识图谱。
- CCKS2017 面向中文电子病历的医疗实体识别及属性抽取数据集
- CCKS2018 面向中文电子病历的医疗实体识别及属性抽取数据集
- CCKS2019 数据下载 面向中文电子病历的医疗实体识别及属性抽取数据集