Science Score: 26.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
○CITATION.cff file
-
✓codemeta.json file
Found codemeta.json file -
○.zenodo.json file
-
✓DOI references
Found 2 DOI reference(s) in README -
○Academic publication links
-
○Academic email domains
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (3.3%) to scientific vocabulary
Keywords
Repository
我们的论文“基于知识图谱嵌入的阿尔茨海默病药物重定位研究”的代码。
Basic Info
Statistics
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
- Releases: 0
Topics
Metadata Files
README.md
AD-KGE
我们的论文“基于知识图谱嵌入的阿尔茨海默病药物重定位研究”的代码。
介绍
利用知识图谱嵌入模型研究阿尔茨海默病的药物重定位.
该工作已被中国药科大学学报录用, 不久将会发表.
数据
原始的 DRKG 知识图谱 ( 链接:https://pan.baidu.com/s/1KRSHPjdCXf8y-0PfIEoPcg 提取码:war6 )
配置环境
shell
$ git clone git@github.com:LuYF-Lemon-love/AD-KGE.git
$ cd AD-KGE/
$ conda env create -f environment.yaml
$ pip install -r requirements.txt
文件
code: 代码目录.
- 01-model: 训练模型.
- 01splitdataset.ipynb: 该脚本展示了如何划分 DRKG 数据集 (训练集、验证集、测试集). 需要的原始的知识图谱 (链接:https://pan.baidu.com/s/19kPh0kLL2X4HL30yjlm_vA 提取码:r4k5 )
- 02TrainTransE_l1.ipynb: 这个 notebook 展示了如何在 DRKG 上训练模型 (TransE_l1), 并利用网格搜索寻找到最优参数.
- 03TrainTransE_l2.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (TransE_l2), 并利用网格搜索寻找到最优参数.
- 04TrainTransR.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (TransR), 并利用网格搜索寻找到最优参数.
- 05TrainRESCAL.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (RESCAL), 并利用网格搜索寻找到最优参数.
- 06TrainDistMult.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (DistMult), 并利用网格搜索寻找到最优参数.
- 07TrainComplEx.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (ComplEx), 并利用网格搜索寻找到最优参数.
- 08TrainRotatE.ipynb: 该脚本展示了如何在 DRKG 上训练模型 (RotatE), 并利用网格搜索寻找到最优参数.
- 09TrainfinalmodelTransE_l1.ipynb: 该脚本展示了如何在 DRKG 上训练最终模型 (TransE_l1).
- 10TrainfinalmodelTransE_l2.ipynb: 该脚本展示了如何在 DRKG 上训练最终模型 (TransE_l2).
- 11TrainfinalmodelComplEx.ipynb: 该脚本展示了如何在 DRKG 上训练最终模型 (ComplEx).
- 12TrainfinalmodelRotatE.ipynb: 该脚本展示了如何在 DRKG 上训练最终模型 (RotatE).
- 02-analysis: 知识图谱嵌入向量分析.
- 01relationsimilarity_analysis.ipynb: 该脚本展示了如何分析训练的关系嵌入.
- 01relationsimilarityanalysissupplement.ipynb: 上面分析关系嵌入脚本的补充.
- 02entitysimilarity_analysis.ipynb: 该脚本展示了如何分析训练的实体嵌入.
- 03TransEl1edgesimilaritybasedonlinkrecommendation_results.ipynb: 该脚本展示了如何分析 TransE_l1 的关系类型推荐相似性 (Link Type Recommendation Similarity).
- 04TransEl2edgesimilaritybasedonlinkrecommendation_results.ipynb: 该脚本展示了如何分析 TransE_l2 的关系类型推荐相似性 (Link Type Recommendation Similarity).
- 05ComplExedgesimilaritybasedonlinkrecommendationresults.ipynb: 该脚本展示了如何分析 ComplEx 的关系类型推荐相似性 (Link Type Recommendation Similarity).
- 06RotatEedgesimilaritybasedonlinkrecommendationresults.ipynb: 该脚本展示了如何分析 RotatE 的关系类型推荐相似性 (Link Type Recommendation Similarity).
- result: 保存上面脚本的结果.
03-repurpose: 药物重定位.
prerequisites: 先决条件.
- disease.tsv: 是 drkg 的疾病实体文件, 总共 5103 个实体. 每一行是疾病实体名, 疾病英文名, 疾病中文名. 例如: 第一行中的 Disease::DOID:0050156, idiopathic pulmonary fibrosis, 特发性肺纤维化, 其中疾病实体名由实体类型 (Disease) 和源数据库的 ID 组成. 参考于原始 DRKG 知识图谱的 entity2src.tsv.
- relation.tsv: 是 drkg 的关系文件, 总共 107 个关系. 从第二行起, 每一行是关系的英文名和中文名. 例如: 第二行中的 DGIDB::ACTIVATOR::Gene:Compound, 激活剂, 其中英文关系名由源数据库名, 关系, 头尾实体组成. 参考于原始 DRKG 知识图谱的 relation_glossary.tsv.
- infer_drug.tsv: Drugbank 中的 FDA 批准的药物清单 (排除分子量 < 250 的药物), 来源于原始 DRKG 知识图谱.
- rawadtriples.ipynb 该脚本展示了如何提取 DRKG 中药物治疗 Alzheimer's disease 的三元组. 需要的原始的知识图谱 (链接:https://pan.baidu.com/s/19kPh0kLL2X4HL30yjlm_vA 提取码:r4k5 )
- drugtreatad.tsv: DRKG 中药物治疗 AD 的三元组集合. 利用 rawadtriples.ipynb 脚本生成.
- ad_drugs.txt: drugtreatad.tsv 中的药物集合. 利用 rawadtriples.ipynb 脚本生成.
最终训练的模型 (TransEl1, TransEl2, ComplEx, RotatE): 链接:https://pan.baidu.com/s/1-9o2ELys5T3rqC9UEKgkXg?pwd=jigj 提取码:jigj .
01TransEl1ADdrug_repurposing.ipynb: 该脚本展示了如何使用我们的预训练模型 (09TrainfinalmodelTransE_l1.ipynb) 进行药物重定位 (Alzheimer's disease), 其中 topk = 50.
02TransEl2ADdrug_repurposing.ipynb: 该脚本展示了如何使用我们的预训练模型 (10TrainfinalmodelTransE_l2.ipynb) 进行药物重定位 (Alzheimer's disease), 其中 topk = 50.
03ComplExADdrugrepurposing.ipynb: 该脚本展示了如何使用我们的预训练模型 (11TrainfinalmodelComplEx.ipynb) 进行药物重定位 (Alzheimer's disease), 其中 topk = 100.
04RotatEADdrugrepurposing.ipynb: 该脚本展示了如何使用我们的预训练模型 (12TrainfinalmodelRotatE.ipynb) 进行药物重定位 (Alzheimer's disease), 其中 topk = 50.
result: 保存上面脚本的结果.
05calculateoverlap.ipynb: 该脚本计算了四个个预训练模型 (transEl1, transEl2, ComplEx, rotatE) 药物重定位 (Alzheimer's disease) 结果重叠情况.
- 01-model: 训练模型.
引用
如果您发现 AD-KGE 对您的研究有用,请考虑引用以下论文:
``` @article{ZGYD202303009,
author = {卢艳峰 and 杨思瀚 and 莫鸿仪 and 侯凤贞},
title = {基于知识图谱嵌入的阿尔茨海默病药物重定位研究},
journal = {中国药科大学学报},
volume = {54},
number = {03},
pages = {344-354},
year = {2023},
issn = {1000-5048},
doi ={10.11665/j.issn.1000-5048.2023040305}
} ```
该仓库主要由Yanfeng Lu,Fengzhen Hou提供(按时间顺序排列)。
Reference
[1] Drug Repurposing Knowledge Graph (DRKG), link: https://github.com/gnn4dr/DRKG .
[2] OpenKE: An Open Toolkit for Knowledge Embedding, link: https://github.com/thunlp/OpenKE .
[3] DGL-KE: Training Knowledge Graph Embeddings at Scale, link: https://github.com/awslabs/dgl-ke .
Owner
- Name: CPU-DS
- Login: CPU-DS
- Kind: organization
- Repositories: 1
- Profile: https://github.com/CPU-DS
GitHub Events
Total
Last Year
Issues and Pull Requests
Last synced: 11 months ago
All Time
- Total issues: 0
- Total pull requests: 0
- Average time to close issues: N/A
- Average time to close pull requests: N/A
- Total issue authors: 0
- Total pull request authors: 0
- Average comments per issue: 0
- Average comments per pull request: 0
- Merged pull requests: 0
- Bot issues: 0
- Bot pull requests: 0
Past Year
- Issues: 0
- Pull requests: 0
- Average time to close issues: N/A
- Average time to close pull requests: N/A
- Issue authors: 0
- Pull request authors: 0
- Average comments per issue: 0
- Average comments per pull request: 0
- Merged pull requests: 0
- Bot issues: 0
- Bot pull requests: 0