惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - Life·Intelligence

SSHFS + VS Code 挂载集群代码目录(macOS)| 集群vibe coding - Life·Intelligence OpenClaw 多 Channel 实战总结(Windows 环境) OpenClaw Windows 安装与 Debug 最终版教程(适用于 MiniPC i3-N305 / 无 GPU) miniconda转miniforge | conda | license LightDock | 蛋白质-多肽对接 | peptide-protein docking 蛋白结构预测 | alphafold | colabfold | docking 全栈生信 | PyMol使用教程 细胞通讯推断 | CCI | CellChat | CellphoneDB | iTALK | NicheNet ChromHMM教程 极简 | GRN | SCENIC | pySCENIC | 安装使用最新版scenicplus - Life·Intelligence Linux下载zenodo数据 共定位 | colocalization 分析 | 表观因子 findOverlappingPeaks | peak取交集操作 根据基因名批量查询下载PDB蛋白结构数据库 R小技巧汇总 Signac处理bulk ATAC-seq数据 - Life·Intelligence Differential motif enrichment | CentriMo | meme 亚马逊云 | AWS S3 | 基本操作 ATAC-seq | TOBIAS | footprint分析
TCGA+GTEx基因表达数据合并 | 多癌种表达分析
Life·Intelli · 2024-04-11 · via 博客园 - Life·Intelligence

2025年01月08日

新的探索

gepia2的Python包无法使用,没法通过API得到数据

突然发现DEG列表可以全部导出,http://gepia2.cancer-pku.cn/#degenes,设置一下阈值即可。

我发现有极个别基因,如NME2,log2FC是相反的,跟我自己手动做的,不知道是为什么。绝大部分基因的相关性还是很强的。参考:http://localhost:17449/lab/tree/projects/public_resources/public_DB/DepMap-CRC-org-viability-screen.ipynb#muanual-vs-gepia 

检查了一个spatial的数据,我还是更相信gepia的结果。 

这个功能GEPIA2已经实现了,http://gepia2.cancer-pku.cn/#dataset

但问题是它的数据不能导出,原图太丑,不能直接发表,那就没办法了,只能自己下载数据作图了。

TCGA数据可以批量下载

GTEx数据也很容易下载

但如何把TCGA的cancer type比对到GTEx特点组织 ,还是有点难度的。

有些cancer没有对应的正常组织,有些正常组织也没有对应的癌症。

最终终于在这里找到了对应的表。

注意:

  • TCGA的数据还是很粗犷的,得到什么DEG完全取决你怎么比;
  • 得到靠谱DEG的前提:对比组选对了,样本量足够大,否则就是扯淡;

其实UCSC Xena已经把整合的数据整理好了,这里可以直接下载,省去了大量的curation的时间:

  • A combined cohort of TCGA, TARGET and GTEx samples
  • https://xenabrowser.net/datapages/?cohort=TCGA%20TARGET%20GTEx&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443 

奇怪的点:

  • UCSC Xena下载的TPM里居然有大量负数,扯淡了;
  • 最终可以用这个替代:RSEM expected_count (DESeq2 standardized)

小常识:TARGET data is intended exclusively for biomedical research using pediatric data

这是儿科的数据,可以过滤掉。

参考:http://localhost:17435/notebooks/data_center/public_DB/TCGA-GTEx-all-Cancers.ipynb 

参考: