欢迎来到【陈巍学基因】
我们这个节目，主要是给大家介绍
基因组学
和临床分子诊断的最新技术进展
今天要和大家谈的，是用CRISPR方法，
来寻找新的、可能的肿瘤药物
提出这个方法的，是加拿大Donnelly 
Centre的Traver Hart
Traver Hart把他的这项研究成果，发表
在《Cell》杂志2015年12月3日这一期上
论文的题目是
High-Resolution CRISPR Screens 
Reveal Fitness Genes
and Genotype-Specific Cancer 
Liabilities
我们这期节目，就主要围绕这篇文章
来进行讲解
文章的核心内容，就是用CRISPR方法
把几种肿瘤细胞系的几乎所有的基因
都做一遍敲除，也就是“Knock out”
然后用高通量测序，来看哪些基因被
敲除之后，细胞的生长会受到抑制
接下来，在几种肿瘤细胞系之间进行
比较
看哪个基因，是对一个特定细胞系的
生长，是必需的
而在别的细胞系当中，这个基因
是非必需的
那么，这个基因就可能是治疗这种
肿瘤的，潜在的、新的治疗靶点
我们先把CRISPR方法做一个介绍
最早是在细菌当中发现CRISPR现象的
细菌用这个系统（CRISPR）来保护它
自己，以抵抗病毒的感染
当细菌查觉到存在病毒DNA的时候
它就制造出两种短的RNA
其中一段（指导RNA），是含有与入侵
的病毒相匹配的序列
这两段RNA与一个叫CAS-9的蛋白形成
一个复合物
CAS-9是一个核酸酶
也就是可以切断DNA的酶
当被称为“指导RNA”的那个匹配RNA
在病毒基因当中找到目标序列的时候
CAS-9就把目标DNA给切断，让病毒失活
在过去几年，研究人员一直在研究
这个系统
认识到它不仅可以切断病毒的DNA
还可以在精确选定的位置，切断任意的
DNA序列
只要改变“指导RNA”的序列，就可以
匹配到要切的目标基因序列了
现在，不仅可以在试管当中实现切断
目标DNA
而且，还可以活的培养细胞当中，实现
切断目标DNA
一旦CAS-9复合物进入细胞核，它就会
形成一个套索结构
CAS-9会把DNA双链给打开，并且把它
匹配到“指导RNA”上
匹配完之后，CAS-9会用2个很小的
分子剪刀，把DNA切断
当“切断”发生后，细胞会试着修复
断点
但是在修复过程当中，就很可能会引入错误
这个错误，会导致基因失活
通过让基因失活，就达到了基因敲除
（Knock Out）的目的
研究人员就可以用这个方法，来研究
基因的功能
接下来，我们来看Traver的全基因组
范围内的基因敲除工作
Traver根据基因对细胞生长的必要性，
做了一个雏菊模型
首先，定义“保健基因”，也就是
“Fitness gene”
那么保健基因，就是当这个基因失去
活性的时候
细胞的繁殖、生长就会受到伤害
在这张图当中，一种组织、或者一种
细胞，它所有的保健基因，就组成一个椭圆
那么多种组织的多个椭圆交叉在一起，
就形成一个稚菊花朵的样子
雏菊花朵的核心，就是各种细胞生长
都需要的、共有的基因
这组成了一个核心
这里面包含的基因，就是“核心保健
基因”，Core fitness gene
任何组织，只要少了这个基因（核心
保健基因），其繁殖、生长都会受到伤害
我们再来说“条件保健基因”，
context-specific fitness gene
就是在一种特定的遗传背景条件下、
或者在特定的周围环境条件下
缺失这种基因的功能，会导致细胞的
死亡、或者不生长
这些条件保健基因，就是在本研究当中，
让研究人员最关心的基因
因为抑制这些基因的活性，就有可能
杀死、或者抑制肿瘤细胞
同时又不影响别的正常细胞的生存、
和增殖
接下来，介绍实验方法
第1步，是设计敲除文库序列
也就是针对每一个要敲除的目标基因，
对它的外显子，来设计敲除序列
第2步，设计好文库之后，用芯片
合成法，高通量地合成序列文库
第3步，对这些序列文库进行PCR扩增，
得到拷贝数倍增的PCR扩增库
第4步，把扩增库连接到pLCKO
质粒载体当中
第5步，把质粒转化进大肠杆菌中，
进行扩增
扩增后的质粒库，是含有多种文库序列
的混合质粒库
pLCKO载体有嘌呤霉素（Puromycin）
的抗性基因
未来可以用于对被转化的肿瘤细胞进行
抗性筛选
同时pLCKO载体上有慢病毒包装蛋白的
结合序列
未来，可以与慢病毒包装蛋白相结合，
包装成能够感染细胞的慢病毒颗粒
第6步，用慢病毒蛋白对这些质粒文库
进行包装
包装好之后，就得到了有感染性的
病毒颗粒
第7步，用包装好的慢病毒颗粒去转染
目标细胞
第8步，被转染后的目标细胞，用
嘌呤霉素进行筛选
那么，能够活下来的细胞，就是有
嘌呤霉素抗性的
也就是被转染成功的细胞，同时它里面
也会含有gRNA的序列
第9步，将筛选之后的细胞，分成
若干个培养瓶，进行培养
第10步，每三天，取一批细胞，抽提
它的基因组DNA
每一批，至少是三个生物学重复
第11步，对抽提出来的基因组DNA，用
针对gRNA序列的引物，进行PCR扩增
把细胞当中的gRNA序列，扩增出来
第12步，对扩增出来gRNA，进行
高通量测序
然后，进行生物信息学的分析
实验预期当中，针对保健基因的gRNA
的量会下降
而针对非保健基因的gRNA的量会不变
原因是，如果一个细胞的保健基因
被敲除
接下来这个细胞的繁殖、生长都会
受到影响
甚至细胞就会直接死亡
那么寄居在其中的gRNA的量，也会
随着细胞数的下降而下降
反之，如果敲除掉的基因是非保健基因，
那么这些细胞照常生长
寄居在其中的gRNA，它的数量也
不会改变
这里，说一下敲除文库的设计
在Traver的这个实验当中，设计了两套
文库
第一套，是对序列的限制条件比较严格的，
目的是可以减少脱靶敲除的发生
但是，因为对序列的限制条件较严格，
所以得到的序列数也就较少
他的设计的限制条件如下
第1，他所设计的gRNA，最后4个碱基
是不含U碱基的
因为Traver发现，在gRNA的最后4个
碱基当中，如果有U碱基
那么敲除效率就会低许多
第2条，排除GC比例低于45%的序列，
同时也排除GC比例高于70%的序列
第3条，在引导区和它旁边的间隔区的
序列（guide-plus-PAM区域）
如果允许2个碱基的错配的话
在基因组上，只能有目标基因这一个
基因（与指导序列相匹配）
不会有其它的基因（与指导序列相匹配）
这样设计，是为了尽量减少脱靶敲除
的发生（意外地敲除非目标基因）
第4条，一个基因最多设计6个
gRNA序列
最后，是得到了一个，针对17232个
基因，有91320条gRNA序列的一个库
这套文库，被称为是“90K文库”，
因为有9万多个gRNA序列
第二套文库，采取了略为放宽的限制
条件，以便能够覆盖更多的基因
他的基本限制原则和上面的90K（文库）
的原则是一样的
但是在碱基错配的这个容错度上
放宽到容许1个碱基错配（不会与
非目标基因匹配上）
同时，对一个基因设计的gRNA序列数
的上限，从前面的6个，放宽到12个
最后，他得到了一个针对17661个基因，
有176,500个gRNA序列的这样一个库
这套库，被称为是“TKO文库”
是“Toronto KnockOut”的首字母缩写
因为这项工作是在Toronto做的
在这篇文章当中，一共用6种肿瘤细胞系
做了实验
第1种，GBM细胞，
它是人神经胶质母
细胞瘤的细胞
第2种，RPE1，
它是视网膜
上皮细胞瘤（细胞）
第3种，HCT116细胞，
它是人结肠肉瘤细胞
第4种，DLD1（细胞），
它也是人结肠肉瘤细胞
第5种，Hela细胞，
人宫颈癌细胞系
第6种，A375细胞，
人的黑色素瘤细胞，
也就是皮肤癌细胞
一共是5种组织来源，
共6种肿瘤细胞系
Traver把实验当中，各个组织当中的
保健基因汇总起来，做成雏菊模型
被三种或三种以上的细胞系共享的（保健）
基因，就被定义成“核心保健基因”
这样一共找到1580个核心保健基因
对于找到的核心基因进行GO分析，
也就是Gene Ontology分析
发现它们大量集中在转录、翻译、
DNA复制、DNA修复方面
而且，集中度比别的功能高4倍以上
这些功能，都是管细胞生长的
细胞对于被敲除这些基因很敏感，是
意料之中的事
与核心保健基因相反的是
在细胞与细胞之间的信号交流、
器官发育、细胞粘附方面的基因
在GO分析的结果当中，集中度比
普通基因要少4倍以上
这照我陈巍的理解，这也是合情合理的
之所以一种细胞变成肿瘤细胞
就是因为它对旁边的细胞不管不顾，
只管自己的生长
这样的细胞就成了肿瘤
所以，在肿瘤细胞当中，往往是负责
细胞与外界沟通的那些基因出了问题
所以，现在发现，肿瘤细胞对于被敲除那些
负责细胞与外界沟通的基因，很不敏感
就是再正常不过的事情了
接下来，就是今天要谈的重点：
在这篇文章中，找到了哪些
未来有可能用药物治疗肿瘤的新途径
第1个发现，是有KRAS G13D突变的
肿瘤细胞DLD1，对EGFR抑制剂敏感
首先，我们来看KRAS信号通路图
KRAS处于细胞生长调控的一个较为核心
的位置
一般认为，EGFR要激活下游的
细胞增殖信息途径
要先经过SHC/GRB 2/SOS等
中间环节，然后活化KRAS
再由KRAS激活下游信号路径
第二，是一般情况下，对KRAS的认识：
KRAS是一个开关，通过磷酸化、或
去磷酸化，而被活化、或者去活化
但是，如果KRAS的第13位的甘氨基酸
残基被突变成天冬氨酸残基（G13D突变）
则KRAS就变成一个持续活化的状态
这时候，无论上游的EGFR是否打开
都不能关闭这个已经突变了的、
活化的KRAS
也是基于这样的认识
目前在临床上
那些作用机理为EGFR抑制剂的肿瘤药物，
例如：厄洛替尼（erlotinib）
在用药之前，一般先要测一下KRAS
的第12号和第13号氨基酸是否有突变
如果发现KRAS的第12号、或者第13号
氨基酸有活化突变
那么就认为：EGFR抑制剂类的药物
对这种肿瘤没有用的
这就是学术上、和临床上，对KRAS
这个基因的作用原理的认识
也是临床上，对KRAS相关的抗癌药物
的用药方法的一般认识
但是Traver在实验当中发现，DLD1细胞
对EGFR的Knock Out很敏感
他感到非常吃惊
之所以吃惊，是因为DLD1细胞是有
KRAS G13D突变的
也就是说，按照现有的理论，DLD1细胞，
因为有KRAS的G13D突变
所以应该对EGFR的敲除不敏感
但是现在，广谱的CRISPR的敲除实验，
给出了不同的实验结果
Traver对实验结果进行了进一步的分析
发现DLD1细胞，对EGFR传递信号到
KRAS过程当中，经过的那些基因
也就是“SHC1、GRB2、和SOS1”，
也都很敏感
从信号传导路径的图上看
这几个基因，都是从EGFR到KRAS的
信号通路的中间环节
再进一步的实验，用EGFR的抑制剂
erlotinib，来处理这6个细胞系
发现，DLD1细胞系对erlotinib
特别敏感
而别的细胞系，对erlobinit不敏感
也就是说，erlobinit可以选择性地抑制
DLD1细胞的生长
而对别的细胞没有、或者很少抑制作用
而有选择地抑制肿瘤细胞，
同时对别的细胞的生长没有影响
正是寻找治疗肿瘤药物的首要标准
相比之下，同样也是结肠癌的另一个
细胞系，HCT116
它同样也有KRAS G13D突变，这个
细胞系就对EGFR的敲除不敏感
用erlotinib来处理HCT116细胞系
发现HCT116细胞，对erlotinib不敏感，
照长不误（这与EGFR敲除结果相一致）
也就是说，以前理论上认为，那些
KRAS有活化突变的肿瘤
一般都是对EGFR抑制剂耐药的
那么现在看来，未必是这样
如果能够用某种技术手段，例如：通过
体外培养细胞的基因敲除方法
来搞清楚肿瘤细胞对EGFR活性的依赖性
那么EGFR抑制剂，还是可以适用于
部分KRAS有活化突变的肿瘤的
这是Traver的这篇文章提示的，第一个
可能的，肿瘤药物的新的适应症
接下来，我们来看第2个例子
经过分析发现，在Hela细胞当中
FGFR1，也就是fibroblast growth 
receptor 1，成纤维细胞生长受体1
是一个保健基因
而化合物PD173074是辉瑞公司研发的
一个化合物
现在，已知它是FGFR1的强抑制剂
用PD173074来处理这几种细胞，可以
发现Hela细胞的生长被明显抑制
而别的细胞被抑制得较少
再来看第3个例子
经过核心基因分析
发现，IGF1R，insulin-like growth 
factor 1 Receptor
胰岛素样生长因子1受体，是Hela细胞
和A375的保健基因
而它不是HCT116（细胞）的保健基因
用人工合成的抗IGF1R抗体，来阻断
IGF对IGF1R的激活作用
会降低Hela细胞和A375细胞的生存能力
而对HCT116细胞没有影响
再来看第4个例子
在HCT116细胞当中，GO分析发现
它对线粒体活性有高度的依赖
别是组成电子传递链复合物1的蛋白，
在它的GO分析中，被明显富集
鱼藤酮（rotenone）一种是细胞电子
传递链抑制剂
线粒体获得能量的主要方式，就是通过
电子传递链获得能量
接下来的实验，证明：
用鱼藤酮（rotenone）处理，对
HCT116细胞的生长有明显的抑制作用
而鱼藤酮对别的细胞系的抑制较少
二甲双胍（Metformin）是氧化磷酸化
的抑制剂
用二甲双胍来处理这些细胞，可以发现对
HCT116细胞的生长，有明显的抑制作用
而对别的细胞系的抑制较少
再来看第5个例子
经过GO分析，发现在DLD1细胞当中，
合成线粒体蛋白质的基因有高度的富集
化合物linezolid、和氯霉素，都是
已知的、细菌的核糖体功能抑制剂
用Linezolid处理，DLD1细胞系的生长
被明显抑制，而别的细胞几乎不受影响
用氯霉素处理，DLD1细胞系的生长
被明显抑制，而别的细胞受影响较少
我们知道，从生物演化的角度来说
真核生物获得线粒体过程，就是真核
细胞驯化了一个原核细胞，也就是细菌
并把这个原核细胞，圈养在真核细胞的
细胞胞内
逐步强化这个原核生物的有氧代谢、
生产ATP（能量单位）的能力
同时，逐步让这个原核细胞放弃了
它原来的其它功能
这个原核细胞，就渐渐地变成了我们
目前看到的线粒体
所以线粒体当中的基因有许多原核细胞
的特点，也就是有细菌的特点
Linezolid和氯霉素都能够抑制细菌
的蛋白质合成
所以，它（们）也就有可能抑制线粒体
的蛋白质合成过程
以上，就是这个CRISPR广谱敲除方法，
让我最感兴趣的地方
在细胞水平广谱地敲除基因，并进一步地
通过高通量测序、和生物信息分析的手段
找到可能的肿瘤治疗途径、和治疗药物
进一步联想出去，如果能够把培养
细胞系改到培养原代细胞
并且加快实验当中各步骤的速度
把整个实验缩短到一个月、甚至半个月
的时间
那么这个（CRISPR广谱敲除的）方法
还有可能成精准医学一个新的个体化
诊断方法
并且会极大地拓展药物的可选范围
在此，特别感谢我的两位同事
药明康德公司的董华博士、
和Sascha Karassek博士
他们向我推荐了这篇论文，并对
这篇论文进行了解读
以上是本期节目的全部内容
谢谢您的收看，我们下期节目再见
