二月 2005 - 文章

关于AccuPrime™ Pfx SuperMix的产品说明

把AccuPrime™ Pfx SuperMix的产品说明简单翻译一下:

AccuPrime™ Pfx SuperMix的优点

1. 扩增长度可达15kb,保真度超过Pfu。
2. 平时聚合酶与其抗体结合,无活性,直到PCR反应第一轮达到94°C的时候聚合酶与其抗体分离,重新获得活性,这样就达到了“热启动”的目的,可以提高反应的特异性、灵敏度、产量。
3. Thermostable AccuPrime™ 蛋白可以增强引物与模板杂交的特异性。
4. 由于AccuPrime™ Pfx SuperMix具有高特异性、高忠实度及高产量的特点,特别适合于做定点突变和用于表达的克隆。

推荐与指导
1.最适退火温度设定为比引物Tm低5-10°C,如有必要可提高2-3°C以提高特异性。
2.如果PCR效率不理想,可以以100 nM的增量在100-500 nM之间调节引物浓度。

PCR Protocol
每管中包括22.5 μl AccuPrime™ Pfx SuperMix;一对引物(推荐浓度:终浓度分别200 nM);模板10 pg–200 ng)(引物和模板的总体积在0.5 μl和7.5 μl之间时对PCR产量不会有影响)。

程序
95°C for 5 minutes
     35 cycles of:
             95°C for 15 seconds
             55–65°C for 30 seconds
             68°C for 1 minute per kb
Maintain reaction at 4°C after cycling.

 

Posted 作者 shininglake with 2 comment(s)

艾滋病研究的重大进展——SIV的非结合态gp120结构被解析

《Nature》2005年2月24日文章报道:与人的HIV高度相似的猴SIV病毒的膜蛋白gp120的非结合态核心结构被解析。

与寄主细胞CD4受体相结合的HIV(人免疫缺陷病毒)的包膜蛋白gp120的结构自1998年以来就已经为人们所知,但其在与受体结合之前的结构却仍然不清楚。现在,来自“猴免疫缺陷病毒”(SIV)的、未与受体结合的gp120终于被成功结晶,其结构也以4埃的分辨率被确定。

该蛋白的形状在结合态和非结合态很不相同:这种大尺度的结构变化可能是gp120用来躲避寄主免疫系统的花招之一。

HIV和SIV外壳是由gp160三聚体组成的20面体,在侵染受体细胞时gp160被剪切成gp120和gp41两部分,从而可以与细胞表面的受体CD4及共同受体CXCR4或CCR5结合。结合的第一步就是gp120的构象发生变化。gp120与CD4结合后的构象有利于共同受体与之结合,与共同受体结合后产生进一步的变化,gp120与gp41分离,后者位于膜外面的部分就与所要侵入的细胞表面的另一个受体(可以叫它F)结合,这一次结合就使病毒的外膜与宿主细胞的细胞膜发生了融合,接下来,病毒的核衣壳就顺利的进入了细胞。

比较SIV的非结合态gp120与HIV的结合态gp120结构,笔者认为差异主要不在于两者的序列差异,而在于与受体结合后gp120结构发生了变化。

这一成果既可以使我们对HIV侵染受体细胞的机理有更深入的了解,更重要的,有可能根据这一成果找到阻碍这一过程的分子,从而得到抗艾滋病的疫苗。

原文链接:

February 24, 2005
非结合态gp120的结构

与寄主细胞CD4受体相结合的HIV(人免疫缺陷病毒)的包膜蛋白gp120的结构自1998年以来就已经为人们所知,但其在与受体结合之前的结构却仍然不清楚。现在,来自“猴免疫缺陷病毒”(SIV)的、未与受体结合的gp120终于被成功结晶,其结构也以4埃的分辨率被确定。该蛋白的形状在结合态和非结合态很不相同:这种大尺度的结构变化可能是gp120用来躲避寄主免疫系统的花招之一。

Page: 834

 

Posted 作者 shininglake with 1 comment(s)

查询人类染色体位点信息

看到网上有人问如何查询人类染色体上一个位点的详细信息,在这里写一下,也许还有人用得着:

查询人类染色体位点信息的地方是GeneLoc:http://genecards.weizmann.ac.il/geneloc/

选择“Search GeneLoc by gene/marker name ”
输入你要查询的位点。
搜索后就可以看到详细的信息了

Posted 作者 shininglake with no comments

跨膜区预测

在Expasy中有好几个预测跨膜区的服务器,不过也没有好好比较过它们之间的差异。今天看到“医网琴声”介绍说:

当您已知某个蛋白质是跨膜蛋白而需要准确预测其跨膜片断的时候,使用EMBNET的TMpredhttp://www.ch.embnet.org/software/TMPRED_form.html最好。

如果您不知道某个蛋白质是否为跨膜蛋白而需要进行预测时请使用DAS-TMfilter serverhttp://mendel.imp.univie.ac.at/sat/DAS/)。

不过,我倒是常用TMHMM的(http://www.cbs.dtu.dk/services/TMHMM-2.0/)。

顺便说一句,我发现用SignalP来预测转运肽是不行的,和SWISS-PROT记录上标注的差异很大。可能用专门的ChloroP 、MITOPROT 、PlasMit 等要好些。

3.15补充:

贴一下CBS关于蛋白分拣的好几个预测工具:

Protein sorting

ChloroP  预测叶绿体转运信号
Chloroplast transit peptides and their cleavage sites
in plant proteins.
LipoP  预测革兰氏菌中的信号肽酶的剪切位点
Signal peptidase I & II cleavage sites in gram- bacteria.
NetNES   - new -  预测富含亮氨酸的核输出信号
Leucine-rich nuclear export signals (NES) in eukaryotic proteins.
SecretomeP  预测真核生物中非经典类型的和无导肽的分泌蛋白
Non-classical and leaderless secretion of eukaryotic proteins.
SignalP  预测革兰氏阳性菌、阴性菌、真核生物中信号肽
Signal peptide and cleavage sites in gram+, gram-
and eukaryotic amino acid sequences.
TargetP  蛋白的亚细胞定位:线粒体、叶绿体、分泌途径等。
Subcellular location of proteins: mitochondrial,
chloroplastic, secretory pathway, or other.

Posted 作者 shininglake with 2 comment(s)

忽闻噩耗

今天看BBS的一篇文章才知道山东大学全息生物学研究所所长张颖清教授于2004年去世了。新华社说他的成果很有希望获得诺贝尔奖,这一点我也不敢妄加评论,但他的讲座对我的影响却是很大的。

那是大学入学后听到的第一场学术报告,那神奇的全息生物学理论使我们领略到生命之奇妙,对生物学的兴趣空前高涨!虽然后来在生物领域几乎再也没有听到关于“全息生物学”的事情,但对于我来说,那是我大学时的“启蒙教育”。

Posted 作者 shininglake with no comments

Oligo性质计算工具

http://www.basic.nwu.edu/biotools/oligocalc.html

贴上Oligo序列后,会给出反向互补链、可携带荧光标记数目(这是荧光定量PCR所需要的吧)、发卡结构、BLAST、各种物理性质:长度、分子量、GC含量、光吸收值等,Tm值的计算还包括基本值、盐浓度调整后的值等,还有热力学性质计算。

Posted 作者 shininglake with 2 comment(s)

几个有趣的关于人体部位的英语

向后转:about face

五个手指的名字:

小指:the little finger

无名指:the ring finger

中指:the middle finger

食指:the index finger

大拇指:thumb.

Let's shake a leg=Let's dance,而希望别人抓紧时间时也可以说shake a leg,=hurry!

从头到脚不是from head to foot,而是from top to toe。

全文见http://www.ustcers.com/blogs/shininglake/articles/4974.aspx

发现在中文和英语中与人体部位相关的表达方式非常相似,比如“面子”、“皮厚”等,不过一些不同的地方就更加耐人寻味了。

Posted 作者 shininglake with 3 comment(s)

干细胞的再生能力

Nature上的一篇文章:

February 17, 2005
干细胞和源祖细胞的再生能力

年轻个体中身体组织再生较好,年老个体中身体组织再生较差。为了确定身体组织再生能力的这种下降是否是不可逆转的、是否可由循环系统中的因素来调节,Conboy等人将年幼和年老小鼠的循环系统连在一起,成为一个“异共生”对。令人吃惊的是,老化的肌肉和肝脏的再生性质因暴露于年幼小鼠的血清而变年轻了,同时还伴随着年轻的“分子标记”的恢复,其中涉及Notch信号作用(在肌肉中)和由cEBPalpha-调节的细胞周期调节(在肝脏中)。这说明,干细胞和源祖细胞即使老了也保持其大部分增殖潜力,分子信号通道调节的“年轻”模式能重新激发组织再生。

Page: 760

对这方面不太熟悉,不过很想知道:当“变年轻了的”年老干细胞脱离了年轻的系统环境后是否能继续保持年轻的再生能力?
Posted 作者 shininglake with 1 comment(s)

MIT的“蛋白质折叠”课程

http://ocw.mit.edu/OcwWeb/Biology/7-88JProtein-Folding-ProblemFall2003/CourseHome/index.htm

主要材料如下:

SES #

TOPICS

INSTRUCTOR

1

Introduction to the Problem (PDF)

JK

2

The Anfinsen Experiments (PDF)

JK

3

Globular Protein Structure/Interior Packing (PDF)

JK

4

Packing of Secondary Structures - JK (PDF)
The Protein Database (Fully Illustrated) - DG (PDF - 2.2 MB)

JK, DG

5

Packing of Secondary Structures: Beta-sheets and Beta-sheet Packing (PDF - 1.2 MB)

JK

6

Coiled Coils (Fully Illustrated) (PDF)

DG

7

S-peptide Helical Folding (PDF)

JK

8

S-peptide Helical Folding, (cont.) (PDF)

JK

9

Detecting Folding Intermediates (PDF)

JK

10

Cytochrome Refolding (PDF)

JK

11

Denaturation-aggregation (PDF)

JK

12

Collagen Structure (Fully Illustrated) (PDF - 1.8 MB)

DG

13

Chaperones and other Folding Helpers (PDF)

JK

14

Ribosomes and In Vivo Folding (PDF)

JK

16

Viruses (Fully Illustrated) (PDF - 2.1 MB)

DG

17

Amyloid Formation (Not Yet Available)

JK

18

Computational Approaches (Not Yet Available)

DG

Posted 作者 shininglake with 2 comment(s)

科学.玄学.杨振宁

早想写写自己对于“杨振宁事件”的看法,今天看到方舟子的一篇文章,顺便也就写一下。

乍听到老夫少妻的新闻不免惊愕,何况主角是杨振宁,这实在是茶余饭后的谈资。可是渐渐听到的一片谩骂声不免让我气愤起来:人家自己感情的事招谁惹谁了,怎么就成了“丑闻”?连大学里的学生也建议要推倒他的塑像,甚至恨不得要去扒他的祖坟了。随之又冒出多篇攻击杨振宁人品的文章,在历史中找寻他的“劣迹”。奇怪,怎么过去这么多年就没人批判他的人品呢?一下子都来了。

我想,文明的社会应该是一个在法制上严厉,在思想上宽容的社会。不要总带着固有的成见,就如同在科学上不要被固有思维禁锢。

推荐的这篇文章讨论的也是在研究生的政治课上常常讨论的问题:为什么近代科学没有在四大文明古国之一的中国萌芽?

原文:

杨

杨振宁:
在科学与玄学之间


作者 方舟子

原载《环球》半月刊2005.3



  杨振宁做为在华人当中知名度最高的当代科学家,一般人知道他的名字是由于他和李政道于1956年提出宇称不守恒理论,并在第二年迅速被授予诺贝尔物理学奖,颁奖速度之快在诺贝尔奖历史上可谓空前绝后。从此这两名年轻的中国物理学家(当时两人都还是中国国籍)被视为中华民族的骄傲而家喻户晓。在诺贝尔奖颁奖宴会上汉学家、瑞典王家科学院院士高本汉曾用一句“唐诗”“何可一日无此君”有点不伦不类地表示了这种敬仰之情(“何可一日无此君”最早出自《世说新语》,是王徽之评竹子的话)。

  物理学界更推崇杨振宁早在1954年与美国研究生米尔斯(已故)共同提出的“杨-米尔斯理论”。这个理论起初不受重视,在20世纪60年代后期日益显示出其重要性,成为粒子物理学最基本的理论和方程,被誉为可与牛顿、麦克斯韦和爱因斯坦的工作相媲美的伟大发现(1995年首届美国奖金最高的科学奖鲍尔奖授予杨振宁时的颁奖词)。为什么杨振宁没有因此再得诺贝尔奖,据说是物理学界的一件公案(一种说法是同一领域的诺贝尔奖一般不两次授予同一个人。另一种说法是米尔斯被认为不配得诺贝尔奖,但又不能只奖杨振宁一人)。此外,杨一巴克斯特方程也被认为是对物理和数学研究有广泛而深远的影响的成果,这是杨振宁在1967年和巴克斯特在1972年分别提出来的。

  因此杨振宁被一些物理学家评为历来屈指可数的大物理学家之一,也有人认为他的主要贡献都带着运气的成分。不过没有人会否认他对当代理论物理学研究的重大影响罕有其匹,虽然这种影响是圈外人所难以感受到的。但是杨振宁的影响力并不局限于物理学界。像许多大科学家,他极为关注、热心参与社会事务,特别是与中国有关的事务。1971年夏天,在中美关系正常化的前夕,杨振宁即访问中国,成为第一位访问新中国的美籍科学家。从此他致力于中美科技、教育交流,并经常对中国时事发表评论。今年年初杨振宁回国定居后,更是成为新闻焦点人物。他在清华大学为低年级本科生上物理课,频频在各种场合发表多方面的演讲,参与签署《甲申文化宣言》,都被广泛报道乃至引起争议。年底传出了82岁的杨振宁与28岁翻译系硕士生订婚的消息,更是成为中文网上一个热门话题。2004年没有另一位科技人物如此引人注目,是名副其实的“杨振宁年”。

  “苍苍白发对红妆”的佳话(或丑闻)虽然让人津津乐道,却只配做为饭后谈资,而且风波会很快平息。“炮轰易经”才是杨振宁在2004年所做的最有意义、最有影响的一件事。2004年9月3日杨振宁在北京人民大会堂“2004文化高峰论坛”上做题为《〈易经〉对中华文化的影响》的演讲,认为“《易经》影响了中华文化中的思维方式,而这个影响是近代科学没有在中国萌芽的重要原因之一”,一时舆论大哗,国学家、易学家们纷纷出来批评杨振宁不懂装懂、说外行话,甚至对杨振宁破口大骂。10月23日,在清华大学举办的“中国传统文化对中国科技发展的影响论坛”上,杨振宁再次阐明自己的观点并与与会者进行了激烈的争论。

  尽管中国古代对人类科技发展做出了很多重要贡献,但是为什么近代科学没有在中国萌芽?这个问题在科技史研究中被称为“李约瑟难题”。1953年爱因斯坦在致斯威泽(J.E.Switzer)的信中,曾经给出过一个答案:

  “西方科学的发展是以两个伟大的成就为基础的:希腊哲学家(在欧几里得几何学中)发明了形式逻辑体系,以及(在文艺复兴时期)发现通过系统的实验有可能找出因果关系。在我看来,人们不必对中国圣贤没能做出这些进步感到惊讶。这些发现竟然被做出来了才是令人惊讶的。”

  言下之意是,古代中国学者不懂得形式逻辑体系和实验验证,因此没能发展出近代科学并不令人惊讶。杨振宁实际上给出了一个类似的答案,只不过他把原因进一步归结为《易经》的影响。他认为近代科学没有在中国产生的原因有五条,其中两条与《易经》的影响有关:中国传统里面只有归纳法而无推演法(即演绎法)的思维方法;“天人合一”的观念。归纳与推演都是近代科学中不可缺少的基本思维方法,但是贯穿《易经》的精神,都是归纳法,而没有推演法。近代科学一个特点就是把自然规律与社会规律分开,而《易经》的“天人合一”观念却将天道、地道与人道混为一谈。

  许多国学家在批评杨振宁时,甚至连杨振宁的意思都没有搞清楚。例如著名易学家、山东大学哲学系刘大钧教授批评杨振宁的演讲“有很多常识性错误”,举例说:“众所周知,周易是最早的一部算卦的书,算卦的方法就是靠推演,举一反三,怎么能说没有推演呢?另外,周易是一本‘普世之书’。从这个角度,也是一种广义的‘推演’。”但杨振宁所说的推演法指的是逻辑推理,根据一些已成立的一般性命题严密地逐步推出较特殊的结论,例如在欧几里德几何中,由公理,定理,然后到证明等等。这显然和刘大钧说的周易算卦的推演完全不是一回事,虽然用了相同的名词。

  可见,杨振宁和爱因斯坦一样,把希腊哲学家发明的形式逻辑体系视为近代科学的源泉之一,并认为中国古代文化缺少这个源泉:“中国传统对于逻辑不注意,说理次序不注意,要读者自己体会出来最后的结论。”实际上,中国传统中不仅缺少合乎逻辑的严密推演法,也缺少合乎逻辑的严密归纳法。杨振宁认为易经的“取象比类”、“观物取象”是归纳法,其实这是在“天人合一”的神秘主义观念指导下的不合乎逻辑的类比法。例如:“枯杨生稊,老夫得其女妻,无不利。”(枯萎的杨树生出新芽,老年男子娶了年龄可当其女儿的年轻女子为妻,没有不利的。)、“枯杨生华,老妇得其士夫,无咎无誉。”(枯萎的杨树开花,老年女子嫁给年富力强的男子,没有祸害也不值得称道。)在“枯杨生稊”和“老夫得其女妻”、“枯杨生华”和“老妇得其士夫”这种天道和人道之间只有模糊的相似性,并不存在任何合乎逻辑的必然关系,由此归纳出的“无不利”、“无咎无誉”的结论更是站不住脚的(可以举出无数的反例加以推翻)。这种“推演”无非是男尊女卑的社会观念的反映,或许还有一些生理上的道理,但是与逻辑推理无关。

  中国传统的说理方式不具有逻辑性,是许多中外学者都已指出过的一个事实,这甚至可以从国学家们对杨振宁所做的胡搅蛮缠的反驳中体现出来。易经对这种非逻辑说理传统的影响有多大,是否是其源泉,是一个可以讨论的问题。杨振宁不过是对老学术问题提出了一些见解,为何引起如此大的风波?

  狭隘民族主义与伪科学相结合的思潮在中国虽然不像十几年前那么流行,但是仍然大有市场。风水、占卜、命理、天人感应、巫术等与易经有着千丝万缕的联系的传统迷信在死灰复燃的同时,又往往被披上迷人的科学外衣,甚至有人声称它们代表着“新科学”,至少也是“潜科学”、“类科学”。也有人论证易经是超前的科学著作,里面蕴涵着量子力学、相对论、计算机理论、遗传密码等众多重大科学发现。还有人要以易经指导科学研究,根据它提出“太极原子模型”,推演出“太阳系有十四颗大行星”,或要用它预测气象变化。

  杨振宁指出易经的思想和方法根本就与科学格格不入,甚至要为近代科学没有在中国产生承担罪责,自然也就否定了易经是“科学明珠”、“科学指南”、“科学预言书”种种无稽之谈。已有许多人做过类似的批评,有的批评要比杨振宁的演讲更严密、更尖锐、更全面、更有说服力。但是杨振宁做为人人敬仰的大物理学家登高一呼,其影响非同小可。特别是,杨振宁向来被视为具有极强的民族自尊心、热爱中华传统文化的海外华人(许多人可能还记得,1988年中国各大报纸都在显要位置刊登过杨振宁对电视片《河殇》的批评。这次又是《甲申文化宣言》的发起人之一),反戈一击,矛头直指被视为中华传统文化的源泉之一的易经,更要让易学家们恼羞成怒了。这实际上是自20世纪初以来科学与玄学之争的延续,能够引起如此大的反响,也反映出当今中国科学与玄学、科学与伪科学、科学与反科学的争斗的激烈程度。由于杨振宁的加入,大大增加了科学一方的力量,算得上是他为中国科学的发展做出的一个大贡献。

Posted 作者 shininglake with 4 comment(s)

龙虾的颜色

记得上次参加第十届ICCBM的时候在看到一个展板,研究的是龙虾在加热后颜色变红的蛋白质结构基础,当时觉得这个课题挺有意思,不过匆匆看了一眼,没有搞清楚具体的结论。今天看到一片文章详细地阐述了这个问题,是《Nature》05年2月15日的新闻。 下面的是“三思科学网站”的译文。原论文见:J Am Chem Soc. 2005 Feb 9;127(5):1438-45.

 

龙虾颜色的量子原因
荷兰科学家发现未被烹调的甲壳类动物为什么是靛青颜色的

龙虾
龙虾煮熟了就变红
  〖济南〗“就像龙虾被煮熟,清晨/开始从黑色变成红色”, 17世纪的赛缪尔•巴特勒在他的讽刺诗《胡迪布拉斯》里写道。但是直到今天之前,没人确切知道为什么龙虾被煮熟后会变颜色。

  一组荷兰科学家提供了答案。他们说,这种显著的颜色变化有一个植根于量子理论的精细解释。

  化学家知道龙虾的颜色是由于一种叫做虾青素的颜料分子。它附着在甲壳蛋白上。虾青素是一种类胡萝卜素颜料,是许多动植物表现出明亮的红色的原因,包括桔子、西红柿和一些鸟类的羽毛。

  当龙虾被煮熟之后,它的甲壳蛋白因为热而伸展开,附着在上面的虾青素脱落。这种“自由”的虾青素是红色的,正如绝大多数类胡萝卜素的颜色。这就让龙虾带上了那种新鲜烹调的(红)颜色。但是化学家对于活龙虾的蓝黑色感到困惑。

  荷兰莱顿大学的Francesco Buda和他的同事最近弄清了当虾青素被嵌入甲壳蛋白之后,它到底发生了什么事。他们在《美国化学会杂志》上报告了他们的研究结果。


  红移

  红色颜料吸收蓝色和绿色的光,反射光谱中的红色部分。当虾青素与甲壳蛋白结合的时候,它的吸收范围扩展到了光谱中波长更长(更红)的部分。这就意味着它吸收所有的可见光,因此这种颜料就变成了黑色。

  我们眼睛里的视锥细胞也有类似的过程。在这些细胞中,一个(视网膜的)颜料分子被蛋白质外套“调解”成可以吸收不同波长的光。

  有一个理论已经被科学家讨论了很多年:甲壳蛋白分子的骨架扭曲了虾青素,让其吸收范围跨过了整个可见光谱。这正如通过截短或加长钢琴线,从而改变它的共振频率。

  但是Buda和他的同事已经计算出了虾青素的量子能态。结果表明,仅仅是改变虾青素的形状,只能引起1/3的吸收波长范围的移动。形状的改变不能让这种颜料从红色变成黑色。

  另一个理论是,虾青素在(甲壳)蛋白内带上了电荷。但是荷兰的科学家通过使用一种叫做核磁共振频谱的技术,排除了这种可能性。


  暗干涉

  2002年,科学家发现在甲壳蛋白中的虾青素分子成对结合,它们相互穿越,形成了X型。荷兰的这组科学家在此基础上进行了研究。他们的计算结果表明,这种虾青素分子的配对意味着两个分子相互干涉,就像相邻电线的电信号串扰。这改变了它们的量子能态,从而改变了它们能吸收的光的波长,这可以解释大部分的吸收波长范围的移动。

  “花了这么长时间才解决这个问题,这真让人吃惊,”Buda说。但是他承认。只是在最近5到10年中,计算机才能够处理那些棘手的量子力学计算问题。

  References:

  1. Lobster colour has quantum cause,Nature News
|Story|

Posted 作者 shininglake with no comments

关于GO的应用又看到一篇文章

在北大生物信息网站看到的,《基于GO的拟南芥基因功能分析》,介绍了利用GoFigure进行新基因功能的预测,虽然预测结果没有经过实验验证,尚无法判断预测的准确性,但至少在某种程度上可以提供设计进一步实验的线索。原文链接:http://www.cbi.pku.edu.cn/chinese/documents/papers/10311049.pdf

Posted 作者 shininglake with no comments

麻省理工学院的开放课程

麻省理工学院将900余种课程免费开放,而目前台湾的一个团队正在计划将所有课程翻译成中文,这真是所有中国学生的福音!

http://www.mitocw.net/是一个总链接站,简体中文版的链接是:http://www.cocw.net/index.htm

自由开放,知识共享,祝愿该计划顺利、早日完成,有时间我希望也能在这个计划里做一名义工。

 

Posted 作者 shininglake with 1 comment(s)

什么是Gene Ontology?

不时看到这个词,却从没好好研究过,今天看了一下才发现这个概念还真不好理解。
先转载一篇中文的文章看看(玉米地分子生物学论坛zxling):
 
Ontology: 哲学中称为本体论/存在论,这里本质是指一系列特定的文字可用来形容一些特定的模式、元件或角色,因此在国外的华人生物信息学家中试译为语义(学)。

GO(gene ontology)对大家而言也许会是一个相对陌生的名词,但是它已经成为生物信息领域中一个极为重要的方法和工具,并正在逐步改变着我们对 biological data的组织和理解方式,它的存在已经大大加快了我们对所拥有的生物数据的整合和利用,我们应该逐步学会理解和掌握这种思想和工具。
众所周知,sequence based biology中的核心内容即是对序列的Annotation(注释),其中主要包含structural annotation和functional annotation,前者涉及分析sequence在genome中的locus以及exon,intron,promoter等的location,而后者则是推断序列编码产物的功能,也正是我们在六月论题中所着重探讨的。应该说,这二者是相互关联的。
随着多种生物genome的相继解码,同时大量ESTs以及gene expression profile date的积累,使得annotation的工作量和复杂度大大增加。然而另一方面,大多数基因在不同真核生物中拥有共同的主要生物功能,通过在某些物种中获得的基因或者蛋白质(shared protein)的生物学信息,可以用以解释其他物种中对应的基因或蛋白(especially in comparative genomics)。由于这些繁复的功能信息主要是包含在积累的文献之中,如何有效的提取和综合这些信息就是我们面临的核心困难,这也是GO所要着力解决的问题。通过建立一套具有动态形式的控制字集(controlled vocabulary),来解释真核基因及蛋白在细胞内所扮演的角色,并随着生命科学研究的进步,不断积累和更新。一个ontology会被一个控制字集来描述并给予一定的名称,通过制定“本体”ontologies并运用统计学方法及自然语言处理技术,可以实现知识管理的专家系统控制。
到目前为止,Gene Ontology Consortium(GO的发起组织)的数据库中有3大独立的ontology被建立起来:biological process生物过程, molecular function分子功能及cellular component细胞组分。而这三个ontology下面又可以独立出不同的亚层次,层层向下构成一个ontologies的树型分支结构。可以说, GO是生物学的统一化工具。
http://www.geneontology.org/
Gene Ontology使用Oxford Dictionary of Molecular Biology (1997)中的定义,在分选时还要参考SWISS-PROT, PIR, NCBI CGAP, EC…中的注释。建立起来的标准不是唯一的标准(这是GOC所一直强调的),自然也不规定每个研究者必须遵循这套控制字集系统。所采用的动态结构 (dynamic structure)使用DAGs(Directed Acyclic Graphs)方式的network,将每一个ontology串连起来,形成树状结构(hierarchical tree),也就是由前面所说的“is a”和“part of”两种关系。

由于GO是一种整合性的分类系统,其下的3类主ontology我们前面说是独立的,但是无论是GOC原初的设计还是我们的使用中其实都还是存在一定的流程关系。一个基因/蛋白质或者一个ontology在注解的过程中,首先是考虑涉及在构成细胞内的组分和元件(cellular component),其次就是此组分/元件在分子水平上所行使的功能(molecular function),最后能够呈现出该分子功能所直接参与的生物过程(biological process)。由于这是一种存在反馈机制的注释过程,并且整个系统是动态开放实时更新的,因此在某种程度上说它具有纠错的能力。

在spiro转贴的帖子中提到TAMBIS计划,这是目前唯一实现了在概念和联系层次上集成信息源的系统。但是还有其他一些相关计划正在研究之中。
比如BioKleisli (宾夕法尼亚大学计算机系),采用Mediator(调节器)技术实现了若干数据源的集成,其后的K2/Kleisli系统还利用数据仓库实现了OLAP(联机分析处理)。
DiscoveryLink (IBM研究院),基于Wrapper/ Mediator(包装器/调节器)实现了信息源集成,提出了查询的分解和基于代价的优化策略
TAMBIS (曼彻斯特大学计算机系)基于Wrapper/ Mediator实现了信息源集成,借助BioKleisli中的CPL语言作为查询语言并给出了查询优化的方法。通过TaO(TAMBIS Ontology)本体定义为用户浏览和查询处理提供领域知识。
TINet (GSK公司和IBM研究院),基于多数据库中间件OPM(Object-Protocol Model,对象协议模型)定义数据源的对象视图,其CORBA(Common Object Request Broker Architecture,公共对象请求代理体系结构)服务器使各数据源Wrapper(包装器)更易于扩充。

但是他们都存在一定的缺陷。BioKleisli 系统查询能力相对较弱,而且并未给出查询优化策略;TAMBIS系统和DiscoveryLink系统集成的数据源数量相对还很少,后者在查询处理中并未运用领域知识,因而查询分解也未从语义角度考虑;TINet系统中的查询处理能力不强。

现在面临的突出问题是在数据库查询中尤其是当多个数据库存在信息重叠时,缺乏从中选择最佳检索成员,动态生成优化检索方案的能力。而且现有的工作主要面向数据集成,而对服务集成考虑不多。支持数据与服务综合性集成的体系仍欠完备。因此这也将是GO未来发展和提升的一个重要方向.
 
另外,还有一篇台湾的文章:http://140.116.247.40/Project/wangwh/brief_introduction.htm
 
当然了,最权威的解释在这里:http://www.geneontology.org/GO.doc.shtml
 
 
Posted 作者 shininglake with 5 comment(s)
更多内容 下一页 »