Tuesday, 5 December 2017

幸褔的煩惱:有位朋友本BNO響德國被當成BC


是咁的,分享一段關於BNO既小故事
幾年前同有位朋友去德國旅行,咁我位朋友係用BNO既,而筆者用既係加拿大護照
當我地去到慕尼黑時,就去左火車站拎埋本passport去activate張Eurail Pass(歐洲火車證)
當我個fd去activate張Pass時,但職員同佢講唔可以幫佢activate,理由係佢係歐盟公民,而歐盟公民係唔可以用比遊客用既歐洲火車證搭火車既
咁我個fd就同個職員解釋喇,話佢係從香港黎,仲show埋張香港身份證出黎,但個職員都係耍手擰頭,話香港身份證唔係國藉證明,而佢本BNO就證明左佢係英國人,即係歐盟公民,而歐盟公民係唔可以用歐洲火車證
跟住我個fd又同個職員講,呢本野係BNO唔係BC,國藉一欄寫住British National (Overseas),佢特別強調係Overseas,然後仲show埋比個職員睇佢既英國留學簽證(我個fd響英國讀書),講話如果係BC既話去英國讀書唔需要簽證既
但可能因為出名憨直既德國唔會有呢種冇本國居留權既騎呢護照,個職員冇辦法理解BNO既理念,個職員仍然不為所動,解釋左一輪佢都仍然認定本BNO係BC,最後佢冇辦法我個fd終於叫左個上級黎,解釋左一大輪,先至說服左個上級本BNO唔係歐盟公民,而佢係可以用歐洲火車證搭火車。咁先至幫佢activate左張Eurail Pass
個上級仲補充左一句,Munich is the worst place to get anything stamped

Monday, 4 December 2017

科技史系列:淺談DNA測序的原理(5)之方興未艾的第三代測序技術

簡介完次世代測序技術(NGS),我地可以睇到NGS憑藉大規模並行測序的優勢將單個鹼基既測序成本大幅度下降,而隨住NGS既進步,人類基因組既測序成本由人類基因圖譜計劃時既30億美金下降到今日既$1000美金,其進步速度遠遠超過摩爾定律。然而NGS有佢本身既問題,當中最重要既係讀長太短,由幾十到幾百個鹼基,所以響不斷重覆既序列會出問題,而且PCR過程當中,有機會因聚合酵素加入錯誤的鹼基而導致測出錯誤的序列。所以學者們並無滿足於NGS而停低開發新技術既腳步,到左2000年代末2010年代初,所謂第三代既測序技術嶄露頭角。第二代同第三代測序技術既最主要分別係:第二代測序需要進行PCR擴增既過程,然後利用一大堆PCR產物響測序反應中放出既集體光訊號檢測鹼基序列,而第三代測序技術就可以唔需要經過PCR擴增既步驟,直接對樣品DNA進行測序,因此第三代測序既核心就係單分子測序。單分子測序技術雖然已經有商用產品推出市面,但目前尚未成熟,而且因為各種技術困難並未直接威脅到第二代測序技術既領導地位。響簡短既篇幅當中,我會簡介兩種單分子測序技術:Pacific Biosciences既ZMW同埋Oxford Nanopore既納米孔測序。

Pacific Biosciences既ZMW



太平洋生物科技公司Pacific Biosciences於2004年成立,2011年推出基於ZMW技術既第三代測序技術平台:PacBio RS,最新的Sequel System測序儀則於2015年被推出市場。ZMW的基本原理仍然是基於四種不同螢光標記的核苷酸,在單分子實時測序中使用的核苷酸螢光標記位於磷酸根處。實際操作上,DNA樣本經切割處理及加入譯引子後,會首先被加入到一塊佈滿小孔的玻璃片上(這些小孔被稱為ZMW),每個小孔的底部有一個DNA聚合酵素,光源則被置於玻璃片下方。高溫下DNA樣本的雙螺旋分離成兩條單鏈,單鏈則跟聚合酵素結合,每當聚合酵素將一個核苷酸加入到成長中的DNA單鏈中時,玻璃片底下的光源會激活核苷酸上螢光染劑標記發出螢光。而照相機則會記錄下螢光的顏色從而解讀出鹼基序列。當核苷酸被加入DNA鏈後,焦磷酸會被釋放出來,而與焦磷酸相連的螢光標記會離開DNA聚合酵素,而螢光信號則消失。當加入下一個核苷酸時,它的螢光標記會被激活而放出第二個螢光信號。不斷重覆此步驟循環直到整條模板DNA被完成測序。利用ZMW的測序技術可以有非常長的讀長,從數千到數萬個鹼基不等。最新的Sequel System測序儀可以一次測序最多30,000個鹼基的長度。此外它也可以在不改變模板DNA序列的情況下偵測DNA的甲基化鹼基(methylation,在表觀遺傳學epigenetics上有重大研究價值)。然而其弱點則是錯誤率比較高,而偵測單分子放出的微弱螢光信號在技術上仍存在挑戰。

ZMW小孔:單分子實時測序(SMRT sequencing)既核心技術

單分子實時測序技術的簡介短片

Oxford Nanopore既納米孔測序



Oxford Nanopore的測序原理非常簡單,其基本原理離不開將長鏈DNA分割成可測序的片段,然後利用電泳原理,將DNA片段的單鏈(可以通過加入DNA解螺旋酵素DNA Helicase將雙螺旋的DNA分子分拆成兩段單鏈)通過一個僅僅足夠容許DNA分子通過的小孔(小孔可以是蛋白質或固態solid state納米孔)。然後設立一個電路跨越這個小孔,再讀取這個電路裡微弱電流的改變。由於當不同的鹼基通過小孔時電流會出現細微的改變,因此只要通過記錄並解讀這些改變,模板DNA的完整序列就能夠被解讀出來。納米孔測序可以用作連續測序非常長的DNA分子,甚至可以測序數萬以至數十萬個鹼基的長度,而納米孔測序跟ZMW一樣可以在不改變DNA序列的前提下偵測鹼基的甲基化,並測序RNA分子,以便利表觀遺傳學的研究。它也根本不需要用到螢光染劑標記的核苷酸,因此試劑(reagent)成本很低。然而納米孔測序目前仍然在研發階段,其主要技術困難在於單個鹼基通過納米孔時的電流改變實在太少,而且DNA單鏈通過納米孔時的速度太快,單個鹼基停留在納米孔內的時間太短(1-5微秒),導致記錄困難。

Oxford Nanopore的測序

簡介完兩種第三代測序技術後,這個關於DNA測序技術發展科技史的系列文章就來到尾聲。DNA測序技術由Sanger法走到納米孔,這二十年來測序技術的發展可謂翻天覆地。直到今日測序技術仍在不斷的往前邁進,更強大的測序能力使得生物學家能夠更深入地窺探遺傳學的秘密。

總結兩種第三代DNA測序技術的原理

《科技史系列:淺談DNA測序的原理》全文完

Saturday, 2 December 2017

科技史系列:淺談DNA測序的原理(4)之SOLiD連接法


除了邊合成邊測序外,次世代測序技術還有一種基於連接酵素的方法,利用兩段DNA片段連接時的鹼基配對(base pairing),偵測出要測序的DNA序列。這種連接法2006年由應用生物系統公司Applied Biosystems商用化,商品名稱為SOLiD,全名為Sequencing by Oligonucleotide Ligation and Detection。SOLiD系統的DNA樣品製備類似另外兩種次世代測序技術,首先是將長鏈DNA分割成可測序的長度,大約數十個鹼基長度的序列,然後這些DNA片段的頭尾兩端會被連接到連接序列(adapter sequence)上,然後樣品會被加入到充滿連接序列的顆粒溶液中,DNA片段會跟連接序列配對,從而被固定到顆粒上。然後就是PCR的步驟,DNA聚合酵素會以連接序列為譯引子,將顆粒上的DNA片段擴增,使顆粒表面佈滿準備要用作測序的模板DNA。接下來,顆粒會被固定到玻璃片上,並被放置於SOLiD測序儀內,準備下一輪的測序步驟。

SOLiD的樣品製備和PCR擴增步驟

SOLiD的測序反應需要DNA連接酵素(DNA ligase),P1譯引子(primer),最關鍵的部分則是一個8個鹼基長度的單鏈DNA探針(oligonucleotide probe),探針頭部為兩個鹼基(總共有16種可能性,AA、AT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、GG,因此稱為雙鹼基編碼技術two base encoding),探針中部有三個能跟任何鹼基配對的universal base,而尾部則是三個帶有螢光染劑標記的universal base。測序儀會加入探針和連接酵素,探針會跟模板DNA上的鹼基配對,當配對成功後,連接酵素會將探針的3' -OH跟前一段單鏈DNA的磷酸根連接起來,此時照相機會記錄探針上的螢光標記,以確定被加入的探針到底16種當中哪四種(由於只有4種螢光染劑,所以4種鹼基組合會共用一種螢光染劑)。當記錄完成後,探針尾部的3個鹼基和螢光染劑會被切除洗走,曝露出5'磷酸根準備下一輪的反應。當反應完成後,新的譯引子會被加入,新的譯引子會比舊的移動一個鹼基的位置,所以測序開始的位置會順延一個鹼基。然後探針會被加入,DNA連接酵素會對配對正確的螢光探針連接到譯引子上,開始新一輪的測序。當完成一個循環後,又一個新的譯引子會被加入,再重覆上述探針測序的過程,直至完整的序列被會部解讀出來為止。

雙鹼基編碼技術的螢光探針是SOLiD技術的核心
SOLiD連接法測序的簡介短片

SOLiD技術的優點是由於它使用了雙鹼基編碼技術,因此其準確度非常高,此外它也可以作大規模平行測序,一次過能產生大量的測序數據,因此單鹼基的測序成本較低。然而它也有相應的缺點,當中最明顯的缺點是讀長。SOLiD測序的讀長大約只有75個鹼基(早期型號只有35個鹼基),不但遠不如Sanger法的1000個鹼基,更短於另外兩種競爭對手:焦磷酸測序法和可逆鏈中止法的讀長。如果利用SOLiD法測序一個人類基因組,將需要30倍的覆蓋(30x coverage),即重覆測序整個人類基因組30次。因此SOLiD技術恃其高準確度優勢主要用作測試SNP有優勢。

科技史系列:淺談DNA測序的原理(3)之Illumina可逆鏈中止法

次世代測序技術之Illumina公司的可逆鏈中止法


454生命科學公司推出基於焦磷酸測序法的平台之後,次世代DNA測序技術發展迅速,新的技術推陳出新。2006年,Illumina螢光公司推出基於可逆鏈中止法的次世代測序技術。可逆鏈中止法的基本原理跟Sanger法有異曲同工之妙,顧名思義,可逆鏈中止法的DNA鏈當加入帶有螢光染劑標記(fluorescence dye tag)的特殊核苷酸後暫時停止延長,這些特殊核苷酸的作用類近於Sanger法中所使用的ddNTP。然而可逆鏈中止法所用的螢光標記核苷酸不同於Sanger法使用的ddNTP,在Sanger法中當鏈終止後就無法再繼續延長,而螢光標記記核苷酸的terminator是可以移除的,所以當terminator被移除後另一個核苷酸就能被加入到DNA鏈中,以作下一輪的測序。因為測序過程是跟DNA鏈的延長同時進行,因此這種方法亦被稱為sequencing by synthesis,即邊合成邊測序。

Illumina的可逆鏈中止法實際操作上由三個主要步驟組成:擴增、測序、數據分析。第一個步驟當然又是將長鏈DNA打碎成DNA片段,然後DNA片段的頭尾兩端會跟兩種連接序列(adaptor)連合,接著DNA片段會被放置於一塊布滿兩種連接序列單鏈的玻璃片上。這些連接序列單鏈被固定(covalently attached)於玻璃片上,DNA片段上的頭尾兩段連接序列會跟玻璃片上相對應的兩段連接序列單鏈結合(hybridize),形成橋狀(倒U形)的結構。然後DNA聚合酵素會以玻璃片上的連接序列作譯引子(primer),從而產生出一條與準備要測序的DNA鏈相互補、而又被固定響玻璃片上既模板DNA(template DNA)。經過多次PCR既過程,玻璃片上就會出現一堆堆(cluster)被固定響玻璃片上而序列相同的模板DNA鏈。擴增的步驟就此完成,接下來的就是最關鍵的測序步驟。

可逆鏈中止法擴增的步驟,在最後一步可見PCR擴增後產生的DNA叢集

可逆鏈中止法的測序步驟需要連接序列譯引子、DNA聚合酵素、帶有螢光標記及terminator的特殊核苷酸,以及用來偵測螢光的照相機。首先,連接序列譯引子與固定在玻璃片上的模板DNA的尾部連接序列結合,然後DNA聚合酵素會每次將一個特殊核苷酸加入到正在生成的DNA鏈中。當特殊核苷酸被加入DNA鏈後,照相機會拍下螢光的顏色,不同顏色的螢光標記代表A、T、C、G四種不同的鹼基。當拍下照片後,特殊核苷酸上的螢光標記和terminator會被移走,DNA聚合酵素會接著加入下一個特殊核苷酸,然後相機會再拍下照片。如此類推,通過捕捉每次加入特殊核苷酸的螢光顏色,DNA鏈的序列就能被解讀出來。

可逆鏈中止法的測序步驟示意圖


可逆鏈中止法的優點是可以大規模平行測序,每次運行測序步驟均能產生大量的序列,而且比較起焦磷酸測序法,多個相同鹼基的重覆序列也能被清楚判斷(因為每次測序反應只加入一個核苷酸)。而且Illumina的機器擁有優秀的單鹼基測序成本,最新的Illumina HiSeq X超高通量測序儀可以以$1000美金的超低成本,以30倍覆蓋(30x coverage)測序整個人類基因組。然而可逆鏈中止法也有它的缺點,當中最大的缺點就莫過於讀長。最新一代的Illumina機器最多只能有150個鹼基的讀長,少於454的焦磷酸測序法,更遠少於Sanger法的1000個鹼基的讀長。而且Illumina公司的產品成本亦相當高昂,除了如BGI等大型基因研究所外,小型實驗室很多都負擔不起購置大量Illumina測序儀的費用。

人類基因組測序費用跌破$1000美金,有賴超高通量測序儀的引入所賜
Illumina公司推出的測序產品

Friday, 1 December 2017

科技史系列:淺談DNA測序的原理(2)之454焦磷酸測序法

次世代測序技術的誕生:焦磷酸測序法(pyrosequencing)

454生命科學公司基於焦磷酸測序法的DNA測序儀

上集提到,利用Sanger法測序雖然有準確度高同埋讀長長既優點,但成本極高同無法大規模平行測序亦都係好明顯既缺點。為左解決呢個問題,學術界有必要開發新既測序技術。焦磷酸測序法的原理最早響1993年公布,到2005年由454生命科學公司推出商用產品,這是首個被推出商用市場的次世代DNA測序儀。焦磷酸測序法主要倚賴探測DNA聚合酵素將每個核苷酸加入延長中的DNA鏈時放出的焦磷酸(pyrophosphate, PPi)從而確定DNA的序列。由於焦磷酸測序法不需要在DNA鏈延長過程期間終止它的延長,可以邊合成邊測序。這就是焦磷酸測序法的核心精髓。

焦磷酸測序法工作流程

咁焦磷酸測序法實際操作上又係點既呢?測序的第一個步驟跟Sanger法是一樣的,就是將長鏈DNA分子分割成數百個鹼基長度的片段,然後將轉接序列(adapter sequence)連結到準備用作測序的DNA片段上。轉接序列的用途包括固定DNA片斷至顆粒(beads)以及提供PCR及測序反應的譯引子(primer)。將含有DNA片段的顆粒加入到油滴及水的溶液當中並進行PCR(emulsion PCR),DNA聚合酵素將DNA片段擴增(amplify)到可以進行測序的數量,然後測序過程開始。

測序反應需要單鏈模板DNA、dNTP、APS、譯引子(primer)、DNA聚合酵素、硫酸化酵素(sulfurylase)、螢光素(luciferin)、螢光素酵素(luciferase)、用作降解核苷酸的apyrase和偵測螢光的照相機。譯引子粘合於固定在顆粒上的模板DNA片段上,DNA聚合酵素開始將核苷酸加入到延長中的DNA鏈上,過程中當每一個dNTP加入到DNA鏈上時,就會放出一個焦磷酸,焦磷酸會和溶液中的APS結合,在硫酸化酵素的催化下形成一個ATP,ATP則會在螢光素酵素的催化下跟螢光素結合,這個反應會發光,發出的光會被照相機所捕獲。測序儀會循序加入dATP、dTTP、dCTP和dGTP,如果序列跟加入的核苷酸互補(complimentary)就會發光,反之則不會發光。光的強度則代表有多少個核苷酸被加入到DNA鏈中。每次反應後,apyrase會將上一次反應用剩的核苷酸降解,以便加入新的核苷酸。將過程不斷循環,就會獲得用作測序的DNA序列。


454/羅氏焦磷酸測序法的優點是可以大規模並行測序,每次測序均可以產生出大量的序列原始數據,然而缺點則是讀長比Sanger法短(GS20大約百餘個鹼基,新的焦磷酸測序法可達到700個鹼基的讀長),以及在不斷重覆的序列中較難分辨有多少個核苷酸被加入到DNA鏈中。

焦磷酸測序法短片

隨著DNA測序競爭的白熱化,新的次世代測序技術隨之誕生,作為第一款投入應用的次世代測序技術,焦磷酸測序法很快就要面對螢光公司Illumina的可逆鏈中止法(reversible terminator method)及ABI公司的DNA連接法SOLiD的競爭(sequencing by ligation)。454/羅氏焦磷酸測序法終於在2013年退出了次世代測序技術的市場,完成了它的歷史使命。

科技史系列:淺談DNA測序的原理(1)之鏈終止法/Sanger法

DNA測序技術,係遺傳學家分析人類及其他生物基因既重要工具。自從1950年代DNA雙螺旋結構被Watson and Crick發現以來,基因組研究已經行左好遠既路。由2003年人類基因圖譜計劃完成,直到最近人類基因組測序的費用跌破$1000美金,並開始應用響醫療領域,DNA測序技術既進步已經遠遠超越好多人既預期。響呢個post入面,樓主會簡介一下到底DNA係乜,同埋DNA測序及相關技術既原理。

DNA:絕大部分生物所使用的遺傳物質

DNA,中文名稱脫氧核醣核酸,係絕大部分生物所使用的遺傳物質。除左少量病毒使用RNA作為遺傳物質之外,其他高等生物均無一例外使用DNA作遺傳用途。DNA係長長既鏈狀結構,由兩條反平行(anti-parallel,即係平行但方向調轉,其中一條5'->3',另一條方向則為3'->5')既長鏈狀分子所組成,兩條鏈互相纏繞而成雙螺旋結構(double helix)。每條DNA由醣-磷酸骨架(Sugar-phosphate backbone)同鹼基(base)組成,醣-磷酸骨架連接每個鹼基形成長鏈,而鹼基則負責儲存遺傳信息。鹼基基本上有分四種:A、T、C、G。鹼基有一種特性叫鹼基對(base pairing),即係一條鏈上既A相對反方向鏈既相同位置就係T、C則對G,調返轉亦都一樣。而DNA鏈上ATCG四種鹼基既排序,則儲存著生物遺傳相關既信息。相比起化學上較不穩定既RNA,DNA係化學上穩定既分子,唔容易降解同被破壞,呢個亦都係大部分生物將佢用作遺傳用途既原因,因為佢可以將遺傳信息穩定咁由一代傳到下一代。


響真核生物既細胞入面,DNA遺傳物質主要集中響細胞核(nucleus)入面,而DNA響細胞核入面唔係以裸分子(naked DNA)形態存在,而係同組織蛋白(histone)同其他蛋白質結合組成染色體(chromosome)。響細胞分裂期間,染色體以聚結形態出現,而響非分裂期間,則以染色質(chromatin)形態出現。響基因組入面,DNA鹼基對既數量按唔同生物品種有所區別,以人類基因組為例,則有23對染色體,大約30億對鹼基對。

染色質在細胞核內的結構
在細胞分裂期間染色質凝聚成為染色體

大約認識左DNA既化學結構同特點,下集正式開始介紹如何為DNA鹼基測試排序

DNA測序的鼻祖:鏈終止法,或稱Sanger法


鏈終止法,或稱Sanger法,於1970年代由弗雷德里克·桑格(Frederick Sanger)及其同事所創,至今仍廣為應用的DNA測序法。Sanger法首先必須按照DNA已知的序列設計一個譯引子(primer),響聚合酵素連鎖反應法(Polymerase Chain Reaction,PCR)入面,DNA聚合酵素會模仿自然界中DNA複製(DNA replication),從譯引子既3'羥基 -OH group開始,利用反應物當中所含的核苷酸(nucleotide,即DNA長鏈的組成部分),延長一條新的反方向DNA長鏈,最終完成一條新既雙螺旋。鏈終止法顧名思義,就係利用延長鏈過程當中中止反方向長鏈既生成,產生出一堆不同長度既DNA鏈。然後再利用不同長度DNA鏈可被分離的特性,從而探測出DNA終止位置的每個鹼基到底係A、T、C定係G。呢個就係超簡化既Sanger法基礎原理。

咁到底Sanger法實際操作係點進行呢?

首先,試管入面要有準備用作測序的DNA(template DNA),譯引子(primer)。並且提供延長DNA鏈所需用既building block,即四種核苷酸dATP、dTTP、dCTP、dGTP(統稱dNTP),以及延長反方向DNA鏈既催化劑(catalyst),即DNA聚合酵素(DNA polymerase)。另外,試管入面仲會加入一種特別既核苷酸,呢個核苷酸缺乏位於核醣(ribose)第三個炭原子既羥基(3' hydroxyl group,或稱3' -OH group),因此被稱為雙脫氧核苷酸(dideoxynucleotide)。雙脫氧核苷酸係PCR反應當中終止反方向DNA鏈延長所用的抑制劑,負責停止延長反應。由於它缺乏3' -OH group,DNA聚合酵素當加入一個雙脫氧核苷酸後無法繼續像正常一樣將另一個核苷酸的磷酸根跟3' -OH group反應,因此該DNA鏈不再延長。呢d雙脫氧核苷酸總共有四種,ddATP、ddTTP、ddCTP、ddGTP(統稱ddNTP)。而雙脫氧核苷酸上則以放射性原子(radioactive atom)或染色劑(dye)作標記,以便不同長度的DNA鏈按長度分離後偵測出該終止位置的鹼基類別。

雙脫氧核苷酸結構和一般核苷酸結構,雙脫氧核苷酸缺乏3' -OH group,因此當DNA鏈加入雙脫氧核苷酸後,則無法再繼續延長
Sanger法的工作流程

有齊所有反應物之後,試管會被放置到PCR機器當中,PCR機器首先會利用高溫將DNA雙螺旋當中的兩條長鏈分開(denaturation),然後會降溫以便譯引子(primer)及聚合粘著準備要測序的DNA長鏈。然後再度升溫,讓聚合酵素開始工作,將dNTP加入正在生成中的長鏈上。在過程中,聚合會隨機加入ddNTP從而令DNA延長過程中止。PCR機器會不斷重覆升溫、降溫的循環,當若干循環後,一大堆不同長度的DNA鏈就會出現在試管內。然後試管內容物會被移送到DNA測序儀內。DNA測序儀內有一個裝有緩衝溶液的水缸,一塊滿佈小孔的凝膠,及位於水缸兩端的陰陽兩極。由於DNA分子當中擁有帶負電荷的磷酸根(phosphate group),當通電後DNA會在凝膠內向正極移動。越長的DNA越重,移動得越慢,而較短的DNA則較輕,移動得越快,因此通電後長短不一的DNA就會按長度分開。在過程中,DNA測序儀會探測經過的ddNTP上的螢光染劑。由於ddATP、ddTTP、ddCTP、ddGTP四種ddNTP上所用不同顏色的螢光染劑,機器便可以區分開經過的DNA鏈到底終止位置的鹼基到底是A、T、C或是G。利用Sanger法,我們可以得到800-1000個鹼基的排列資訊,我們稱之為「讀長」(read length)。但咪住先,你頭先咪話人類基因組有成30億對鹼基對,如果Sanger法只能產生800-1000個鹼基的讀長,咁佢點可以用來測序整個人類完整基因組既鹼基排列呢?


答案:人類基因圖譜係利用好多好多短既、800-1000個鹼基長度既DNA斷片(fragments)拼接而成。因此學者必須將人類基因組既超長DNA鏈進行降解、切割成可測序的長度,並對大量既短DNA斷片進行測序,最後利用唔同斷片之間既重疊序列,好似砌puzzle一樣拼合而成一個完整的基因組。測序一個人類基因組,如果利用Sanger法大約需要6倍既覆蓋(6 fold coverage),即係要測序整個基因組長度既DNA 6次,先至可以產生足夠重疊序列用作拼合成一個完整的基因組。

人類基因圖譜係利用重疊序列拼合成一個完整的基因組

Sanger法係1990年代人類基因圖譜計劃所用既測序技術,但Sanger法無法大規模平行操作,因此單鹼基測序成本非常高昂。在人類基因圖譜計劃當中,冷泉港實驗室大量的老式3730型測序儀日以繼夜地運作,足足運作了十三年、耗資30億美金先至將第一個人類基因組序列完成。到左2000年代中葉,新測序技術既發明先至將DNA測序既價格開始降低。新測序技術(Next generation sequencing technology),或稱次世代測序技術既誕生,最終形成左一場革命,徹底改變左DNA測序既成本、市場同應用。關於呢d次世代測序技術,就容筆者下次再講。

大量的老式3730型測序儀日以繼夜地運作先至將第一個人類基因組序列完成

Monday, 20 November 2017

你所不知道的歷史:維京人最早發現新大陸

你所不知道的歷史
維京人最早發現新大陸

講到發現新大陸既人,好多人自自然然就會聯想起哥倫布。但如果我話新大陸其實早響哥倫布之前500年就已經被歐洲人發現,你又會唔會相信呢?

萊夫.愛立信發現新大陸油畫

好喇,時間返到去公元970年既冰島(Iceland)。根據冰島史詩(Icelandic Saga)所記載,一位叫萊夫.愛立信(Leif Erikson)既北歐人呱呱墮地。萊夫.愛立信既父親係北歐有名既航海家同探險家兼挪威維京人,紅鬍子艾瑞克(Erik the Red),亦都係最早發現格陵蘭(Greenland)既探險家。紅鬍子艾瑞克因在挪威犯下殺人罪而被流放到冰島,而佢響冰島亦同樣被流放,其後於公元986年向西航行而到達格陵蘭定居。正所謂有其父必有其子,萊夫.愛立信肯定遺傳左佢老豆愛冒險既基因。雖然萊夫.愛立信既名氣遠遠及唔上哥倫布,但佢的的確確係有記錄以來最早到達北美洲既歐洲人。

紅鬍子艾瑞克肖像畫
萊夫.愛立信雕像

根據《格陵蘭史詩》及《紅鬍子艾瑞克史詩》,萊夫.愛立信於公元1000年左右從格陵蘭出發向西航行,尋找傳說中位於格陵蘭以西既陸地,並於今加拿大紐芬蘭(Newfoundland)登陸。萊夫.愛立信將新近發現的土地命名為文蘭(Vinland),意即葡萄生長的土地,他並於文蘭建立了一個規模細小的殖民地,並滿載葡萄及本木材回歸格陵蘭。萊夫.愛立信既發現鼓舞左其他定居於格陵蘭既維京人向西航行以到達北美洲。登陸文蘭殖民地既維京人好快就同當地原居民印第安人接觸,並演變成血腥衝突。維京人位於文蘭的殖民地最終因天氣關係或與土著的流血衝突而被廢棄,而維京人發現北美洲大陸一事亦很快被歷史所遺忘,直到近500年後既1492年,先由哥倫布重新發現中美洲的新大陸。

維京人向外探險及勢力擴張的地圖,約於公元10世紀末11世紀初到達北美洲紐芬蘭

萊夫.愛立信之後近1000年,北美洲的考古學家開始尋找維京人曾經登陸北美大陸的證據。1960年代,挪威藉探險家Helge Ingstad同佢太太考古學家Anne Stine Ingstad於加拿大紐芬蘭島的蘭塞奧茲牧草地(L'Anse-aux-Méduses)發現了維京人的村落遺址,證實了維京史詩當中關於發現文蘭新大陸的內容屬實,維京人確實曾經比哥倫布早發現新大陸。經過多年的發掘,歷史學家才得以窺探遺址全貌。在這個遺跡裡找到的住所、工具和器具證實了它的年份。這個殖民地遺留的建築物是全北美最古老的歐式建築。遺跡出土的有最少八座建築物,包括一個鑄造場、冶煉廠,還有提供木材給船廠的伐木場。這些建築物當中最大的佔地28.8 × 15.6米,內裡劃還分數間房。遺跡內出土的紡織工具表示殖民地當時有女性居住。聯合國教科文組織在1978年把這地方列為世界文化遺產。

蘭塞奧茲牧草地的維京殖民地復完品

然而,維京人殖民文蘭的嘗試最終以全面撤退失敗收場,因此並未在美洲殖民史上留下深刻的印記。而500年後的哥倫布發現新大陸,則帶來一波又一波的歐洲殖民者,最終徹底並深刻地改變了美洲的歷史發展方向。從呢個角度睇,美洲的發現或者可以歸功於北歐維京人,但它的開發和殖民,仍必需歸功於較後期發現新大陸的哥倫布。

Friday, 17 November 2017

你所不知道的歷史:日心說最早由古希臘人提出

你所不知道的歷史
日心說最早由古希臘人提出

講到日心說,好多人自自然然就會聯想起哥白尼。但如果我話日心說其實早響哥白尼之前1800年就已經被提出而且研究過,你又會唔會相信呢?

好喇,時間返到去公元前4世紀既薩摩斯島,一位叫阿里斯塔克斯(Aristarchus,310-230BCE)既希臘學者就首先提出日心模型(Heliocentric model),認為太陽而非地球係宇宙既中心。阿里斯塔克斯通過幾何計算算出太陽的體積比地球大,從此線索推斷太陽位於宇宙中心,而地球則環繞太陽運行。
薩摩斯島的阿里斯塔克斯雕像
阿里斯塔克斯利用幾何計算推算出太陽同月球的相對大小

阿里斯塔克斯既理論並唔係得佢一個知道,數學鬼才阿基米德響佢既著作《數沙者》入面,就引用左阿里斯塔克斯既研究成果,阿基米德假設宇宙係一個以太陽為中心、直徑10^14斯塔達既球體,從而算出用來填滿宇宙既沙數量係10^63粒(巧合地呢個數字同現代估算宇宙中所有原子既數量相同)。呢點說明左響希臘化時代,阿里斯塔克斯既理論響學術界有一定影響力。

阿基米德

可能你會問,點解希臘人最後選擇左地心模型,而冇選擇日心模型作為宇宙學既標準模型。原因好簡單,就係一個叫做視差(parallax)既問題。即係當地球圍繞太陽轉動既時後,遠方既星星視位置的移動或差異。由於日心說底下遠方既星星會隨住地球既移動產生視差現象(地心說底下由於地球既位置係固定,所以唔會有視差現象既存在),古代天文學家由於冇辦法觀察到視差,令到日心模型飽受批評同質疑。阿里斯塔克斯就進一步提出現論,認為恆星係距離極遠既其他太陽,用以解釋無法觀察到視差呢個事實,但呢個解釋冇受到廣泛接受。而事實上,恆星視差既現象係1833年先首次被白塞耳從天鵝座61觀察到,比起哥白尼晚了近400年先完全確認日心模型正確。
恆星視差現象

Sunday, 13 August 2017

探本溯源:西方上古史入門(4)之英雄與傳說的年代

探本溯源:西方上古史入門


邁錫尼文明

邁錫尼文明,是希臘青銅器時代晚期繼米諾斯文明後的繼任文明,以邁錫尼城為中心因而得名。公元前1600年左右,邁錫尼文明興起於希臘本土的伯羅奔尼撒半島,其後米諾斯的文明中心之一毀於聖托里尼火山大爆發,勢力真空使邁錫尼影響力擴展至愛琴海各島嶼。公元前1450年左右,邁錫尼入侵米諾斯的核心克里特島,並佔領諾可索斯宮殿。與之同時,擅長航海的希臘邁錫尼人將貿易航道拓展至東地中海甚至西地中海各處。邁錫尼古城的居民建造了巨大的石砌城牆及宮殿,其城牆甚至可達8米厚。除邁錫尼城之外,考古學家在皮洛斯、底比斯、雅典、斯巴達等地都發現了邁錫尼文明的中心,當中部分更出土了書寫用的泥板,這顯示到了青銅器時代晚期,邁錫尼的影響力已不止局限於少數聚居點而是遍及希臘各地。

邁錫尼文明的勢力範圍:遍及愛琴海各島嶼,並影響了愛琴海東岸的小亞細亞

在金屬冶煉方面,邁錫尼的青銅冶鍊技術比米諾斯時期進步,希臘開始出現一米長的青銅劍和青銅製成的環片甲。邁錫尼征服了米諾斯之後,他們採用了米諾斯的線性文字作為書寫系統,歷史學家稱之為線性文字B,與較早期米諾斯所使用的線性文字A區分開來。線性文字A至今尚未被破譯,而線性文字B已經在1950年代被破譯,考古學家發現線性文字B是早期希臘語,同時也是發現過最早的希臘語。線性文字B泥板主要用作會計用途,以記錄各宮殿的流水帳,當中並無記載歷史及文學類的泥板。這使研究希臘古史的學者十分失望,因為邁錫尼作為荷馬筆下故事所描繪的時代,缺乏文學作品使得學者們無法從邁錫尼自己的記錄中驗證荷馬史詩中記載特洛伊圍城戰的真偽。那麼到底荷馬筆下那個英雄與傳說的年代在何處?

邁錫尼希臘的長劍:見證著青銅冶煉技術的進步
公元前1400年左右的希臘青銅環片甲
邁錫尼的戰車兵,根據西臺文獻記載,Ahhiyawa人Attarsiya在小亞細亞的一次戰役中部署多達100輛戰車,是不容忽視的軍事勢力
邁錫尼希臘的步兵:他們的防具以及武器

特洛伊戰爭

到底特洛伊戰爭有沒有發生過?這是一個很複雜的問題,而至今特洛伊戰爭的真相仍有待歷史學家繼續調查。從邁錫尼文明中心所出土的泥板中,並沒有提供相關線索;然而線索卻出現在愛琴海彼岸的小亞細亞。歷史學家在研究西臺文明的同時發現,在西臺的記載中出現一個名為Ahhiyawa的勢力,Ahhiyawa跟Archaea,即荷馬史詩中的希臘人不乏相似之處。此外,從西臺的歷史和外交文獻中我們知道,這個名為Ahhiyawa的勢力由偉大的國王統治,其位置位於小亞細亞極西端的愛琴海對岸,必須乘船才能到達的土地,這跟考古學家出土的邁錫尼文明遺址的地理位置互相重合。在西臺的記錄中,Ahhiyawa曾經為小亞細亞極西端、愛琴海東岸的控制權跟西臺正面交鋒。顯然,特洛伊戰爭的故事就發生在邁錫尼希臘跟西臺帝國兩大強權爭奪愛琴海東岸控制權的大背景下。當中Milawanda、Apasa、Lazpa和Wilusa等城市都捲入了兩國的紛爭之中。西臺帝國希望將影響力投射到愛琴海東岸,並利用一系列位於當地的附屬國(vassal states)管治該區;然而日漸西擴的西臺帝國卻無可避免地跟日漸東擴的邁錫尼衝突。公元前14世紀,愛琴海東岸的其中一西臺附屬國阿札瓦聯盟(Arzawa)在邁錫尼支援下發動叛變。前13世紀,西臺帝國哈圖西里三世在位期間,Piyamaradu再次在邁錫尼支援下向西臺發動叛變,並為西臺帝國西陲的阿札瓦、賽哈河流域地區、列斯伏斯島及特洛伊帶來重大威脅。這些發生在青銅器時代晚期愛琴海的軍事衝突也許在希臘經口耳相傳成為了荷馬史詩的藍本和原型。

西臺帝國首都哈圖沙(Hattusa)的城門獅子門
西臺帝國《圖哈利瓦編年史》(Annals of Tudhaliya),記載小亞細亞西端的軍事衝突

海上民族和邁錫尼文明的終結

公元前12世紀,曾經輝煌一時的邁錫尼文明突然從歷史記錄中消失,宮殿中心被廢棄、而線性文字B的書寫系統則失傳,希臘陷入了黑暗時代(Greek Dark Age)。在環地中海東部的其他文明都經歷了類似的文明大崩壞,包括西臺帝國、敘利亞、烏加里特和腓尼基等美索不達米亞各文明中心、甚至埃及都受了重大影響,學界稱之為「青銅器時代大崩壞」(Bronze Age Collapse)。邁錫尼文明的滅亡,歷史學界傳統上歸咎於Dorian入侵,然而目前並無考古證據證明呢個係邁錫尼滅亡既原因,因為Dorian既出現(公元前950年左右)比青銅器時代大崩壞中間有幾個世紀既time gap。反而海上民族同邁錫尼滅亡既時間重合,所以歷史學家相信海上民族的入侵是其中一重要原因。海上民族(Sea peoples),最早出現在埃及的記錄之中,歷史學界對於其身份和民族組成眾說紛紜。有理論指海上民族是因氣候變遷和自然災害南下的歐洲人,亦有理論指他們是居於迦南地的非利士人,有理論指海上民族就是因戰爭流離失所而轉向海盜行為的希臘人。無論真相如何,我們所知道的就是海上民族的入侵,加上氣候和自然災害的影響,使地中海東岸陷入了文明的倒退。城市遭到廢棄、居民的聚居點縮小、建築物由宏偉的石砌城市變成細小的木和泥磚房屋。在美索不達米亞,黑暗時代維持了三百年,直到公元前911年新亞述帝國的興起結束了混亂和分裂的局面。直至在希臘,直到公元前800年左右,城邦文明的再次出現才再次使希臘文明史重拾升軌。

海上民族的海軍和陸軍移動路徑:橫掃整個近東世界
埃及神廟牆上刻畫的埃及與海上民族之間的戰爭。埃及人成功擊退了海上民族的入侵,使得關於海上民族的歷史記載在埃及被保存下來

一份最新既研究發現,希臘米諾斯人有3/4既基因遺傳自西安納托利亞及愛琴海既新石器時代農夫,其餘1/4來自高加索同伊朗。而邁錫尼人既基因同米諾斯人相類近,只係多左東歐同西伯利亞既成份。而現代希臘人既基因則同邁錫尼人相近。研究結果顯示,希臘文明從古到今除文化上之外,連人種上都係一脈相承,唔存在重大斷層。
Source:

Tuesday, 8 August 2017

客觀分析北韓導彈對美國威脅及美國應對方法

7月28日,北韓試射公路機動型洲際彈道導彈火星14型,導彈試射以大仰角彈道進行,飛行高度達到3724.9公里,飛行了998公里,引起世界嘩然。試射後北韓官方媒體誇耀北韓終於獲得了打擊美國本土的力量,美國事後稱不排除向北韓動武作最終解決方案。到底火星14及北韓的彈道導彈對美國威脅有幾大?而美國又有咩應對措施?而呢d措施又可唔可以解除北韓核威脅?呢d都係呢個post探討議題。

彈道導彈對美國威脅程度評估

火星14型洲際彈道導彈,長19.5米、直徑1.7米,使用液體燃料作推進劑。北韓兩次試射均以大仰角彈道試射,導彈落入日本海,而使用正常彈道,攜帶1枚500公斤級重返大氣層載具(RV),射程近10000公里,足夠打擊美國西岸城市。由此可見,火星14型洲際彈道導彈對美國的威脅不可謂不大。

火星14型ICBM晚間發射照片

美國可用的應對措施:先發制人式核攻擊

美國應對北韓導彈威脅最大的優勢是經歷數十年建成,強大的天基和陸基傳感器系統,可以發現並追蹤定位北韓導彈部署的情況。假如美國主動向北韓導彈發射車展開先發制人式核攻擊(nuclear first strike),利用前沿抵近部署響日本海既俄亥俄級SSBN向北韓的導彈發射車陣地發射攜帶8枚W88 47.5萬噸級當量分導式核彈頭既三叉戟II D5型潛射彈道導彈(SLBM),利用平直彈道飛向北韓發射車陣地,北韓的預警體系將無法有效作出反應。理由係由於三叉戟導彈飛彈速度達24馬赫,從日本海飛抵北韓僅需10分鐘不到的時間,而缺乏戰略縱深的北韓從發現來襲導彈到通報指揮部,到傳令導彈發射車開始機動火啟動核反擊程序,導彈發射車可以機動的範圍只有數公里以下,發射車將難逃被核爆衝擊波掀翻的命運。甚至有可能在美國導彈擊中目標前,導彈發射車仍未接到指令開始機動。
結論:由於缺乏戰略縱深,北韓導彈在美國首輪核攻擊下的生存能力很弱,很容易被一舉全殲

CNN報導俄亥俄級SSBN在南韓停靠岸,一艘俄亥俄級就擁有10分鐘內徹底摧毀北韓的戰略核力量
http://edition.cnn.com/2017/04/24/politics/uss-michigan-nuclear-sub-south-korea/index.html

俄亥俄級SSBN,最多可攜帶24枚三叉戟II D5型SLBM
美軍海基戰略導彈的大殺器:三叉戟II D5型SLBM,可攜帶8枚W88或多達12枚W76核彈頭攻擊敵方發射井及發射車

美國可用的應對措施:常規攻擊

除了使用前沿抵近部署SLBM對北韓的導彈發射陣地進行核打擊外,美國還可以倚賴強大的常規打擊力量,利用B-2隱型轟炸機、F-22及F-35隱型戰機攜帶精確制導炸彈,以及利用2000枚以上的JASSM/JASSM-ER及攜帶常規或核彈頭的戰斧式巡航導彈進行外科手術式打擊,破壞北韓指揮體制、導彈發射系統、機場等戰略部署位置。由於隱型轟炸機及帶隱形特徵的JASSM系列導彈能夠避開北韓的防空系統,它們命中目標時可能北韓的指揮仍未察覺自己正遭受攻擊。即使是非隱形的戰斧式巡航導彈,由於能以亞音速作低空巡航,大大加大了北韓雷達探測的難度。因此美國能以常規手段無聲無色癱瘓北韓的指揮系統,及剝奪它對美國及其盟友的核反擊能力。
結論:即使美國只採用常規手段對付北韓導彈,因為美軍的投射手段多以隱形的系統為主,到北韓能夠發現自己正遭受攻擊已經是太遲。北韓的各層指揮樞鈕及核反擊系統面對美軍全方位大規模攻擊生存能力成疑。

B-2及F-22進行編隊飛行,美軍隱形大殺器
美軍戰機投下JASSM-ER巡航導彈

戰斧式巡航導彈

導彈攔截系統

假設經過美國首輪常規或核攻擊後,北韓仍有殘餘未被殲滅的火星14彈道導彈,考慮到北韓的核武數量最多只有數十枚,能生存下來的核彈頭數目其數量應該在十枚以下。如果這十枚左右的核導彈能活著射出發射車,美國將可動員另一套先進的導彈防禦系統進行「補漏」。

美國在太空部署有SBIRS早期紅外預警衛星,可以在北韓導彈發射的一刻就向美軍發出預警。此外由於距離北韓本土近,美軍部署在日本海的伯克級神盾驅逐艦上的雷達亦可於導彈發射之初捕捉到發射。另外部署在太平洋的海基X波段雷達亦能迅速發現北韓對美國本土進行的彈道導彈攻擊。此時神盾驅逐艦指揮中心將利用艦載計算機計算出導彈彈道及預測落點,並自動生成火控解算。並不需要多少時間,美軍部署在日本海的神盾驅逐艦就能利用SBIRS及雷達數據發射射程達到2500公里、燃盡速度達4.5km/s的標準3型IIA攔截彈(SM-3)對火星14進行早期攔截。由於火星14屬於液體導彈,加速度慢,加上助推段尾焰紅外特徵明顯。SM-3的LEAP動能獵殺載具(kill vehicle)的紅外尋標器(IR seeker)將很容易發現正上升的火星14導彈。因此大部分火星14導彈將在遠離美國本土的日本海上空,還未釋放出彈頭之前就被SM-3幹掉。

即使極少部分(數枚)火星14能躲過神盾系統及SM-3的攔截,由於火星14只能攜帶單個500公斤級小型彈頭才能飛抵美國,因此此導彈不能攜帶誘餌及突防裝置。此時,位於阿拉斯加的陸基中段反導(GMD)攔截系統將啟動,並對餘下的火星14及其核彈頭皮進行二次攔截。由於缺乏誘餌及突防裝置,裸奔的核彈頭將成為GMD面前的好標靶。即使仍然有1~2枚逃過GMD,美國仍有最後一次機會以部署在西海岸的神盾艦以SM-3進行末段攔截。美國的三層反導系統確保北韓等只有少量核彈頭及洲際導彈的國家對美國進行核攻擊時,有多次機會擊落來襲的導彈
結論:即使北韓有極少量導彈逃過美國先發制人式的常規或核攻擊,美國日漸完善的導彈攔截體系將確保這些核彈頭在命中目標前就在空中被擊落。

SBIRS導彈早期預警系統架構
SBIRS衛星,美軍已發射9枚衛星,足夠覆蓋全球,監控各國導彈發射
標準3型的發展,從Block IA到Block IIA
SM-3所用的LEAP動能彈頭
SM-3 IIA能對洲際彈道導彈的助推段及末段進行攔截
美國SBX海基X波段雷達,能夠探測到北韓的導彈發射
陸基中段反導(GMD)的攔截彈,有能力對ICBM進行全程攔截

總結

雖然北韓經過火星14型ICBM試射後獲得了對美國本土進行打擊的能力,然而美國前沿抵近部署的超強大常規及核打擊能力將在北韓導彈未射出前中和(neutralize)其威脅,即將它們摧毀在地上。另外多層式導彈防禦系統將在天基SBIRS預警系統及各類預警雷達的協助下充當「補漏」的角色,對漏網之魚進行早期攔截。由此可見,美國面對北韓的核訛詐,手上仍然有相當數量的牌可打,這些都是對美國有利的談判籌碼。