1、OutlinenCluster of Cases of Severe Acute RespiratorySyndrome in Hong Kongn醫療資料探勘研討報告醫療資料探勘研討報告 何謂基因 基因定序 SARS基因定序 nOpinionResults醫療資料探勘研討報告醫療資料探勘研討報告(一一)何謂基因 n基因是細胞核內染色體上一段“有意義”的DNA(去氧核醣核酸)序列n所謂有意義 DNA,是指這段DNA可經由轉錄(Transcribe)和轉譯(Translate)的過程,形成特殊序列的氨基酸(AnimoAcid)n完整序列的氨基酸就是大家常聽到的蛋白質 nDNA是由四種鹼基(bas
2、es)所構成,分別由A、T、G、C所代表nDNA是雙股螺旋結構,上下兩股必須對應,而對應的規則是A配T,G配C n基因組是組成內含生命指令的去氧核醣核酸()的基因組合n人體內約有三十一億二千萬對鹼基,構成三萬五千到四萬個基因n基因是由鹼基對構成的群組,每個基因就是構成一個生命的單一指令n有缺陷的基因會導致各種疾病n人體估計有八萬到十二萬個基因n存在於廿三對染色體當中,是決定遺傳特徵的基本單位n每一個基因都代表一組建構生物個體的遺傳訊息,並透過A、G、T、C四種密碼序列組合,製造特定結構的蛋白質,來執行複雜的生物功能n估計人類共有三十億個遺傳密碼序列,只要全部解讀出來,就可知道構成人體的基因是什
3、麼,並進而建構人體藍圖的每一細節n人類有廿三對染色體、約卅億鹼基對(鹼基對是基因組成的基本單位)n定序方式是把染色體打成每片約含三千五百鹼基對的碎片,讀取碎片兩頭五百到一千鹼基對,進行比對n若在不同碎片讀到完全一樣序列,就把一樣的地方重疊後,將兩段碎片接起來,逐步排列出完整基因序列n米色雙螺旋代表雙股鹼基n彩色橫條紋代表連結兩對應鹼基的氫鍵n每十對鹼基的DNA會剛好旋轉360度n並不是這1,700對的DNA都會表達出來n只有我們用黃色部份表示的DNA大約400對會被表達n而經過轉錄和轉譯的過程,形成如下所示的胰島素氨基酸序n列:MALWMRLLPLLALLALWGPDPAAAFVNQHLCGS
4、HLVEALYLVCGERGFFYTTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCNn未被表達出來的基因序列並非毫無作用n它們負責調控基因表達的強弱、時機等等n例如在人體內每一個細胞的胰島素基因都完全相同,可是,只有胰臟裏的蘭氏小島裏的細胞能夠實際產生胰島素n主要原因就是在其他細胞(包括剛才例中的外皮細胞)內,胰島素的基因表達是OFF,而在細胞是ON。n人類中的DNA有99.9%都相同。不論是愛因斯坦還是比爾蓋茲,都有同樣14萬個左右的基因,位於23對染色體上的固定位置。n剩下的0.1%的差異,雖然比率很小,可是人有30億
5、對鹼基,0.1%的變化也代表了多達3百萬不同的排列組合,影響每個人所遺傳的各種特性,例如膚色、眼睛的顏色、身高、個性及智力等。n人和黑猩猩的DNA只有1%到2%的不同而已n科學家可以由基因的相似度和差異度去探討生物種類之間的演化關係n細胞生物例如酵母菌和人之間仍存在許多非常相似的重要的基因,因此藉由研究這些基因在酵母菌內的作用,來推論這些基因在人體內的功能n每個人的基因不同,DNA控制每個人的遺傳特性,解碼之後,知道人體有30多億個位點,每個位點有四種可能(A、G、T、C)在不同的人體上,DNA差異約有千分之一,但是DNA差異分為很多種有單一位點差異(SNP)片段重覆次數不同的差異等,但是SN
6、P的比重最大,占所有DNA差異的九成以上n個體化醫療就是在這樣的趨勢下產生n每個人的DNA不一樣,所以外貌、體質不同,適合的藥物也不同,基因解碼後,提供了量化基因差異的技術基礎基因定序 n由於基因組是建構生物個體的藍圖,因此要完全瞭解一個生物個體中所有的生命現象n其先決條件就是要知道這個生物個體中基因組所有的DNA核序列n從七年代開始,科學家們就汲汲於追求對某些簡單生物基因的完全定序n最早基因被完全定序的生物是一種叫作174的噬菌體n噬菌體的基因全部只有5,386個鹽基對(base-pair)n一九七七年英國劍橋大學的Sanger教授首先完成它的基因定序n一九八二年,Sanger教授又完成了一
7、個比較大的基定序(共有4萬8千個鹽基對),叫作噬菌體的基因定序n隨後陸續有一些更大的基因組,像巨細胞病毒(Cytomegalovirus,23萬個鹽基對)、天花病毒(smallpox,18萬6千個鹽基對)、粒線體(mitochondria,18萬7千個鹽基對)和葉綠體(Choloroplast,12萬1千個鹽基對)等的基因被完全定序基因研究歷史 n人類基因組解碼計劃(HumanGenomeProject,又稱為基因組定序計劃)是基因科學領域至今最龐大的合作研究計劃n基因組計劃主要的目標,是解讀構成人類二十三對染色體所記錄的鹼基(nucleotide)n並尋找出多達十四萬各別基因(gene)的位
8、置及功能n計劃最早的構想始於八十年中期n在學術界廣泛的研議後n美國國家衛生院(NationalInstitutesofHealth)為首的機構,開始進行解碼計劃的組織和草案n基因組解碼計劃的第一階段定位於原始的基因定序n所謂基因定序,就是找出每一個DNA(去氧核醣核酸)中,由四種鹼基A、T、C、G所組成的遺傳密碼排序n目前所知,人類的二十三對染色體當中,由A、T、C、G兩兩配對的鹼基排列,總共超過了七十兆種n目前為止,以美國為首和英、德、法、日等十五個國家,超過六十個各別的大學和研究機構,正分工進行鹼基的定序工作n在官方及學界的支持下,這項國際性的基因定序工作的初步目標,預定將在1998-20
9、03內達成n初稿在2000年就已經出來了n由於計劃的時程不斷地超前,以及相關生化,工程和電腦技術的進步n負責總單位美國國家人類基因研究院(NationalHumanGenomeResearchInstitute),對於基因組計劃的進度和目標,先後修改了兩次n在一九九O年最初的規劃中,基因定序的工程估計要花費十五年以上,而主持單位只打算集中相關的研究資源投入重點目標n在一九九三年和九八年,基因組計劃的目標分別被擴大和增加n最新的章程不僅包函了原始的基因定序,還新增了對於各基因組在染色體上的區分和定位,並且還有多項研究試圖要了解它們所扮演的遺傳密碼的內容n為了推動和加速多達三十億人類鹼基的解碼,美
10、國政府於一九九七年開放了原本只允許官方和學術機構參與的政策n由於先進國家目前對於人體相關的研究都極為敏感,在道德和規範並未達到多方的共識之前,這項新的政策,如同所預期的,引起了極多的爭議n在新政策的支持下,美國民間以及私人的機構得以發展人體基因的定序研究,並擁有解碼基因的使用和專利權n在眾多投入基因定序的廠商中,美國基因科技大廠-賽勒拉(CeleraGenomics)生物科技公司為其中的佼佼者nCelera公司是美國生技大廠鉑金埃爾默(PerkinElmar)公司轉投資的子公司之一n這兩家生技公司因在1997年宣佈合作,並預定在2001年共同完成人類基因組解碼計劃而轟動全球nCelera與PE
11、公司預定的基因組定序計劃進度,比美國聯邦政府提前四年,而且只須花費三到四點五億美元的預算,相當於美國政府為完成基因解碼計劃所編列經費的十五分之一n塞雷拉基因公司已於2000年月完成所有人類基因組的編碼n但由於政治力量的介入,商業利益與股價的考量加上和人類基因組研究院的爭執,塞雷拉和人類基因研究署代表共同在美國總統克林頓的安排下,於2000年月27日在白宮共同宣佈人類基因組計劃的初步完成n雖然如此,直到西元兩千年底,美國政府主導的人類基因組研究院實際上只完成了人類基因百分之二四點一的排列編碼,和百分之六十七未經排列的草碼,剩下尚有百分之十三並未解讀n相對比較,塞雷拉已完成了三個版本的人類基因圖譜
12、,涵蓋了百分之九十九點九的人類基因內容人類基因體解讀計畫 n人類基因體解讀計畫於是在一九八六年公開露面n為了分攤費用及節省時間,於是出現國際人類基因定序聯盟,由美、英、德、法、日及大陸等六國(通稱G6)共同分攤進行基因定序工作n台灣在陽明大學及榮民總醫院團隊負責解讀一千萬個密碼序列n人類基因體定序在歷史上只有一次機會,只要某個國家做出定序,其他人再公布就沒有任何意義了榮陽團隊 n榮陽團隊主要是由一群來自榮總與陽明大學的研究人員組成,目前約有五十名成員n雖然一直到二年,才對外界喊出榮陽團隊這個名號n但是早在一九七七年,榮陽團隊就開始進行與人類肝癌有關的第四號染色體定序工作n台灣榮民總醫院與陽明大
13、學組成的榮陽團隊,參與完成第四對染色體基因鹼基定序台灣人類基因抗體庫 n台大醫院也正籌備國內第一座人類基因抗體庫,將於今年底完成n目前已知人類抗體種類約有一百億種n資料庫的建立除了可以預測國外疫苗的準確度,更能針對登革熱等慢性病毒疾病,進行基因療法n台大醫院已經完成台灣本土B型及E型愛滋病毒的基因定序工作,並與國外的愛滋病基因序列進行比對n人類基因解碼草圖公布後,包括工研院生醫工程中心、台灣基因公司及榮陽團隊等研究團體與基因公司都認為,這將為台灣帶來發展基因資訊,以及基因晶片產業的機會n在台灣的基因資訊與晶片廠商的規模有限下,業者最需要的,就是政府應運用國家的力量,出面取得基因定序資料的授權,
14、進而再轉授權給台灣的生技業界應用,不要讓台灣的生技業者輸在起跑點上n工研院生醫工程中心主任李鍾熙指出,全球基因定序工作完成後對於基因定序資料的檢測與分析工作運用這些所得到的檢測與分析資料,作為開發生物的基因晶片、新藥或者從事基因治療使用SARS基因定序 n根據國際衛生組織WHO的菌種培植和基因檢定結果証實n造成SARS疫情的輪狀病毒(coronavirus),是一種從未在人體和動物上被發現的嶄新形態.由於已確認的蛋白及RNA序列明顯的與流感病毒(Influenza)和先前懷疑的反轉錄病毒(retrovirus)不同n基因以單一長條,且不需經由反轉錄酵素(reversetranscriptase
15、)的方式在宿主體內增生,所以可以在極短的潛伏期內發病,也不易突變nWHO也公佈了檢驗SARS病毒用途的聚合酵素連鎖反應(PCR)探針序列(primers),以供全球實驗室作病原體的篩檢 nBNIoutS/BNoutAs:senseATGAATTACCAAGTCAATGGTTACantisenseCATAACCAGTCGGTACAGCTAC(FraGmentlenGth195bp)nBNIinS/BNIAs:senseGAAGCTATTCGTCACGTTCGantisenseCTGTAGAAAATCCTAGCTGGAG(Fragmentlength110bp)nSAR1s/SAR1as:sens
16、eCCTCTCTTGTTCTTGCTCGCAantisenseTATAGTGAGCCGCCACACATG(Fragmentlength150bp)Opinionn基因定序完成會帶來無限商機基因定序完成會帶來無限商機了解遺傳密碼的序列後了解遺傳密碼的序列後接下去就要進一步探索序列背後代表的意接下去就要進一步探索序列背後代表的意義義即每一組密碼攜帶的遺傳功能及其多樣性。即每一組密碼攜帶的遺傳功能及其多樣性。n了解每個人遺傳資訊的多樣性,可發展了解每個人遺傳資訊的多樣性,可發展預防醫學預防醫學n得知不同人生病的機率及型態,及對藥得知不同人生病的機率及型態,及對藥物的反應物的反應Opinionn將來也
17、可利用基因晶片的檢查,在出生時就得知以後可能有的將來也可利用基因晶片的檢查,在出生時就得知以後可能有的遺傳風險,並據以設計適合的生活型態,當成終身依循的準則遺傳風險,並據以設計適合的生活型態,當成終身依循的準則n從基因的研究個體化醫療的初步發展是避免將藥物用到不適合從基因的研究個體化醫療的初步發展是避免將藥物用到不適合的病人身上的病人身上例如止痛藥阿斯匹林在某些人的身上,可能引起極為嚴重的過敏現象,例如止痛藥阿斯匹林在某些人的身上,可能引起極為嚴重的過敏現象,甚至導致死亡甚至導致死亡如果能事先篩選病人,配合如果能事先篩選病人,配合DNA身份證,就能避免緊急情況下發生無身份證,就能避免緊急情況下
18、發生無法挽回的悲劇法挽回的悲劇個體化醫療將可發展積極性地為病人與藥物媒合,將藥物與病人個體化醫療將可發展積極性地為病人與藥物媒合,將藥物與病人的配對,分為顯著有效、不確定、顯著有害等不同程度,的配對,分為顯著有效、不確定、顯著有害等不同程度,分級愈細,將來病人受惠就愈大。分級愈細,將來病人受惠就愈大。n基因預防醫學花費很大,生命改善也可能變成富人的專利。此基因預防醫學花費很大,生命改善也可能變成富人的專利。此外,保險公司是否有權利知道個人的基因,若基因不良,是否外,保險公司是否有權利知道個人的基因,若基因不良,是否應拒保或增加保費、基因是否該列為隱私權,都應該討論應拒保或增加保費、基因是否該列為隱私權,都應該討論