2011年1月31日 星期一

Analysis and modeling of Complex Time Series

AAPPS Bulletin   April 2007
Highlight of the Issue
Analysis and modeling of Complex Time Series

Preface
Chin-Kun Hu, Guest Editor


Modern science started from the establishment of classical mechanics, which owes very much the works of Tycho Brahe (December 14, 1546 October 24,1601), Johannes Kepler (December 27, 1571 November 15,1630), and Sir Isaac Newton (25 December 1642 20 March 1727).


In late 16th century, Tycho Brahe built large and accurate astronomical instruments first on the island of Hven, then at an observatory near Prague.
He took many careful measurements about the motion of planets in the sky. Johannes Kepler was Tycho Brahe's assistant from 1600 until Tycho Brahe's death in October 1601. Kepler inherited Tycho's position and records of planetary motion. Kepler used such data to formulate famous three laws
of planetary motion. On the basis of Kepler's three laws of planetary motion, Newton formulated universal law of gravitational interactions and laws of motion. The classical mechanics was thus established. Based on classical mechanics, one can calculate accurate trajectories of planets in the sky.
The development of classical mechanics is a good example of scientific research: from accurate original data (records of planetary motion) to phenomenological theory (Kepler's three laws of planetary motion), then to fundamental theory of nature (Newton's laws of gravitational interactions and motion).


In comparison with time series for the location of the planet in the sky, the time series of financial markets, physiological signals, or earthquakes is much more complicated. The development in the analysis and modeling of such complex time series is still in the infant stage.


In 1900, French mathematician Louis Bachelier (1870-1946) proposed random walk model for financial time series.  After the development of computer science and technology, a great number of financial time series have been recorded. Various methods and ideas have been proposed to analyze or model the financial time series. From distributions of returns and eigenvalue distributions of stock-stock correlation matrix, it has been found that  finanical time series does not follow random walk model.


In this special issue of AAPPS Bulletin, we collect some articles about the analysis and modeling of complex financial, physiological, and earthquake time series which were done in Asia Pacific area in recent years.


``What can we learn from analysis of the financial times series?'' by Bing-Hong Wang at University of Science and Technology of China (Hefei) and Shanghai Academy of System Science gives a brief review on the analysis and modeling of financial time series, which were done in his group. Their results show that the returns of Hang Seng index in Hong Kong do not follow the prediction of random walk model.


``Coupled random walks approach to complex financial time series’’ by Wen-Jong Ma at Institute of Physics of Academia Sinica (Taipei) reports a model proposed by Wen-Jong Ma, Chin-Kun Hu, and Ravindra E. Amritkar, which can give correct eigenvalue distribution of stock-stock correlation matrix.


``Multiscale fluctuation analysis of complex signals'' by Ken Kiyono at Nihon University, and Zbigniew R. Struzik and Yoshiharu Yamamoto at The University of Tokyo reports their probability density function (PDF) analysis method and applications of this method to study healthy human heart rates during normal daily life and financial time series before, during and after the occurrence of the Black Monday crash.


``Phase statistics approach to physiological and financial time series'' by Ming-Chya Wu at Research Center for Adaptive Data Analysis of National Central University gives a brief review on the application of empirical mode decomposition and phase statistics to the analysis of physiological and financial time series.


``Event-event correlation in seismicity and aging of aftershocks''  by Sumiyoshi Abe at Mie University and Norikazu Suzuki at Nihon University reports a recent discovery of the aging phenomena and scaling law in complex seismic time series.


   The reports of this special issue represent a sampling of the development of a new research field whose further development will affect not only our ideas of the world, but also our life in modern society.




Chin-Kun Hu
Institute of Physics
Academia Sinica
Taipei 11529, Taiwan

Note: This is the Preface of  AAPPS Bulletin April 2007 issue on
          ``Analysis and modeling of Complex Time Series''.

印度加爾各答之旅

緣起
    印度是個充滿神秘魅力的大陸,在人類文明的發展史上,她曾有過傲人的成績,例如:曾經誕生佛教創始人釋迦牟尼、1913年諾貝爾文學獎得主泰戈爾(Rabindranath Tagore)1930年諾貝爾物理獎得主拉曼(Venkata Raman),以及倡導不合作主義爭取印度獨立的聖雄甘地。不過,她也是全球人口超過十億,平均生活極度貧窮的國家之一。她所展現的多元與矛盾面貌,令人充滿好奇,想一探究竟。

    所以,2001年春天,從電子郵件收到印度加爾各答的波思(Bose)基礎科學研究中心Manna教授來信,邀請本人於200211419日至加爾各答參加第四屆加爾各答統計物理國際會議,並發表邀請演講,為了一探印度這個神秘大陸的面貌,本人欣然接受邀請。

踏上旅途
    由於2001年夏天,從中央研究院翁啟惠院士處得知,他在印度開會的經驗是該地衛生條件極差,用高級旅館的自來水漱口還感染病毒,所以出發時特別帶了數小包廣達香肉鬆、一盒鳳梨酥及一盒衛生紙,行李中如往常一樣帶了一部筆記型電腦及BJC80印表機。2002112(週六)下午搭乘新加坡航空公司的飛機,經新加坡轉機,飛往加爾各答。在飛機上遇見韓國漢城大學金斗哲(Doochul Kim)教授帶著一位研究生也參加同一會議。我座位旁坐了一位在印尼工作的印度籍工程師,承他告知一些有關印度的訊息,得知印度和新加坡之時差是兩個半小時,全印度只有一個時區。加爾各答是印度重要城市,人口超過一千萬,這使我對加爾各答有了某種期盼,該是一個頗現代化的城市吧?

第一印象
    不料,飛機於當地時間約下午9:00抵達加爾各答國際機場,我的第一印象是:一個擁有一千萬以上人口的城市,何以機場如此狹小而落後?

    領到行李後,我就以美金兌換印度幣盧比(1USD:48RE)。通過海關後,看到會議主辦單位的工作人員拿著我們的名牌正等著接機。等到大家都到齊後,往停車場去,這時有人自動過來幫忙推車,並宣稱是跟會議主辦單位一起來,實際上卻不是,我只好付他們100盧比才得以坐上會議主辦單位安排的旅行車,開往會議地點。

    沿途覺得交通很亂,車行方向和英國一樣,全都靠左行駛。沿途喇叭聲不斷,令我想起幾十年前的台灣街道。路上煙塵瀰漫、人車爭道,恍如進入另一個世界。

    約半小時到達波思國家基礎科學研究中心附設的一個招待所。報到後,主辦單位給每人一罐1500c.c.的礦泉水。我問接待人員是否可打長途電話回台灣報平安,他們說沒有辦法。

    進入招待所的房間後,發現這個約五坪大的單人房還算不錯,有浴室、廁所,不過蚊子到處飛舞,堪稱奇觀,好在室內備有蚊帳,當時已經夜晚十一點多了。一夜好睡。唯一覺得特別的是房門鎖特別大,類似監獄用的那種樣式,感覺很特別。

波思研究中心及其附近環境
    次日是週日,清晨五點半醒來(台北時間上午八點),覺得有點餓,吃了兩包從台北帶來的鳳梨酥、一包肉鬆及礦泉水。六點半,天色已亮,走到招待所外散步,才看清周圍環境。
    波思研究中心佔地約五甲,四周設有圍牆,門口有警衛,主要建築兩棟,一棟就是招待所,另一棟是辦公室、電腦室及會議廳。招待所內有花圃,並有一座波思(Satyendra Nath Bose1894-1974)的銅像。20年代初從未出過國的波思從加爾各答計一篇論文給愛因斯坦,在這篇論文中波思提出新的統計力學方法計算光子的統計性質。愛因斯坦讀後大為讚賞,並將波思的方法推廣到自旋為整數的理想氣體,而以兩人的名義將論文寄出去發表。這篇論文指出極低溫時自旋整數(0)的氣體包含有限比例處於最低能量狀態的原子(或分子),後來科學家稱這個現象為波思‧愛因斯坦凝結(Bose-Einstein condensation)。自旋為整數的粒子稱為「波色子(Boson)」即因波思的名字而命名。2001年諾貝爾物理獎就頒給以實驗證實波思、愛因斯坦凝結的科學家Eric A. Cornell, Wolfgang KetterleCarl E. Wieman。波思研究中心即為了紀念波思而命名。

    在園區內散步時,發現裡面還有員工宿舍,散步約半小時後,徵得警衛同意,走出園區外街道散步。

我發現加爾各答建築物地址的設計很有趣,主要以區塊(Block)來命名,透過兩個英文字母成為區名,如AA區、AB區……,每個區塊內的建築再以數字編號。波思研究中心,就位於加爾各答鹽湖城(Salt Lake City)JD區。

    沿途走出去時,發現空氣中有焚燒草類的煙味,街角有違章建築,陳設著簡陋的床、鏡子……等,並賣些零售貨品。還見到一個景象,有人在街角賣甘蔗,滿地的甘蔗皮,任其棄置。

    波思中心左側隔兩個區塊有一個大的體育館,右側有條小河流,河上有個狹窄的人行橋,可看到上面的行人及腳踏車,走過去有個公園遊樂場所。沿著河邊有很多住戶,那些房舍看來都相當簡陋,牆是茅草編的,屋頂是塑膠片蓋的。

    8:00回招待所,深深覺得自己好像住在「天堂」裡,吃早餐,付了18元盧比,有煎蛋、麵包、奶茶等,不過令我驚訝的是,雖有叉子、湯匙等餐具,但有許多印度人卻只用手抓著吃。不過靠餐廳門口處有個洗手檯,大概供食客餐前洗手之用吧!早餐後,再度出去到較遠處散步,發現外面街道上的有些房子建築不錯,指標上寫的是印度銀行職員宿舍及訓練中心,有私家車的居民似乎不少,不過大環境不佳,馬路品質差,尤其剛才在街角見到的甘蔗皮,似乎無人聞問……。

    我在路邊用五盧比買了6個蕃茄。回招待所後,用筆記型電腦修改與林財鈺合作的論文:用重整群法研究沙堆模型。

    下午一點吃午餐,遇見數位來開會的教授及學生,飯後與Manna的學生到另一棟建築去見Manna教授,Manna是研究自組臨界現象的專家,1991年提出一個隨機自組臨界現象的模型被學界稱為Manna模型。Manna帶我到電腦室查閱及寄E-mail,從此處到中央研究院的連線還算快。回招待所略作休息,向服務人員要一張加爾各答的地圖,他們表示沒有,只給我一張當地鹽湖城的地圖。

    按圖索驥,走半個小時到鹽湖城中間的大公園—中央公園。我付了五盧比,拿到入場券參觀公園,遊客不少,除了雙雙情侶,也有全家出遊的畫面。公園中有湖,湖上有遊艇。我稍逛一下,就出來沿河往遊樂園前行,在河岸上見到政府立的告示牌,說明這些土地為政府所有,居住者違法。難怪,已經傍晚了,該是掌燈時分,而沿途的違章建築中無水無電,尤其可看到大人帶著小孩拿著裝礦泉水的空瓶,從他處提水來使用的情景。想到原始時代的人類就是這樣沿河而居,而今在印度,仍然可以目睹這樣的景觀。

    花了25盧比,入遊樂園參觀,繞了一圈,天色已黑,出來時,買了一串香蕉,15盧比。走回招待所吃晚餐,見到波士頓大學H.E. Stanley教授夫婦及一群學生一起進餐。

開會概況
    此次會議由兩個單位共同主辦:波思國家基礎科學研究中心及加爾各答印度科學培育協進會(Indian Association for the Cultivation of Sciences, IACS)。前三天的會議在協進會舉辦,所以十四日上午早餐畢,8:00坐公車到協進會,車程約半小時。沿途看到鮮明的共產黨鐮刀標誌,據印度學生說,此區的執政黨是共產黨。

    1876IACS創立於加爾各答,是印度最早致力於推展基礎科學研究的組織。19071933年,拉曼(C. V. Raman)IACS工作,他曾在IACS的刊物發表一篇有關樂器理論的論文。1922年起,他與合作者一系列有關光由分子非彈性散射的研究導致發現學界所稱之拉曼散射。1930年,拉曼由於這個貢獻而得到諾貝爾物理獎。

    報到以後,除了如一般會議領到袋子、會議手冊、名牌、IACS簡介、午餐券之外,大會還贈送每個與會者一朵新鮮的玫瑰花!

    9:30開幕典禮。由於IACS是諾貝爾物理獎得主拉曼工作過的地方,典禮結束後,我向會議負責人Manna教授建議會後參觀拉曼工作的實驗室,他立即答應聯絡事宜。
   
十四日早上和下午各有三場演講,講員之中印度人M. Barma教授是國際純粹及應用物理聯合會(IUPAP)統計物理委員會委員,20017月我在墨西哥坎昆(Cancun)參加第21IUPAP統計物理國際會議時曾遇到他。印度人S. Taraphder報告蛋白質結構與蛋白質輔助反應的關係,印度人P. Sen報告一個網路顯示相變的模型。19967月筆者和林財鈺在物理評論通訊(PRL)發表一篇論文,指出在臨界點上,二度空間展透模型(percolation model)可出現一個以上的展透集團,這與當時學界普遍流行的觀念不合,因此頗引人注意。不久後,P. Sen將我們的結果推廣到二度以上空間。

    當天會場上也見到研究自組臨界現象與沙堆模型的專家D. Dhar1991年,我曾請他到台北參加第一屆台北統計物理國際會議。有一次和Dhar聊天,他說在印度說英語代表較高的社會地位,他第一次到美國時,看到各行各業的人都說英語,覺得有點挫折感。

    在磁鐵、流體、二元合金、二元流體、易行模型、展透模型等系統,我們都必須調整參數(例如磁鐵或易行模型的溫度)才能讓所研究的系統處於臨界點或附近以呈現臨界行為(如尺度律)1987Per BakChao Tang(湯超)K. Weisenfeld(BTW)等人指出許多自然界的現象(例如地震)不需要調整參數也能呈現臨界行為,因此他們提出自組臨界性(self-organized criticality, SOC)的觀念,並且提出定義於晶格上的沙堆模型,電腦模擬顯示BTW沙堆模型確實能呈現SOCD. Dhar以發現平面晶格上BTW沙堆模型一些準確結果而出名。

會場上也見到R. E. Amritkar,他是研究非線性動力學的專家,也是加德(P. M. Gade,曾在我的研究群研究)的博士論文指導教授。他說M. BarmaD. Dhar,和他自己都是印度科學院的院士。他說開院士會議時,科學院只支助院士本人由工作地點至會場的火車票,要搭飛機得自己想辦法。我請Amritkar到我的研究群訪問,他欣然同意。

    5:20演講結束,6:00開車回招待所,在等待的時間,蚊子成群飛舞,有人提出警告,可能會傳染瘧疾,要小心。

    晚餐後,發現胃腸不舒服,一直上廁所,後來還有翻胃、嘔吐的現象,回住處要洗澡,居然無熱水,只好洗個冷水澡。後來才知道,要等很久才有熱水,不像我們在台灣,開關一打開,熱水即來,平日已習慣如此便利的生活,忘了世界上有些地方的生活方式還是相當落後的。當晚無法成眠。

    十五日身體不適,無法開會,決定在招待所休息,午餐喝礦泉水,吃鳳梨酥、肉鬆和水果。總算經過一日休息,精神恢復,次日再去開會。
   
十六日上下午各有四場演講,比較值得注意的是印度人Anjan Kundu報告可積分系統(例如二度空間易行模型)的分類,韓國人金斗哲報告無尺度網路(scale free network)工作量之分佈,德國人Rudolf Hilfer報告分數微積分在統計物理的應用,以及德國人Thomas Lux報告一個經濟動態模型。Lux曾到政治大學和中央研究院訪問過,他曾和政大陳樹衡教授合作發表過論文。

    下午四點休息時間,參觀拉曼用的實驗設備。當時他用很簡陋的儀器,卻獲得諾貝爾獎,例如散色光經過菱鏡照在底片上,底片曝光一天,才能完成實驗。

    五點多會議結束,主辦單位帶大家去參觀當地一座新蓋的吊橋,此橋是他們很得意的新工程,再去參觀維多利亞公園,由於天色已暗,公園無燈光設備,無法參觀,改至旁邊的手工藝展覽場,我花了100盧比,買了一個手工製作的玫瑰花禮盒。這是會議主辦單位安排的唯一參觀活動。

    十七日(週四),回到波思研究中心開會。上午有四場演講,下午有二場演講及壁報論文發表。比較值得注意的是荷蘭人Bernand Nienhuis報告二度空間展透模型一些準確結果,印度人Neelima Gupte報告耦合非線性系統之分叉現象、吸引子等問題,法國人Alain Pumir報告湍流理論(Pumir也研究心跳動力學),印度人Anil Kumar報告離子流體之臨界現象,德國人Joachim Krug報告用Eigen生物演化模型研究的一些結果,印度人Sanjay Kumar報告表面上聚合物之相圖。

    當天見到由Bangalore來這裡開會的Chandan Dasgupta197811月至1979年夏天我在加州大學聖地牙哥校區訪問時,曾經和他及已故的馬上庚教授合作研究自旋玻璃(spin glass)低溫的動態行為和一維反鐵磁量子自旋模型,而於1979年在物理評論B(PRB)和物理評論通訊(PRL)各發表一篇論文。

    在鐵磁性物質,最鄰近原子自旋的耦合常數J大於0,因此低溫時,最鄰近原子的自旋喜歡指向同一方向;在反鐵磁性物質,J小於0,因此低溫時最鄰近原子的自旋喜歡指向相反方向。在自旋玻璃,鄰近原子自旋的耦合常數有的大於0有的小於0,因此低溫時自旋玻璃的性質頗複雜。在PRB那篇論文,我們發現低溫時自旋玻璃有許多暫穩態(metastable state),透過翻轉鄰近自旋形成的集團,可以將自旋玻璃由一個暫穩態轉到另一個暫穩態。自旋翻轉的過程必須跨越一個能障(energy barrier),由能障大小的分布及自旋集團的動態行為可以解釋自旋玻璃低溫的動態行為,這篇論文發表後不久頗受學界注意。在PRL那篇論文,我們以重整群(renormalization group)的觀念研究耦合常數隨機分布的反鐵磁一維量子自旋模型,發現各種不同耦合常數分布,比熱及磁化率隨溫度的變化都是以乘冪(power law)的形式出現,近年來這篇論文頗受學界注意。

    當天也碰到Rahul Pandit博士,20017月在墨西哥坎昆(Cancun)舉行的第21屆統計物理國際會議,他代表印度申請於20047月在Bangalore舉辦第22IUPAP統計物理國際會議,而爭取到主辦權。

用餐時,是在招待所的屋頂,採自助式,由於週二以後,我不再吃印度作料,所以不再有不良反應。晚餐後,Dhar教授找我和他的學生聊天。我談及台灣的中央研究院準備招收國際研究生,並說明大概情形,例如每位外籍學生每個月有三萬台幣生活費等等,但Dhar對印度學生說:「我當然不希望你們去台灣唸書!」我覺得印度研究生很認真,水準也很高,從他們做的壁報論文(poster)可見一斑。剛抵印度的第一天,我和一些印度研究生聊天,得知他們參加會議的經費大部分由大會負擔,包含來程交通費及會議期間的食宿。而回程交通費則由學生就讀的由學校負擔,所以可看出會議舉辦單位非常鼓勵年輕學生參加國際會議,這次會議共有110人參加,其中很多研究生,有的學生坐了24小時的火車才來到這裡。

    學生告訴我,印度的學制是90%學生從一年級讀到十年級,然後有兩年預科,約80%學生就讀,然後有60-70%的學生進入大學,比例相當高,大學只要念三年,接著進碩士班、博士班。令人驚訝的是,大部分印度人信印度教、說印度語,說英語的人約佔30%而已,而令我訝異的是基督徒多於佛教徒。有的學生表示,印度與巴基斯坦並無種族上的差別,但是宗教上壁壘分明。他們認為老一輩的印、巴人之間有難以化解的仇恨,但年輕人並不如是想,所以等他們成為社會主掌者之後,也許宿怨可解。學生告訴我,1979年諾貝爾和平獎得主Teresa修女當年工作的地點就在加爾各答附近,1998年諾貝爾經濟獎得主印度人Amartya Sen曾在加爾各答讀大學及教書

    我說台灣的學生,一般將電腦、電機、醫學、法律、國貿……等視為熱門科系,但仍有一些程度不錯的學生喜歡物理、數學、化學等基礎科學,有趣的是,印度學生表示,法律並不是印度熱門科系,理由是印度律師地位不高,取得律師資格也非常容易。

      十八日上下午也各有四場演講,其中印度人Sanjay Jain報告的演化模型頗值得注意,印度人A. Dhar報告一維系統熱傳導現象,筆者則報告沙堆模型之尺度律與普適性。筆者指出1996Oslo研究群的米粒實驗顯示自組成臨界現象和系統的細節(米粒之長寬比)有關,此與傳統之臨界現象(如二元流體之臨界現象)不同,因此我們對顯示自組成臨界性的模型也要仔細檢驗其普適性。我們用電腦模擬研究正方形、三角形、六邊型、及隨機晶格上之沙堆模型,發現普適性仍然存在。

十九日上午有三場演講,以色列人Eytan Domany報告用統計物理模型研究DNA形成集團的現象。印度人M. Mahato報告由熱起伏及時間調控產生的粒子移動現象。

尾聲
    十九日會議在11點多提早結束。主辦單位在結束式徵求來賓起來說話,我就表示:我從未到過印度,第一次來訪,感謝主辦單位的邀請,感覺印度物理研究的水準很高,學生程度不錯,我在台灣也辦過國際會議,所以知道辦理國際會議的辛苦,希望以後台灣與印度能多增加學術交流。Rahul Pandit站起來表示,公元20047410日,第22IUPAP統計物理國際會議,將在印度舉行,許多衛星會議將在亞洲地區舉行,希望大家踴躍參加!下午6:30會議單位派車送我們到機場。我在車上突然覺得加爾各答似乎不再是個喧鬧的城市,耳朵的感覺不再像來時那麼嘈雜,韓國來的金教授表示:幾日來的磨練,我們的耳朵對噪音已習慣了!

    出境時發現離境門只有一個,想想一千餘萬人口的城市,居然設備如此簡陋,大概大部分人都不常搭乘飛機吧?而加爾各答的國際貿易和國際旅遊也不太發達吧。


    晚上9:45登上飛機,結束了印度之旅。在飛機上,我回想這幾天的所見所聞,思考印度這個物質條件相當落後的地區,何以能夠產生波思、拉曼、泰戈爾、甘地、TeresaAmartya Sen等世界級的人物。也許印度文化中比較注重精神領域的探求吧!總之,印度是一個值得我們多了解、多接觸的國家。












參考資料及相關網站

    下面參考資料1,2,34有關於易行模型和展透模型的介紹,而參考資料5有關於自組臨界性與沙堆模型的介紹。參考資料1,45pdf檔可自參考資料6之網站取得,也可自中華民國物理學會和國家科學委員會(http://www.nsc.gov.tw/)之網站取得。

1. 胡進錕,相變之謎:相變是不是一種展透性變遷?物理雙月刊(中華民國物理學會出
),六卷一期,p.12-221984

2. 胡進錕,幾何與相變理論,《科學發展月刊》(國家科學委員會出版),十六卷九期,
p.1287~1314 1988

3. 胡進錕,硬核粒子的相變與展透模型,本刊二十一卷二期(79-2月號)p.154-155

4. 胡進錕,Universal Scaling Functions for Percolation Models (展透模型之普適尺度函
),行政院國家科學委員會研究彙刊-自然科學與工程,二十三卷三期,p.331-3471999

5. 林財鈺、胡進錕,自組臨界性與沙堆模型之普適性,物理雙月刊(中華民國物理學會出版),二十四卷二期,p.290-2942002

6. 中央研究院物理所統計與計算物理實驗室,http://www.sinica.edu.tw/~statphys/

7. 加爾各答波思國家基礎科學研究中心,http://boson.bos.res.in/home.html

8. 加爾各答印度科學培育協進會,http://www.iacs.res.in/

9. 諾貝爾基金會,http://www.nobel.se/index.html/

10. 中華民國物理學會,http://psroc.phys.ntu.edu.tw/

Note: This article was first published in Science Monthly (Taipei) in 2002.

國際化的挑戰

A.M.Povolotsky是位年輕優秀的俄國研究人員,2001年夏剛得博士學位,已婚,有兩個小孩。200110月他獨自到中央研究院物理所擔任博士後研究工作,2002年夏天把太太小孩接到台灣,在中央研究院附近租屋同住。我問他小孩有沒有上學,他說台北的美國學校太貴了,而中央研究院附近的小學也無法上,因此只好在家裡自己教。我心裡想,長期下來這樣也不是辦法。2003年初,他跑來告訴我說他想辭職,先帶家人回俄國,五月初再到葡萄牙研究。我問他要不要帶家人到葡萄牙,小孩在那邊能不能上學?他說看看再說吧!也許那裡的學校比較便宜, 小孩適應比較容易。
亞美尼亞是與土耳其、亞塞拜然、喬治亞接壤的小國,人口只有三百萬人,居民以信仰基督教為主,但與居民主要信仰回教的伊朗關係不錯。20029月我到亞美尼亞參觀葉里溫國立大學(Yerevan State University,簡稱YSU)。該校副校長告訴我說,YSU及其分部共有一萬二千名學生,其中有二百多位外籍學生, 有一群伊朗學生在該校讀電腦,該校特別為伊朗學生用英語授課。台灣人口有二千三百萬人,有上百所大學,但有幾所大學有二百位以上的外籍學生呢?
2003年二月,我到國立新加坡大學訪問,該校教授告訴我說,新加坡有三百萬公民,有一百萬外籍人士在新加坡工作,新加坡大學約有百分之二十外籍學生。他說新加坡政府瞭解到三百萬新加坡公民中,能夠培養出來的優秀人才有限,因此有各種獎助學金辦法吸引馬來西亞、印尼、印度、中國大陸等地的外籍人士到新加坡讀書和工作。
讀科學史的人都知道,許多極有創造性的工作是由二十到三十多歲的年青人完成的,而這一年齡層的學生或研究人員的小孩也正是需要上學的時候。台灣近年來雖然經濟上有些困難,但台灣的研究環境和薪資對許多國家的年輕人而言仍然有吸引力,如何在此基礎上,改善外籍年青人及其家人在台灣居住和求學(包括小孩)的環境,讓他們樂意在台灣求學或工作,也許是我們在二十一世紀該去面對的挑戰。

Note: This article was first published in Science Monthly in April 2003.

蛋白質摺疊與病毒演化模型

摘 要
蛋白質摺疊與病毒演化和許多重要的學術及實用問題有關。本文簡單介紹這方面研究的近況以及筆者與合作者所做的一些工作。介紹的研究工作包括以全原子模型研究蛋白質、以Go模型研究蛋白質,以及病毒演化模型。
一、前言
19世紀末至20世紀,物理科學和生物科學都有重要的發展。物理科學的重要發展包括對物質基本結構的瞭解、建立由微觀分子間的交互作用了解宏觀物質性質的理論及計算方法,即「統計物理」。生物科學的重要發展包括基因、蛋白質、DNARNA的發現以及了解它們之間的關係。最近數十年,物理科學所發展的觀念和方法大量用於研究蛋白質、DNARNA等生物巨分子的結構與演化。
19711976年,筆者在李怡嚴教授指導下在新竹市國立清華大學物理研究所研究基本粒子理論,畢業後至中正理工學院服預官役並開始與石育民、陳文典、曾玄哲等教授用重整群理論(renormalzation group theory)研究相變模型的臨界現象。服完役後,於197810月底至加州大學聖地牙哥校區加入馬上庚教授的研究群,以蒙地卡羅模擬法研究自旋玻璃與易行模型(Ising model)並以重整群法研究量子自旋模型。1979年夏天至1981年夏天在緬因州立大學用重整群法研究表面吸附原子之相變並開始研究展透(percolation)模型。19819月至19838月在多倫多大學研究展透模型和超冷水的模型。19839月至中央研究院物理所任職後研究的間題包括發展展透重整群算法、新的蒙地卡羅算法、相變模型之普適尺度函數、非線性動力學、同步現象等問題。1998年起開始用蒙地卡羅法研究蛋白質,2002年起開始用解析方法研究DNA和病毒演化模型。近年來,筆者以一半以上的時間投入生物物理的研究。本文簡單介紹筆者和合作者在蛋白質摺疊與病毒演化模型方面所做的一些研究成果。

二、以全原子模型研究蛋白質結構及熱性質
蛋白質(protein)是組成生物極重要的巨分子,由20種胺基酸(amino acid)靠化學鍵連接成一維的系列。胺基酸的主鏈(main chain)包括一個氮(N)原子和二個碳(C)原子,位於中間的碳原子(稱為之Cα原子)可接20種不同的側鏈(side chain),不同的側鏈代表不同的胺基酸。胺基酸系列在生物體內產生後,會在很短的時間(1μs-1s)摺疊成立體結構。而蛋白質的生理功能和它的立體結構有極密切的關係,因此許多科學家想各種辦法決定蛋白質的立體結構。
用實驗方法決定蛋白質立體結構的工具主要有X射線和NMR,這些設備很昂貴,且取得實驗數據後,用數值分析決定蛋白質結構通常也要花很長時間。如果能夠純粹用電腦計算就算出蛋白質的立體結構,那將是很有意義的事,但這是不是可能呢?
根據1972年諾貝爾化學獎得主Christian Anfinsen[1]的研究,不是特別長的蛋白質,一維系列的資訊就能決定蛋白質的立體結構,而室溫時蛋白質的立體結構就是它在基態或接近基態時的結構,因此許多科學家也想各種辦法由蛋白質一維的資訊計算它的立體結構。常用的計算方法包括分子動力學(molecular dynamics, MD)模擬法和蒙地卡羅(Monte Carlo, MC)模擬法。用MDMC計算蛋白質低溫(室溫)狀態常碰到的困難,就是蛋白質容易掉入暫穩狀態而不容易再跳出來找到更低的能量狀態。為了克服這個困難,Ulrich H. E.HansmannY. Okamoto[2]首先將多重正則MC(multicanonical MC, MMC)法用於模擬由5個胺基酸組成的Met enkephalin而得到不錯的結果。MMC的特點就是讓分子在能量空間隨機行走,因此它就比較容易走到低能量的狀態。另一種容易找到低能量狀態的方法就是平行調整法(parallel tempering)[3],即同時L部電腦模擬L種不同溫度蛋白質之動態行為,過一段時間,再以Boltzmann因子決定不同電腦上之蛋白質是否要交換溫度,然後再重複前述動作,此一方法的優點就是容易在平行電腦上運算。
蛋白質的立體結構和它與周圍水的作用有很密切的關係,處理蛋白質和水的作用也有各種辦法。用MD研究蛋白質的科學家,通常將大量的水分子(3000)和蛋白質放在一起用MD模擬它們間的互動情況,另一種方法就是將水當作是連續體,即將蛋白質放在水的連續體內,模擬蛋白質在水作用下的行為;這種方法所需的計算機時間比MD要少很多,但關鍵的問題就是要找出合適的蛋白質與水作用的模型。
MD模擬蛋白質,極有名的例子就是加州大學舊金山校區Y. DuanPeter A. Kollman[4]Cray T3E(包含256CPU)計算villin headpiece subdomain (包含36個胺基酸,簡稱HP-36)3000個水分子中摺疊的情況,他們計算HP-36由無秩序狀態經過大約1μs後達到接近HP-36在室溫(由實驗決定)的立體結構,但兩者仍有明顯的差異。
1998年起,筆者與海耳倫(Shura Hayryan)Frank EisenmengerUlrich H. E. Hansmann等人合作發展以全原子模型 (all atom model) 計算蛋白質性質的套裝軟體SMMP(Simple Molecular Mechanics for Proteins)[5]。此套裝軟體用FORTRAN寫成,可用於模擬蛋白質標準幾何模型,此模型的蛋白質所有碳(C)、氮(N)、氧(O)和硫(S)原子都包含在內,但排除較小的氫(H)原子,靠化學鏈結合的鄰近原子,距離保持不變,但容許轉動以改變蛋白質的結構。蛋白質之內能則可選用ECEPP/2ECEPP/3、和FLEX等模型。蛋白質與水交互作用的能量可由每一原子接觸水的面積及每種原子與水相互作用參數計算出來。此套裝軟體也包括模擬退火(simulated annealing)MMC,平行調整(parallel tempering)等數值模擬法之計算程式。據筆者所知,SMMP2001年夏天發表後已有德國Peter Grassberger,美國B. A. Berg和加拿大J. Z. Y. Chen等數值模擬著名教授用SMMP模擬蛋白質。
SMMP為基礎,筆者與合作者發展出計算蛋白質能量之平行算則[6],將MMC和平行計算結合後所算的Met enkephalin熱力學性質和別人用單一CPU電腦算的結果一致。在我們計算能量的平行算則,資料在CPU之間傳送的量很低,因此計算效率不至於隨CPU數快速下降。我們用中央研究院計算機中心包含48CPU(每一node只有一個CPU)PC Farm計算Protein L能量,測試一週,發現CPU數到30時,效率仍高達57%
筆者與林財鈺和Hansmann合作用平行電腦研究HP-36的三維結構[7]。在這個研究裏我們完成了一個結合SMMP和平行調整法的MPI平行化程式。我們用中研院計算機中心的IBM平行電腦從隨機組態出發,以20CPU模擬20個溫度下HP-36的平衡性質,透過平行調整法不斷地在各個CPU間交換溫度以求得能量的極小值。在一個典型CPU,蛋白質的溫度和能量隨溫度的變化如圖1所示,蛋白質的平均內能和比熱隨溫度的變化如圖2所示。計算圖2所用之數據時,我們考慮蛋白質與水交互作用的能量,因此圖2的比熱顯示相變的行為,另外,我們發現HD-36在低能量有兩種結構,其中一種結構和NMR定的結構頗為類似。
2001年發表的SMMP,蛋白質的表面積是以數值方法計算的。筆者與海耳倫、吳明佳及斯洛伐克(Slovak)和俄國的學者合作,發展用解析公式計算蛋白質表面積和體積的方法並以此方法為建立計算蛋白質面積和體積的軟體ARVO[89]

1.在一典型CPU,蛋白質的能量(上圖)和溫度(下圖)隨時間的變化。本圖取自Proteins 52, 436 (2003)

2.HP36的平均內能E_tot和比熱C(插圖)隨溫度的變化。本圖取自Proteins 52, 436 (2003)

最近筆者與吳明佳、馬文忠、Mai Suan LiMaksim Kouza等人合作,用ARVO研究Protein  Data Bank (PDB) 蛋白質的體積V和面積S。我們發現大部分蛋白質的體積和面積比很接近0.75Å,少數偏離此一比值的蛋白質則結構有問題,如只存部分碳原子(Cα)的資料或原子中心點過於接近[10]
2006年筆者和EisenmengerHansmann和海耳倫等人發表新版的SMMP[11],此新版SMMP包括以解析公式計算蛋白質的體積和面積。
2001年王福高先生和David P. Landau發展快速計算相變模型狀態密度(Density of states)的蒙地卡羅方法,此方法廣泛用於許多問題的計算而被稱為王Landau(Wang-Landau method),此法的缺點是計算值不易收斂而有較大的誤差。王健生和R. H. Swendsen2001年發展結合轉換矩陣與蒙地卡羅(transition matrix MC,簡稱TMMC)的方法,此法可算較準確的結果,但需要很長的計算時間。筆者與Ruben G. Ghulghazaryan和海耳倫發展有效結合王LandauTMMC法以計算蛋白質的狀態函數[12],有了狀態函數就可以計算蛋白質的內能、比熱及熵。

三、以Go模型研究蛋白質摺疊問題
以全原子模型模擬蛋白質的摺疊頗費計算機時間,因此用此方法目前我們只能研究胺基酸數目大約40的蛋白質。若要研究胺基酸數目較大的蛋白質,必須要用較簡單的模型,如Go模型。
Go模型[13]由日本人N. Go1983年提出來,再經由聖地牙哥J. Onuchi的研究群(14)改良。使用Go模型,必須先知道蛋白質自然立體結構每一胺基酸Cα的座標,每一胺基酸也只保留Cα原子,其他原子則忽略不計。從蛋白任一組態Cα原子群的座標以及該蛋白質自然立體結構Cα原子群的座標,可以寫下蛋白質的能量,根據此能量函數寫下蛋白質Cα原子群座標必須滿足的Langevin方程式。該方程式包括一項強度與溫度有關的雜訊。用數值方法解Langevin方程式後,就可以得到Cα原子群座標隨時間的變化。我們用Go模型研究下列問題
(1) hbSBD的摺疊問題。
筆者與海耳倫、越南籍波蘭學者李梅樹(Mai Sun Li)、中央研究院黃太煌和張七鳳等人合作研究與粒線體內的人類支鍊甲酮酸脫氫酶BCKD (branched-chain α ketoacid dehydrogenase)複合體有關的胺基酸系列hbSBDBCKD複合體由24條胺基酸系列E2組成,E2的第62145個胺基酸形成hbLBD165213個胺基酸則形成hbSBD領域,24E2的另一端則糾結在一起形成E2核心。hbSBD會接上Lipoic acid,而hbSBD則會接上E1(heterotetrameric decarboxylasc)E3(homodimeric dehydrogenase)BCKD負責分解支鏈甲酮酸(branchel-chain α keto acids)。若BCKD無法發揮正常功能,會發生致命的酮酸中毒。黃太煌教授的研究群用NMR決定hbSBD的立體結構,並用CD(circular dichroism)測量平均殘餘橢圓率(mean residue molar ellipticity)隨入射偏極化光波長及樣品溫度變化的情形。
Go模型計算結果與CD實驗數據比較,我們發現,hbSBD的反自然狀態(denatured state簡稱DS)需越過一個能障而到達摺疊狀態(folded state,簡稱FS)。我們也發現hbSBDhbLBD不穩定。在溫度ThbSBD在摺疊狀態的比例以fN(T)表示,由CD實驗數據及數值計算所得的dfN(T)/dT隨溫度變化如圖3的上圖所示,我們調整Go模型的參數以便讓數值計算的摺疊溫度與實驗值符合;圖3的下圖則顯示數值計算的比熱隨溫度的變化,此圖顯示Go模型可算出蛋白質的相變行為。
3. 上圖:dfN/dT隨溫度T的變化,實線是實驗值,點線是數值模擬的結果,fNhbSBD在摺疊狀態(FS)的比例。下圖:數值計算hbSBD比熱隨溫度的變化。本圖取自Biophysical J. 89, 3353 (2005)

兩個Cα原子的距離小於某一切斷參數(cutoff parameter)r0時,我們稱這兩個原子有自然接觸(native contact)。取r0=7.5Å,自然摺疊狀態hbSBD共有62個自然接觸。圖4顯示在溫度等於摺疊溫度(即圖3Cv最高值的溫度)hbSBD自由能隨自然接觸總數Q的變化。該圖顯示DS狀態需越過一個能障而到達摺疊狀態FS。在能障的高峯,則有過渡狀態(transition state,簡稱TS )。圖4也顯示在DSTS,和FShbSBD典型的結構。在TShbSBD已形成和FS類似的helix,但兩helix的相對位置與TS的結構不同;在DShbSBD則無helix結構。
4. 在摺疊溫度TF hbSBD的自由能隨自然接觸總數Q的變化。本圖取自Biophysical J. 89, 3353 (2005)

2)肌內蛋白I27及汎素之逆摺疊及再摺疊
肌肉的肌節(sarcomere)的Z-disk M-linetitin連結,而titin則由一連串的免疫球蛋白(immunoglobulinI27和一連串的fibronectin組成。一個典型的I27(如PDB1tit)包括98個胺基酸,數個I27可結合成複數蛋白作為實驗的樣品。
汎素(ubiquitin)與生物體內分解不需要的蛋白質有關。典型的汎素(如PDB 1f9j)包含76個胺基酸,數個汎素可串連在一起而成為複數蛋白質。2004年諾貝爾化學獎頒給Aaron CiechanoverAvran Hershko,及Irwin Rose三人以表揚他們對於了解汎素功能的貢獻。
Julio M. Fernandez 與合作者曾以原子力顯微鏡術(atomic force microscopy,簡稱AFM)將I27和汎素的複數蛋白質拉開,再研究I27和汎素重新摺疊(refolding)的過程[16,17]。他們用120pNpico Newtwon)的力將包含三個汎素的複數蛋白質由摺疊狀態完全拉開後,再將拉力降至fq=15pN。汎素的兩端距離Rend to end distance)會很快下降約16nm,隨後R會有大的擾動再逐漸下降,經過大約8秒,R會忽然下降約10nm,以後R就只有小的擾動,此時汎素可說已回復到摺疊狀態。加於汎素的力降至15pN的時間至汎素回復到摺疊狀態的時間可稱為汎素在fq=15pN的摺疊時間(folding timetFFernandez等人發現不同次實驗tF並不相同,而平均摺疊時間tFfq指數成正比[17]
筆者與李梅樹,Dmitri K. Klimov,和D. Thirumalai等人合作以Go模型研究單一I27的逆摺疊(unfolding)及再摺疊過程,我們也發現不同次數實驗,再摺疊過程與起始條件有關,而且平均再摺疊時間和fq的指數成正比。數值模擬再摺疊的典型結果如圖5所示,該圖顯示fq相同,再摺疊時間並不相同。
5.再摺疊過程中,I27兩端距離R,迴旋半徑Rg,和自然接觸總數Q隨時間的變化。在圖abfq=0,但再摺疊時間不同;在圖cdfq=3pN,兩者的再摺疊時間也不同。本圖取自Proc. Natl. Acad. Sci. USA 103, 93 (2006).

筆者與李梅樹,Maksim KouzaGo模型研究汎素的逆摺疊和再摺疊[19],也發現和I27類似的結果。汎素的摺疊狀態包含5b-sheet1a-helix,我們發現加力和加熱情況下,汎素的b-sheeta-helix打開的次序並不相同[19]

四、病毒演化之分子模型
(1)歷史背景
我們所見到或知道的動物、植物,與人類究竟從何而來?又將往何處去?自有人類文明以來,這是許多思想家嘗試回答的問題。基督教舊約聖經的創世紀以及莊子的至樂篇記載公元前思想家對於生物起源和演化所提出的理論。理論是否能夠廣為接受,必須經過觀察或實驗結果的檢驗。
18世紀和19世紀累積的證據則顯示地球上的生物是經由長時間的演化逐漸形成的。這類證據包括各種化石的系列型態,某些生物存在一些多餘的器官,某些低等至高等動物具有類似的架構,某些低等至高等動物類似的胚胎型態,動植物的育種顯示生物可能變異,某些大量繁殖的生物必須競爭有限的資源,而地理大發現找到許多新的化石及動植物使生物演化的觀點更具說服力。在這個背景下,英國科學家達爾文(Charles Darwin1809-1882)在參加小獵犬號於183112271836102航行地球一週後,建立生物演化的理論,也在18591124出版有關生物演化的名著<<物種原始(The Origin of Species>>
達爾文在<<物種原始>>中提出的「物競天擇,適者生存」生物演化理論可以說是一個宏觀的現象性理論。自從統計物理和分子生物學發展以後,科學家很自然地想到,是否可以從組成生物遺傳物質的DNARNA,應用統計物理來了解生物演化的機制。在此背景下,德國人Manfred Eigen和日本人Motoo Kimura等人乃提出生物演化之分子模型。
(2)EigenKimura模型
高等生物的遺傳訊息儲存於細胞核內的DNADNAATCG四種核苷酸(nucleotide)組成。DNA的訊息經RNA polymerase轉錄後形成訊息RNARNA係由AUCG四種核苷酸組成。RNA的訊息經細胞核外的核醣體(Ribosome)轉譯(translation)後,會形成蛋白質。
病毒是包含遺傳物質最簡單的個體。病毒分為遺傳物質由DNA組成的DNA病毒及由RNA組成的RNA病毒。某些RNA病毒(如AIDS病毒)的RNA系列可經由反轉錄產生DNA系列,這些DNA系列再插入細胞內的DNA,藉由細胞的複製功能大量複製。
既然遺傳訊息是儲存於DNARNA,生物演化的分子模型就與DNARNA的演化有關。病毒具有最簡單的DNARNA系列,因此研究生物演化的分子模型可以從研究病毒的演化著手。
德國人Manfred Eigen是實驗化學家,他因為研究極快速化學反應與Ronald George Wregford NorrishGeorge Porter1967年共同得到諾貝爾化學獎。Eigen的興趣並不侷限於化學實驗,他在1971年提出病毒演化的分子模型[20]
在一般狀況下,核苷酸系列的變異包括(a)新核苷酸的加入(insersion),(b)某些核苷酸的消除(deletion),及(c)一種核苷酸變為另一種核苷酸(point mutation)。為簡單起見,Eigen忽略(a)(b),而只考慮(c),即在演化過程中,核苷酸的總數N保持不變。另外,Eigen將所有嘌呤(purine,包括GA)都以+1代表,而所有的嘧啶(pyrimidine,包括CU,和T)都以-1代表,即將N個核苷酸系列轉換成一度空間包括N個自旋的易行模型。N個易行自旋共有M=2N種不同的組態,以S1, S2, …, SM表示,Si出現的機率以pi表示。在單位時間,Si產生下一代的平均數目以ri表示,ri稱為Si的適應函數,因為ri越大表示Si產生的下一代越多,因此也愈能適應。Si可能被藥物或免疫系統消滅或變為另一系列Sj,單位時間內,Si被消滅的數目以Di表示,而變為Sj的機率以Qji表示。Di又稱為降解速率(degradation rate)。
Eigen寫下pi滿足的方程式
     (1)
此處Qij=qN-d(i,j)(1-q)d(i,j)(1-q)代表由+1變為-1-1變為+1的機率,而d(i,j)代表SiSj自旋不同的總數,稱為Hamming距離。Qij滿足 ,由此可證明 r =N(1-q)則代表單位時間,N自旋變異的總數。
Eigen 假設只有一個自旋系列 [ 例如可取所有自旋為+1S1=(1,1,…,1) ] 的適應函數特別大,即r1A>>1,而其他系列的ri1S1可以稱為尖端組態(peak configuration)。若起始狀態pi平均分佈且Dj=0Eigen發現當
Ae-g > 1                              (2)
隨時間演變,最適應系列S1p1會變為最大;若公式(2)不滿足則無此種現象。此現象頗類似臨界現象而Ae-g=1可定出臨界點。Eigen稱此臨界點為誤差門檻( error threshold)
1970Motoo Kimura和合作者J. Crow提出另一種病毒演化模型[21]。和Eigen一樣,他們也假設病毒核苷酸長度N保持不變,且同樣以±1的易行自旋代表核苷酸系列。他們假設由Si系列變為Sj系列的變異矩陣mij只有當d(i,j)=1時才有變異發生。他們寫下pi滿足的方程式為:
              (3)
比較方程式(1)和方程式(3),我們可以發現在Eigen模型由Sj變異為Si的那一項包含rj,因此變異是在產生子代的過程中發生,所以Eigen模型可稱為選擇與變異連結的模型,而在Kimura模型,Sj變為Si的那一項並不包含rj,所以Kimura模型可稱為選擇與變異平行的模型。當環境改變時,滿足Eigen模型還是Kimura模型的病毒較容易適應新的環境,這是頗有趣的問題。
(3)EigenKimura模型鬆弛現象的比較
1997年,E. BaakeM. Baake,和H. Wagner[22]等人將Kimura模型用等價的量子自旋模型表示。2004年筆者與亞美尼亞學者沙阿金(David B. Saakian)將Eigen模型也用量子自旋模型表示[23]。我們用處理量子自旋模型常用的Suzuki-Trotter方法研究Eigen模型與Kimura模型的鬆弛現象。假設在起始狀態,N個自旋的平均磁矩(將各自旋分量加起來除以N)為m,我們計算系統到達穩定狀態(即大部分病毒的狀態集中於尖端組態及其近鄰)所需的鬆弛時間t。我們發現不管單位時間變異數多小,Kimura模型可以用較短的時間到達穩定狀態,如圖6所示[24]
6. Eigen模型和Kimura模型鬆弛時間t/(1-m)隨核苷酸變異數 r 的變化,m是對應的自旋模型在起始狀態的平均磁矩。本圖取自Phys. Rev. E 69, 046121 (2004).

(4)一般適應函數及降解速率之Eigen模型的準確解
Eigen[20]Kimura[21]考慮適應函數在尖端組態S1有很大的值,在其他組態的適應函數都是相同的很小的值,此種適應函數過於簡略。最近筆者與沙阿金[25]研究一般適應性函數及降解速率的Eigen模型,並算出對應之配分函數的準確解。
我們考慮方程式(1)的適應函數ri和降解速率Di可以寫成
ri=f(Si)=f0(mi); D(Si)=d0(mi)               (4)
此處miSi的平均磁矩。很容易證明mi=1-2d(i,1)/Nd(i,1)SiS1Hamming 距離。因此riD(Si)只是SiS1Hamming距離的函數。我們可以證明方程式(1)(4)所代表的系統有一個對應的量子自旋系統,其HamiltonianH表示,而分配函數為Z=Tr exp[-Hb]b為溫度的倒數。當b很大時,Z的主要貢獻來自於某種平均磁矩k的組態,而lnZ/b則可以寫成
          (5)
用方程式(5)可以分析各種不同適應函數f0(k)及降解速率病毒適宜存活的相圖[25]
RohdeDaum,和Biebricher發現某些RNA病毒會產生Hamming距離很大的變異病毒[26],此結果無法用方程式(1)(4)Eigen模型解釋。我們也修正Eigen模型以解釋此種結果[25]
(5)多重尖端組態病毒模型
方程式(4)的適應函數和降解速率有一個共同的尖端組態S1,也就是S1對應的病毒最容易複製下一代,也最容易被藥物或免疫系統攻擊而消滅。最近筆者與沙阿金,Rice大學的Michael W. DeemE. Munoz研究多重尖端組態病毒模型[27],即方程式(4)f(Si)D(Si)分別可以有多重尖端組態。最簡單的情況是f(Si)的尖端組態仍只有 ,而D(Si)則有另一個尖端組態 。我們可以定義 用於表示S1S2的重疊程度。當m=1S2=S1,當m=-1S2=-S1
我們首先考慮f(Si)Si=S1有很大的適應值A,其他組態的適應值為1,而D(Si)則可寫成
            (6)
b是一個參數,選b=3.5所算的相圖如圖7所示。

7. 病毒被藥物攻擊之相圖。FM相表示病毒可以存活,NS相表示病毒被藥物消滅。m表示病毒複製之尖端組態S1和藥物攻擊之尖端組態S2重疊的情況。本圖取自Phys. Rev. E 73, 041913 (2006).

FMferromagnetic)相,病毒可以存活;在NSnonselective)相,病毒被藥物攻擊而消滅。當m=1,病毒必須有相當大的複製率A才能存活,當m降低,A也跟著降低。圖7的內插圖考慮病毒組態和S1Hamming 距離小於某一值時有相同的適應值A,因此病毒可以用較低的A值存活(即FM相)。

四、結語
除了蛋白質摺疊與病毒演化模型,筆者也與A. E. AllahverdyanZ. S. Gevorkian,和T. M. Nieuwenhuizen等人合作研究DNA在平面吸附的問題,並算出有關之相圖[28]。由前面所述的研究成果,可以看出統計物理所發展的觀念和方法有助於研究蛋白質摺疊和病毒的演化,以及DNA吸附等分子生物的問題。

五、致謝
筆者感謝海耳倫、林財鈺、吳明佳、沙阿金、李梅樹、黃太煌、張七鳳、E. EisenmengerU. H. E. Hansmann,及M. W. Deem等人合作研究蛋白質摺疊及病毒演化模型。本文所用的圖都取自與這些人合作完成的論文。筆者也感謝國科會及中央研究院的研究支助以及張純綾小姐和吳明佳博士協助完成本文。

參考文獻:
1.        C. B. Anfinsen, Science 181, 223 (1973).
2.        U. H. E. Hansmann and Y. Okamoto, J. Comp. Chem. 14, 1333 (1993).
3.        G. J. Geyer, Stat. Sci. 7, 437 (1992); M. C. Tesi, E. J. J. van Rensburg, E. Orlandini and S. G. Whittington, J. Stat. Phys. 82, 155 (1996); K. Hukushima, K. Nemoto, Journal of the Physical Society of Japan 65, 1604 (1996); U. H. E. Hansmann, Chem. Phys. Lett. 281, 140 (1997).
4.        Y. Duan and P. A. Kollman, Science 282, 740 (1998).
5.        F. Eisenmenger, U. H. E. Hansmann, S. Hayryan, and C.-K. Hu. [SMMP] A modern package for simulation of proteins, Computer Phys. Commu. 138, 192 (2001).
6.        S. Hayrian, C.-K. Hu, S.-Y. Hu, and R.-J. Shang. J. Comp. Chem. 22, 1287 (2001).
7.        C.-Y. Lin, C.-K. Hu, and U.H.E. Hansmann, Proetins 52,436(2003)
8.        S. Hayryan, C.-K. Hu, J. Skrivanek, E. Hayryan, I. Pokorny, A New Analytical Method for Calculating the Solvent Accessible Surface Area of Macromolecules and its Gradients, J. Comp. Chem. 26, 334 (2005).
9.        J. Busa, J. Dzurina, E. Hayryan, S. Hayryan, C.-K. Hu, J. Plavka, I. Pokorny, J. Skrivanek, and M.-C. Wu. ARVO: A Fortran package for computing solvent accessible surface area and volume of overlapping spheres via analytic equations, Comp. Phys. Commun. 165, 59 (2005).
10.     M.-C. Wu, M. S. Li, M. Kouza, W.-J. Ma, and C.-K. Hu, A new geometrical constraint on native protein structures, submitted for publication (2006).
11.     F. Eisenmenger, U. H. E. Hansmann, S. Hayryan, and C.-K. Hu, An Enhanced Version of SMMP - Open-Source Software Package for Simulation of Proteins, Comp. Phys. Commun. 174, 422 (2006).
12.     R. G. Ghulghazaryan, S. Hayryan, and C.-K. Hu. Efficient combination of Wang-Landau and transition matrix Monte Carlo methods for protein simulations. J. Comp. Chem., in press (2006).
13.     N. Go, Theoretical studies of protein folding, Annu. Rev. Biophys. Bioeng. 12, 183–210 (1983).
14.     C. Clementi, H. Nymeyer, and J. Onuchic.  Topological and energetic factors: what determines the structural details of the ransition state ensemble and ‘‘en-route’’ intermediates for protein folding? An investigation for small globular proteins. J. Mol. Biol. 298, 937–953 (2000).
15.     M.  Kouza, C.-F. Chang, S. Hayryan, T.-h. Yu, M. S. Li, T.-h. Huang, and C.-K. Hu, Folding of the Protein Domain hbSBD, Biophysical J. 89, 3353 (2005).
16.     M. Rief, M. Gautel, F. Oesterhelt, F.  Fernandez, and H. E. Gaub, Science 276, 1109–1112 (1997).
17.     J. M. Fernandez and H. Li, Science 303, 1674–1678 (2004).
18.     M.-S. Li, C.-K. Hu, D. K. Klimov, and D. Thirumalai, Multiple stepwise refolding of immunoglobulin domain I27 upon force quench depends on initial conditions, Proc. Natl. Acad. Sci. USA 103, 93 (2006).
19.     M.-S. Li, M. Kouza, and C.-K. Hu, Refolding upon force quench and pathways of mechanical and thermal unfolding of ubiquitin, Biophysical J., submitted.
20.     M. Eigen, Naturwissenschaften 58, 465-523 (1971); M. Eigen, J. McCaskill, and P. Schuster, Adv. Chem. Phys. 75, 149-263 (1989).
21.     J. Crow and M. Kimura, An Introduction to Population Genetics Theory (Harper Row, New York, 1970).
22.     E. Baake, M. Baake, and H. Wagner, Phys. Rev. Lett. 78, 559 (1997).
23.     D. B. Saakian and C.-K. Hu. Eigen model as a quantum spin chain: exact dynamics, Phys. Rev. E 69, 021913 (2004).
24.     D. B. Saakian and C.-K. Hu, Solvable biological evolution model with parallel mutation-selection scheme, Phys. Rev. E 69, 046121 (2004).
25.     D. B.  Saakian and C.-K. Hu, Exact solution of the Eigen model with general fitness functions and degradation rates, Proc. Natl. Acad. Sci. USA 103, 4935 (2006).
26.     N. Rohde, H. Daum, and C. Biebricher, C. J. Mol. Biol. 249, 754–762 (1995).
27.     D. B. Saakian, E. Munoz, C.-K. Hu, and M. W. Deem, Quasispecies theory for multiple-peak fitness landscapes, Phys. Rev. E 73, 041913 (2006).
28.     A. E. Allahverdyan, Zh. S. Gevorkian, C.-K. Hu, and Th. M. Nieuwenhuizen, Adhesion Induced DNA Naturation, Phys. Rev. Lett. 96, 098302 (2006).




作者簡介
胡進錕
中央研究院物理所研究員
http://www.sinica.edu.tw/~statphys/