簡陋筆記專區: 20151119 PyMol

上課講師：王淑鶯老師

續上周的PyMol課程後，接下來是更進階的PyMol課程。
之前有提到如何將序列裡面的金屬原子呈現。同理，醣類也可以用這個方式呈現，但是醣類或其他有機物不會無緣無故地出現在protein上，通常都會有一些氨基酸與其有鍵結，可以通過show side chain的方式將其呈現出來。

如上圖（4KC3），顯示蛋白質的圖形的時候，只會出現紫色及藍色的protein structure。Protein的上方的黃色部分是不會自動呈現的。
做法如下：
show>organic
select>organic on sequence
color>by element
完成後有機物會顯示出來，但是卻沒有與protein本身有鏈接，主要是因為cartoon的特性是不會把side chain顯現出來，需要自己到細部選取特定氨基酸讓其顯示 side chain即可。

另外也可以在指令欄位打上以下指令，便可完成特定角度的轉動。
command：
rotate x, 90
rotate y, 90
rotate z, 90

跟之前一樣可以放大到細部並呈現幾個重要的氨基酸，可以讓讀者了解到它們之間的關係。

上圖（4KC3）是沒有標上residue的，其中幾條虛線是用距離measurement畫出來並hide label。

有時候因為protein 3D structure 的關係，總會有一些氨基酸阻擋在視野前方，可以用手動的方式選取並用hide>cartoon的方式讓其不顯示在視野中，以方便讀者看到實際的內部構造。

上圖（4KC3）是用label>residue的方式將各個目標氨基酸呈現出來，可以清楚地表達出是哪個氨基酸比較有影響力。由於程式內部label的種類有限，可以輸出過後再用其他繪圖軟體將residue label上去。

PyMol還可以將兩個蛋白質align在一起，如上圖（3QYC-綠 & 1IGM-藍）。
將兩種蛋白匯入程式後，在任一蛋白的物件中選取 action>align>to molecule>3QYC or 1IGM
由於這兩種蛋白質基本上很相似，所以align後整體重疊性高。

但是只有部分重疊的蛋白就不能這樣做，程式不會自動選擇重疊的部分，而是整條sequence拿去align。
以另一個蛋白為例，1OL0與3QYC只有部分的structure或是sub-chain有重疊的現象（下圖），則必須手動選擇想要align的sequence然後再align。
做法如下：
1. 在選一個protein，並在protein sequence 選擇想要align的部分，選擇的物件會在<sele>物件中，可以用"set_name sele, new-name"的指令更改名字，建議更改名字比較好，因為<sele>容易被改變。
2. 選擇後在沒有進行選擇的protein物件中執行align的動作，action>align>to selection>new-name

完成後即可獲得下圖！

老師再用另外一個蛋白讓我們做之前練習過的上色及呈現金屬原子。（4LMY）

做法就不在細說了，反正就是在用 "color red, chain A"，選擇Zn並更名，然後讓Zn呈現sphere，更改sphere大小及顏色 "set sphere_scale=0.5"

細部構造也是一樣的做法。不了解的話請到上週的文章看看 =D

接下來就是顯示氨基酸的正負點位，先讓蛋白質用"surface"表現，然後在改蛋白質的物件中選擇"action>generate>vacuum electrostatics>protein contact potantial(local)"
就可以看到下圖的樣子。

當然可以使用 rotate的方式讓它轉到想要觀察的角度。"rotate x, 90" （下圖）

除了sub-chain以外，也有可能是只有部分sequence有重疊，所以可以在protein sequence上先選擇高度重疊的序列後，再一起做align。
以下是4LMY及4I7H兩個protein的align結果，我取4I7H中間alpha helix部分的序列作為<sele> 然後與 4LMY 做align。

部分sequence重疊的另一個例子：3F8N-綠 & 4LMY-紅（以cartoon表示）

我想嘗試用 PyMOL 來製作影片
我選用的圖是上週最後一題的結果，讓其旋轉360度，並在過程中拍下120張圖片（每張圖片都有經過ray的處理）
最後在利用影片製作軟體將這些圖片組合成影片。

選好圖片後，在程式欄位輸入幾行指令：
----------------------------------------------------------------------------------------------
mset 1, 120 #define movie frames
util.mroll, 1, 120, 1 #command for 120 frames in 360 degree rotate
set ray_trace_frames, 1 #ray process for every frames
mpng mov #start export png pictures
----------------------------------------------------------------------------------------------

輸出結束後，將會得到120張經過清晰化的圖片檔，接著再用影片製作軟體將這些圖片轉換成影片。

----------------------------------------------------------------------------------------------

以下是Homework！
1. Create a fasta sequence file of a molecule of your interest.
2. Use ExPasy to characterize the protein (such as MW, PI, secondary structure, domain…..)
3. Find the structure (or homologous structure of your molecule) in protein data bank
4. Use Pymol to generate the figure of your molecule, functional domain and important atomic interactions
5. Align the structure with a homologous structure and explain why structural alignment can help you design your experiments

1. 基於接下來的題目跟domain有關，我原本有想選擇Dengue NS1 protein當作這次的作業的蛋白，但是發現PDB與NCBI之間的蛋白並不統一以及domain的predict時，並沒有發現明顯的domain。
最後我改用NF-kB當做我本次作業的protein。

NF-kB activating protein 1
FASTA format：

>gi|57472138|gb|AAW51146.1| NFkB interacting protein 1 [Homo sapiens]
MDSEAFQSARDFLDMNFQSLAMKHMDLKQMELDTAAAKVDELTKQLESLWSDSPAPPGPQAGPPSRPPRY
SSSSIPEPFGSRGSPRKAATDGADTPFGRSESAPTLHPYSPLSPKGRPSSPRTPLYLQPDAYGSLDRATS
PRPRAFDGAGSSLGRAPSPRPGPGPLRQQGPPTPFDFLGRAGSPRGSPLAEGPQAFFPERGPSPRPPATA
YDAPASAFGSSLIGSGGSAFAPPLRAQDDLTLRRRPPKAWNESDLDVAYEKKPSQTASYERLDVFARPAS
PSLQLLPWRESSLDGLGGTGKDNLTSATLPRNYKVSPLASDRRSDAGSYRRSLGSAGPSGTLPRSWQPVS
RIPMPPSSPQPRGAPRQRSIPSMIFKLQNAFWEHGASRAMLPGSPLFTRAPPPKLQPQPQPQPQPQSQPQ
PQLPPQPQTQPQTPTPAPQHPQQTWPPVNEGPPKPPTELEPEPEIEGLLTPVLEAGDVDEGPVARPLSPT
RLQPALPPEAQSVPELEEVARVLAEIPRPLKRRGSMEQAPAVALPPTHKKQYQQIISRLFHRHGGPGPGG
PEPELSPITEGSEARAGPPAPAPPAPIPPPAPSQSSPPEQPQSMEMRSVLRKAGSPRKARRARLNPLVLL
LDAALTGELEVVQQAVKEMNDPSQPNEEGITALHNAICGANYSIVDFLITAGANVNSPDSHGWTPLHCAA
SCNDTVICMALVQHGAAIFATTLSDGATAFEKCDPYREGYADCATSLADVEQSMGLMNSGAVYALWDYSA
EFGDELSFREGESVTVLRRDGPEETDWWWAALHGQEGYVPRNYFGLFPRVKPQRSKV