◆ 1文字アミノ酸配列から各種HTMLデータを作成する秀丸マクロ ◆

ダウンロード(zip形式圧縮ファイル;2010/07/09更新)

※2010/07/09,pdb_mini3.macを追加しDL版更新!! [NEW!]
※2008/05/08,pdb_org01.macを追加しDL版更新 → 同マクロ利用データによるコンテンツ例
※2008/03/28,日本化学会第88春季年会で本マクロについてポスター発表(報告ページ参照)
※2007/09/17,amino_aaa.macを追加しダウンロード版更新!!
※2006/05/17,アミノ酸のコンホメーション選択性識別マクロ(2種類)を追加
※2006/05/09,一部改変
※2005/06/14,amino_bcaa.macを追加しダウンロード版更新
※2005/02/11,Aspの疎水性インデックス順表示色を訂正
※同,PDBデータのサイズを小さくするマクロを追加掲載
※同,秀丸エディタのマクロライブラリ登録 [旧版です!]
※作例:βバレル型膜タンパク質の疎水性インデックス値
※作例:ノイラミニダーゼ立体構造予測データベース(理研)のデータより


1qd5をアミノ酸塩基の性質別に着色した例;右から二次構造,アミノ酸色,極性・非極性区別,疎水性インデックス順
PDB部分データリストで作成;アミノ酸の親水性・疎水性参照
※参考(膜貫通タンパク質や1qd5のもつβ-バレル構造に関する文献例):「細胞の分子生物学 第4版」,pp.593-614

 本秀丸エディタ用マクロは,1文字表記のアミノ酸配列データから以下に示すようないろいろなHTML形式の表を作成するものです。改変して様々な利用が可能と思います。改変等をされた場合は,利用した関連情報と一緒に作者までご連絡くだされば,公開可能なものはこのページで紹介させていただきます。


本マクロで作成される表のセルの着色(マクロ改変で変更可)についてはアミノ酸の親水性・疎水性参照
※表を範囲指定してExcelにペーストしても色は保持される


●1文字表記のアミノ酸配列データの入手とマクロによる本加工について(PDBデータ1qd5を例に)

 Protein Data Bank (RCSB PDB)を利用して,1qd5でChime形式の分子モデルが参照できる。
 同ページの左側メニューの Sequence Details をクリックすると以下のような配列データを参照できる。50塩基ごとに区切られ,その下行にhelixなどの二次構造情報が付記されている。

 なお,二次構造情報は以下のように同じタンパク質でもデータソースによって異なるので注意する。


Sequence DetailsページのProtein Dossierをクリックして参照できる1qd5の二次構造情報(青矢印がβ-シート部分)

 また,Sequence Detailsページ最下行の Download in FASTA format をクリックすると以下のような形式で配列が表示される。なお,このデータを用いれば,SOSUI WWW Serverを利用して膜貫通部分が存在するかどうかシミュレーションすることもできる(PDBとSOSUIを利用した演習参照)。

 PDB形式データのヘッダには,以下の例のような二次構造情報が記載されている(1qd5のβ-シート部分の抜粋)

※参考:よくある質問(PDBj)PDBレコードの説明(簡易版)

 以上のような情報などから,HTML化したいデータ配列を作成する。以下は1qd5のβ-シート部分を抜き出した例である。

 このようなデータを作成したら(例えば単純に20配列ずつ区切るのでもよい),各マクロにより以下に列記するようなHTML形式データ等を自動で作成することができる。なお,間違ってマクロを使用した場合に備えて,データ末尾に元の1文字配列データを残すようにしてあるので,削除してからデータを拡張子htmlで保存すればブラウザで参照できる。また,アミノ酸記号以外はすべて空白セルに変換する設定になっている。これらはマクロ改変により修正可能である。


秀丸によるマクロ実行の例
※解凍したマクロ(*.mac)を秀丸のプログラムがあるフォルダ(通常は \Program Files\Hidemaru)に置いて利用




1gwlのSITE部分(全SITE情報のうちBMA近傍だけにしてTyr46追加;黄緑色が芳香族アミノ酸)
※参考:セルラーゼの話題(三重大学・苅田修一研究室)セルロース結合モジュール(ドメイン)とは




:αヘリックス選択性,:βストランド選択性,:逆ターン選択性,:HELIX(PDBデータのヘッダ),:SHEET(同)

amino_2ndv.macで作成した表をExcelでグラフ化した例〔上〕と二次構造・コンホメーション選択性表示のアニメーション〔下〕
(PDBデータ1apsのModel 1の場合;スーパーフォールドの例であるαβサンドイッチ構造)
※参考:タンパク質二次構造予測JST ゲノム解析ツール リンク集



PDBデータ1c9eの二次構造とコンホメーション選択性表示のアニメーション(生体分子の構成元素で作成)

    (4b) PDBsumのLigand-SITE情報データを小さくすると同時に有機性・無機性を算出するマクロ/核酸用  ※pdb_org01_ATGCU.mac

      
      // HB情報を含むPDBsumデータを加工し有機概念図の有機性・無機性を計算するマクロ
      //  pdb_org01_ATGCU.mac(核酸データのみ用)
      // 詳細: http://www.ecosci.jp/pdb/hm/macro_g1.html
      // 有機概念図: http://www.ecosci.jp/ocd/
      
      gofiletop;
      searchdown "\\nATOM" , regular;
      beginsel;
      gofiletop;
      delete;
      
      searchdown "\\nCONECT" , regular;
      	if ( result == true ) {
      		beginsel;
      	}
      	else {
      		gofiletop;
      		searchdown "\\nMASTER" , regular;
      		beginsel;
      	}
      searchdown "\z" , regular;
      delete;
      
      #line = y;
      #n = #line;
      
      gofiletop;
      delete;
      right 54;
      
      beginrect;
      moveto 82, #n;
      delete;
      
      gofiletop;
      
      #nn = 0;
      #b01 = 0;
      #b02 = 0;
      #b03 = 0;
      #b04 = 0;
      #b05 = 0;
      #b06 = 0;
      #no = 0;
      #ni = 0;
      
      while(1){
      	searchdown "  P   ";
      	if ( result == true ) {
      	golinetop;
      	selectline;
      	$a = gettext(seltopx, seltopy, selendx, selendy);
      	$b = midstr($a, 17, 3);
      	if(($b=="  A") || ($b==" DA")) {#b01 = #b01 + 1;
      		#no = #no + 100;
      		#ni = #ni + 410;
      		}
      	else if(($b=="  T") || ($b==" DT")) {#b02 = #b02 + 1;
      		#no = #no + 100;
      		#ni = #ni + 282;
      		}
      	else if(($b=="  G") || ($b==" DG")) {#b03 = #b03 + 1;
      		#no = #no + 100;
      		#ni = #ni + 440;
      		}
      	else if(($b=="  C") || ($b==" DC")) {#b04 = #b04 + 1;
      		#no = #no + 80;
      		#ni = #ni + 287;
      		}
      	else if(($b=="  U") || ($b==" DU")) {#b05 = #b05 + 1;
      		#no = #no + 80;
      		#ni = #ni + 282;
      		}
      	else #b06 = #b06 + 1;
      	escape;
      	down 1;
      	#nn = #nn +1;
      	}
      	else{
      	break;
      	}
      	}
      
      gofiletop;
      	insert "# "+"\n";
      	insert "# "+"\n";
      	insert "# O(R) = "+str(#no)+"\n";
      	insert "# I(R) = "+str(#ni)+"\n";
      	insert "#    A = "+str(#b01)+"\n";
      	insert "#    T = "+str(#b02)+"\n";
      	insert "#    G = "+str(#b03)+"\n";
      	insert "#    C = "+str(#b04)+"\n";
      	insert "#    U = "+str(#b05)+"\n";
      	insert "#  others = "+str(#b06)+"\n";
      
      endmacro;
      

  
[左]ネオマイシン(neomycin B,アミノグリコシド系)が結合したRNA 1ei2のPDBsumデータ → 抗生物質を含むPDBデータ
[右]DNA・RNAの塩基部分の有機概念図



「分子の形と性質」学習帳「生活環境化学の部屋」ホームページ