◆ PDB部分データによるコンテンツ集 ◆

Jmol版データ集Chime版データ集
マニュアル(Chime版;Jmolもほぼ同様)収録PDBデータの加工について

★上掲データ集のうち,Jmol版はJavaで動作するためソフトウェアのインストールは不要で,多くの機種で参照できます★
★Chime版データを利用するには分子表示用プログラムのChimeが必要です(ダウンロード方法;IE7では現在利用不可)★
★Chimeコンテンツの一部はIEでエラーになる場合がありますので,Firefoxでお試しください(京都女子大・小波先生の情報)★

[TOPIC]
本コンテンツ集が国立国会図書館のPORTA収録(旧・Dnaviおよびデジタルアーカイブポータル
P450部分データ集について日本コンピュータ化学会2004秋季年会(2003/10/02-03,東京)で発表
PDBデータのLigand結合部位について日本コンピュータ化学会2003秋季年会(2003/10/25-26,広島)で発表;要旨
本データ集について,SCCJ2002秋季年会(2002/11/02-03,米沢)で発表;要旨
「生命情報科学概論」(新潟薬科大学での2003年度非常勤担当)の講義ページ公開 | PSBとSOSUI・TMHMMを利用した演習
関連ページ:複合分子と分子の重ね合わせ/分子データの作成方法
PDBデータを詳細に見るために《バーチャル分子NEWS》発行開始
バイオ関連トピックス集へWeb上の関連ニュース紹介検索サイトのカテゴリや最新情報検索結果例

= その他のコンテンツ例 =
※以下の多くはChime版ですが,一部Jmol版に変更しました。
生体分子のかたちの不思議生体分子の構成元素
分子と分子の相互作用(QSARと有機概念図から)/1I7Z(コカインを含むデータ例)のChain A・B
コドンと遺伝暗号表/1G59のChain A・Bなど
P450部分データ集
膜貫通タンパク質データ集βバレル型膜タンパク質データ集
PSBとSOSUI・TMHMMを利用した演習/1F88など
糖鎖を含むタンパク質/2MSBのChain Bなど
ノイラミニダーゼ立体構造予測データベース(理研)のデータより/AAC14419.1(理研DB)
科学未来館展示のタンパク質/1IGTなど
アプタマー/1KOCほか
ラメラリン α20-サルフェート(HIVインテグラーゼ阻害剤)/1QS4のChain A
対称構造を持つオリゴマータンパク質の例/1G31など
コレラ毒素の例/1XTC・1LTTのChain D-H
制がん剤/151Dの部分(DNAへのadriamycinのインターカレーション)と1TUP(がん抑制遺伝子p53)のDNA+Chain B
抗がん剤開発と標的タンパク質/1ISAなど 発がん性化合物の例/発がん性分子代謝物のDNA修飾など(1DXA1AG5より)
セカンドメッセンジャー/1g9qのChain Aなど
抗生物質を含むPDBデータ/1EI2のModel 1など
HIVとエイズ/1OHRなど
レトロウイルスのキャプシド六角環構造/1U7K
「予防原則」を取り上げた本から/3ERD
ペニシリンGを含むPDBデータ例/1FXVのChain B
PCBの生分解反応(バイオレメディエーション)/1LKDなど
3D-QSARによる内分泌かく乱物質のスクリーニング/エストロゲン受容体の分子モデル例(1ere等より)
エストロゲン受容体4種のSite部分重ね合わせ(1ere,1err,3erd,3ertより)
ヘモグロビン/1HHO4HHBのChain A
世界最小のタンパク質シニョリン/1UAOのModel〜16
水溶性ビタミンと脂溶性ビタミン/1E0P1BU51BJN1FE7のChain Aなど
風邪ウイルスに直接効く薬・プレコナリル/1C8MのMol_Id 1
緑色蛍光を発するタンパク質・GFP/1HCJのChain A
eF-siteとProModeを見るために/1AQU1BBHのChain Aなど [2002年ノーベル化学賞情報参照!]
《 今後も追加します;今週の分子も参照 》



画像作成例1 PDBコード順データリストページで作成したDNA接合タンパク質(1a02のChain F・J+DNA)の表示例.
上左:タンパク質は静電ポテンシャル表示でDNAは塩基別表示,上右:タンパク質アミノ酸残基の酸性・中性〈芳香族〉・塩基性区別表示.
下:PDBのLigand結合部位ページで作成したLeucine Zipper部分(緑色のDot Surface表示)
※Leucine Zipperについては,「できるバイオインフォマティクス」p.83,「ゲノム 第2版」,p.277参照.
JmolによるPDBデータ表示例でJmolでの1a02データ参照可能.



画像作成例2 PDBデータのLigand結合部位ページで作成した1ea1の例.アミノ酸は酸性・中性・塩基性区別,Dot Surfaceはlog P値順表示した場合.
アミノ酸および特性基の親水性・疎水性参照



画像作成例3 スーパーフォールドの例(水素結合表示,Ligandは球棒モデル)
グロビン(1thb_A),アップ-ダウン(256b_A),UBαβロール(1ubq),αβサンドイッチ(1aps_1),TIMバレル(7tim_A) doubly wound(2fox),免疫グロブリンフォールド(2rhe),Trefoil(1i1b),Jellyロール(2stv)
※美宅成樹・榊佳之 編,「バイオインフォマティクス」,p.175,東京化学同人(2003)
SCOP: Structural Classification of ProteinsCATH database of structural domains



画像作成例4 PDBデータLigand結合部位ページで作成したtRNA擬態タンパク質の例(下記文献p.21図2を参考に作成;コドンと遺伝暗号表も参照)
[上]左から,RRF;(1eh1_A),eRF1(1dt9_A)
[中]左から,EF-G(1dar_A),tRNA(ここでは1ml5_BC),EF-Tu tRNA 複合体(1ttt_AD)
[下]RF2(1gqe_A;原報と分子の向きが異なる)
◎詳細:中村義一 編,「RNAがわかる」,p.21,羊土社(2003)
※Googleによる“tRNA 擬態”検索結果同“分子擬態”
※分子擬態の解説例:タンパク質の生合成(福岡大学大学院理学研究科)
※図(リボンモデルと酸性・中性・塩基性アミノ酸区別表示)とPDB部分データ作成に当たっては,2003年度ゼミ生の金子祐子さんの協力を得ました.


★本サイト開設7周年記念のエッセー風コンテンツ“DNAの脆弱性と強靭性”にも作成画像を多数掲載しています.


はじめに 近年Web上には様々な分子関連データベースが登場し,広く活用されています。例えばProtein Data Bank (RCSB PDB)(または国内サイトPDBj)には,多くの研究者によってタンパク質やDNAの立体構造データの蓄積が続けられ,共有財産として様々な活用がなされています。
 本ページでは,その膨大なデータを利用することにより,タンパク質やDNAに関するWebコンテンツを作成する方法を概説しました。
 創薬や予防医学,化学物質の毒性等の研究,ナノテクノロジーなど,今後一層進展が期待される分野に関する基礎や最新の研究成果をインタラクティブにわかりやすく解説する日本語Web教材が多数発信されることにより,それらの分野に関心を持ってくれる小学生・中学生・高校生が増えていくことを願っています。

Protein Data Bankの収録データを加工して公開することについて,「営利目的でないこと」,「オリジナルデータがPDBのものであることを明記すること」を条件に許諾されている旨をご教示くださいました,PDBの日本サイトPDBjのご担当者に,厚く感謝いたします。


1.必要なPDBデータの探し方の例

 PDBデータを加工して自分なりに利用するには,RCSB PDBなどのデータベースや適当な検索サイトを利用して,必要なPDBデータを探し出す必要がある。以下はGoogleの機能を活用した検索方法の一例である。

★Protein Data Bankサイト内データの検索(キーワードは英語のみ)
Google

★Chime利用コンテンツの検索(キーワードは日英可;検索結果のコンテンツはpdb以外のmol形式データなどを含む可能性あり)
Google
※検索したサイトにアクセスしてページ内にChime分子が表示されない場合は,ブラウザをIEに変更してみてください。

【補足1】化合物名などの英語入力において,Canada式 医学用語変換辞書をインストールしておくと,例えばペニシリン→penicillinなど,かなりの医学用語を簡単に利用できます。
【補足2】名古屋大学理学部・郷研究室による,PDBデータベースをヘテロアトムから検索するHet-PDB Navi.も有用です。 → List of All Hetero-Atoms in PDB
【補足3】PDB IDがわかっている場合は,http://www.rcsb.org/pdb/explore.do?structureId=の後ろにそのID(1ereなど)を追加してアクセスすれば,複数の形式の分子表示が可能です。

《 その他ここに記載したほうがよいと思われる情報がありましたら作者までご一報ください 》

2.PDBデータから必要な部分を切り出す方法1ereよりChain Aを切り出す場合を例に)

 元となる分子モデルをブラウザに表示させ,PDBデータを保存する(モデル上で右クリックして表示されるメニューの,File → Save Molecule As.. で可能)。それをエディタやメモ帳で開き,必要な部分だけを残して任意の名前で保存すればよい。ただし,拡張子はpdbにすること。
 以下は,1ereのデータファイルの構造である。2・3行目がタイトルで,6行目でChainがAからFまであることがわかる。行頭にATOMと書いてあるところからが個々の原子データであり,以下の618行目がChain ASER(セリン)に含まれる窒素であることがわかる。行頭がHETATMとあるのは,ligandに含まれる原子や水分子の酸素などであり,以下では2496行目からのESTが17β-estradiol(以下では省略したが,511行目に注記),2534行目のHOHが水分子の酸素の最後であり,どちらもChain Aに付属するものであることがわかる。2535行目からがChain Bの原子である。このようにして,必要なligandが含まれているChainを探して切り出せばよい。ただし,HOHなどがどのChainに属しているものかわからないデータもあるので注意を要する。
 結局,下の例では色の618行目から2534行目までと,データの終了を示す最終行の12241行を残して削除し,拡張子をpdbにして保存すればよいことになる。なお本例では,オリジナルデータが12241行で切り取り後が1918行となり,データ転送・表示の上でもコンパクト化の効果がある。
 DNAデータも原子情報が若干異なるが,同様にして必要部分を探し出すことができる。

行番号 内容
1 HEADER    NUCLEAR RECEPTOR                        08-SEP-97   1ERE
2 TITLE     HUMAN ESTROGEN RECEPTOR LIGAND-BINDING DOMAIN IN COMPLEX
3 TITLE    2 WITH 17BETA-ESTRADIOL 
:   (中略)
6 COMPND   3 CHAIN: A, B, C, D, E, F;
:   (中略)
617 MTRIX3   5  0.237374  0.108791 -0.965307      163.39461    1
618 ATOM      1  N   SER A 305      22.376  70.539 109.257  1.00 90.58
619 ATOM      2  CA  SER A 305      21.381  69.729 110.019  1.00 89.92
:   (中略)
2496 HETATM 1879  C1  EST A 600       7.102  47.142 129.486  1.00 36.56           C  
:   (中略)
2534 HETATM 1917  O   HOH A  19       4.849  54.453 123.780  1.00 82.63
2535 ATOM   1918  N   SER B 305      25.272  71.505 158.635  1.00 90.04           N  
:   (中略)
12241 END

※参考:収録PDBデータの加工についてPDBデータのサイズを小さくする秀丸マクロ


3.作成したPDBデータの分子情報をわかりやすく表示する方法

PDBデータを詳細に見るために(Chime版) 参照

※以上を参考にして作成したPDBデータとhtmlをWebで公開するには,そのコンテンツが営利目的でないことと,オリジナルのPDBデータや文献等が確認できるようなコメント等を必ず付記しておくことが必須となっている。



「生活環境化学の部屋」ホームページJmol版「分子の学習帳」Chime版「分子の学習帳」注意事項