PDB highlight は、タンパク質のアミノ酸配列や二次構造や立体構造などを、 それぞれのレベルで可視化表示するサービスです。また、単に表示するだけで なく、外部のデータベースを参照したり解析サービスを呼び出したりすること も簡単に行なえます。
PDB highlight は WebPACADE という統合的な検索/解析サービスの中のサブ システムです。WebPACADE の中には他にも、タンパク質の類似部分構造を検索 する PACADE や、データマイニングシステムなどが入っています。PDB highlight は、WebPACADE の中でこれらのサブシステムと統合されていますか ら、PDB highlight の中から類似構造検索結果を呼び出したり、データマイニ ングを実行することもできるようになっています。
PDB lighlight は Chemscape Chime というプラグインを立体構造の可視化に 用いています(以下では単に Chime と呼びます)。このプラグインは有名な 可視化ソフトウェアRasMolが発展したもので、MDL社が 無償で配布しています(要登録)。 ブラウザは Netscapeと Internet Exploler の両方が使えます。プラットフォームは Windows、Macintosh、IRIXの3つが使えます。バージョンアップ情報などを見 ると、現在は Win > Mac > IRIX という優先順でサポートしているようです。 ダウンロードは PDB highlight の初期画面から「Download a plug-in」の リンクを辿ることで行なえます。ちなみに Chemscape Chime Pro や Chemscape Server は別物(有償の製品)ですので、間違えないよう御 注意下さい。ブラウザが既にインストールされているPCの場合、プラグインを ダウンロードしてクリックし、メニューに従えば問題なくインストールできる ことと思います。インストールが終れば準備は終了です。
それでは PDB highlight の初期画面(入力フォーム)を見てみましょ う。初心者の方はキーワードサーチから入られることを御勧めします。慣れて きたらその下のフォームを使って、指定したタンパク質の部分構造を直接ハイ ライト表示することもできます。
キーワードサーチの入力フォームに、「troponin」と入力し、リターンを押す かまたは search のボタンを押して見ましょう。すると、20個程度のタンパク 質がヒットします。一番下に表示されている「5tnc TROPONIN-*C」の所をクリッ クすると、このタンパク質をビジュアルに表示するためのウィンドウが別に開 きます。アミノ酸配列の所(SEQRESの所)がきれいに並んでいない場合は、ブ ラウザのメニューの「view」を押してメニューを出し、「Encoding」を 「Western」にして下さい。
この段階では、指定したタンパク質 5tnc の全体が選択されていますが、例え ば上の方の入力フォームの Region: の所にある start の所に 80 と入力して redisplay ボタンを押すと、全体の半分(後ろ半分)がハイライト表示されま す。さらに、end の所に 120 と入力して redisplay ボタンを押すと、80番目 のアミノ酸から120番目のアミノ酸がハイライト表示されます。
この画面には、SEQRESの所にアミノ酸配列、右下のテーブルに二次構造、左下 のグラフィックスに立体構造という3レベルの情報が主に表示されていますが、 どれを表示するかは上の方の Type: の所で制御できます。例えば、secondary の所をクリックしてチェックが外れた状態にし、redisplay を押すと、右下の テーブルが表示されなくなり、代わりに立体構造が大きく表示されます。
さてこの立体構造を表示している箇所ですが、この中を自由に操作することが できます。以下のような操作を試してみて下さい。わからなくなったら redisplay ボタンを押せば、最初の状態にもどります。Winの場合
左ボタンでドラッグして自由に回転Macの場合shift+左ボタンでドラッグして拡大/縮小
ctrl+右ボタンでドラッグして平行移動
shift+ctrl+右ボタンでドラッグしてその場で回転
右ボタンをクリックしてメニューを出し、
Rotate のチェックボックスで回転/静止Display メニューで表示方式の変更
マウスボタンでドラッグして自由に回転shift+マウスボタンでドラッグして拡大/縮小
option+マウスボタンでドラッグして平行移動
shift+option+マウスボタンでドラッグしてその場で回転
マウスボタンを押し続けてメニューを出し、
Rotate のチェックボックスで回転/静止Display メニューで表示方式の変更
また、この PDB highlight のビジュアルウィンドウからは、他のデータベー スや解析サービスを呼び出すことができます。Action: の欄にある PDB entry は、立体構造表示のための元データである PDB のエントリを表示できますし、 SCOP や CATH の所は、タンパク質の立体構造を分類した海外のデータベース を参照できます。ウィンドウの中ほどにある Analysis: の欄では、代表的な 配列解析手法である BLAST や FASTA などのホモロジー検索や、生物的な意味 のあるアミノ酸配列パターンの有無を検索する MOTIF などが呼び出せます。 呼び出す際には、ハイライトした領域の配列が自動的に引き継がれます。試し に MOTIF をクリックしてみましょう。アミノ酸が1文字表記になってますが、 さっきのウィンドウでハイライトした箇所の配列が自動的に入力された状態に なってます。
さて、このウィンドウを一旦閉じて頂いて、一 番最初の入力フォームに戻って下さい。上の方にある Example をクリックす ると、さっきのタンパク質のある場所がハイライト表示された状態になります。 ここで、Analysis: の欄の PACADE を押すと、予め実行してある類似部分構造 検索結果の一部が表示されます。さっきのウィンドウでハイライトした部分構 造、つまり131番から159番の領域によく似た部分構造が別のタンパク質にも存 在する場合、このように類似部分構造のリストとして表示されます。個々の部 分構造をクリックすると、別のウィンドウが開き、PDB highlight によってハ イライト表示され、本当に形が似ているかどうかを目で確認することができま す。
最後に、類似部分構造が見つかったタンパク質に共通する性質は何かというこ とを調べるデータマイニングシステムについてお話します。Execute data mining と書いてある所をクリックしてみて下さい。すると、データマイニン グのための入力フォームが呼び出されます。このシステムにおけるデータマイ ニングは、よくコンビニエンスストアなどの販売動向を調べる例で説明される、 相関ルール発見という手法を用いています。
入力フォームでは、ゲノムネットが提供するどのデータベースに対してマイニ ングを行なうかを選択できます。最初は prosite というデータベースが選ば れています。試しにこのまま submit ボタンを押してみましょう。すると、相 関ルールが一つ見つかったと表示されます。この相関ルールは、ユーザが指定 したタンパク質集合、つまり、さっき類似部分構造が見つかったタンパク質集 合と、prosite データベースのあるエントリの間に相関関係があることを示唆 しています。エントリの内容は、クリックすることで表示できます。表示して みると一番上に EF_HAND というモチーフ名が書いてあります。実は先ほどの 例で使った類似部分構造というのは、タンパク質がカルシウムと結合する EF-HAND と呼ばれる部位でして、その部分構造を持つタンパク質の集合が、確 かに EF_HAND というアミノ酸配列モチーフを持つことがここで示唆されたわ けです。
御意見や御質問はお気軽に佐藤までお御寄せ下さい。