結晶解析による構造の精度 - pdb japan - pdbj · 本日のメニュー •...

38
結晶解析による構造の精度 ~構造解析をしないバイオインフォマティクスの人へ~ 東京医科歯科大学 難治疾患研究所 伊藤 暢聡 PDBj講習会@東京農工大 201337

Upload: others

Post on 08-Oct-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

  • 結晶解析による構造の精度 ~構造解析をしないバイオインフォマティクスの人へ~

    東京医科歯科大学 難治疾患研究所

    伊藤 暢聡

    PDBj講習会@東京農工大 2013年3月7日

  • 本日のメニュー

    • 何が問題か? • 結晶構造解析「超入門」 • 位相の落とし穴(「位相問題」とモデルバイアス)

    • いろいろな指標 • 最終兵器

  • 何が問題か?

  • PDBデータに関する(大)前提の違い

    PDB に登録された構造

    Structural Biologists Bioinformatics

    成果 情報源

  • 構造決定の“技術的な”問題点

    • 基本的にデータ不足 (under-determination) 連立方程式(実は不等式=データ精度)で変数の方が多い可能性が高い

    • 常に研究者の「解釈」が介入する ゲノムの塩基配列のようなデジタル情報ではない

    • 結晶の質や構造の安定性のために、構造の精度は結晶間でも結晶内でも一定ではない

    グローバルな指標だけでは解決しない

  • 具体的な「エラー」

    (構造解析に根本的な問題がない、と仮定して)

    • グローバルなエラーは、ほぼ無くなっている(が…)

    • ローカルなエラー(あるいは情報の欠如)は、無くすのが困難。

  • 実例①(グローバル)

  • PDB 論文 全然、似ていない六量体構造

    実は、「結晶学的」には「どちらも正しい」

  • 実例②(ローカル)

  • Carp Parvalbumin PDB ID 4CPV 5CPV Authors Kumar et al.

    (1990) Swain et al. (1989)

    Spacegroup C2 C2 a, b, c (Å) 28.5 61.0 54.4 28.7 60.6 54.3 beta (deg) 95.0 94.6

    Resolution (Å) 1.5 1.6 R factor (%) 21.5 18.7 RMSD (Å) 0.44 (main) 1.03 (all) Max (Å) 3.03 (main) 7.40 (all)

  • 4CPV 5CPV

    当然、全体的にはそっくり

  • でも、微妙に違う…

  • よく見ると…

  • 一見、よく一致している部分でも(Leu67)

  • X線結晶解析「超入門」

  • タンパク質の(単)結晶

    • 同じ構造を持ったものの空間的な繰り返し。その基本となる平行六面体を「単位格子 (unit cell)」とよぶ。

    • 単位格子は必ずしもタンパク質1分子とは限らない。

    • がちがちに詰まった「塩」ではなく、「硬いスポンジ」

  • 単位格子 (unit cell)

    a b

    c α β

    γ

    これの3方向への平行移動の繰り返しが結晶 6つの単位格子定数(unit cell parameters)

  • 非対称単位 (asymmetric unit)

    単位格子内で、さらに対称性を考慮した「結晶学的に独立な最小単位」。これが決まれば、回転・並進・反転などの対称操作で全てが決まる。 この単位とタンパク質の1分子が対応するとは限らない。非対称単位内に複数の同一タンパク質が存在する場合、それらは結晶学的に独立でことなる立体構造を持ちえる。また、この場合、結晶学的には完全でない非結晶学的対象性(non-crystallographic symmetry)が見られることがある。

  • ブラッグの法則 (Bragg’s law)

    2d sinθ = n λ

    d

    θ

  • 回折のインデックス 個々の回折には、それが由来する結晶面に基づいたインデックスという3つの整数(h, k, l) が与えられる。 インデックスが大きくなると面間隔(d)が狭くなる → 回折角(θ)が大きくなる

    a

    b

    (1, 1, 0)

    (3, -1, 0)

    (3, -2, 0)

  • 実空間と逆空間

    (a, b, c)の3つのベクトルから定義される実空間(real space)に対して、以下のような(a*, b*, c*)からなる逆空間(reciprocal space)を定義する

    a ・ a* = 1 a ・ b* = 0 a ・ c* = 0 b ・ a* = 0 b ・ b* = 1 b ・ c* = 0 c ・ a* = 0 c ・ b* = 0 c ・ c* = 1

    すると、個々の回折(h,k,l)は逆空間での格子点に対応する。

  • 特殊な撮影をすると (screened precession photographs)

    単位格子定数がわかる

  • 実空間と逆空間の関係

    実空間

    逆空間

    フーリエ変換

    回折強度 散乱体(電子密度)

    回折強度を測定して(位相情報も決定して)フーリエ変換で結晶中の電子密度を推定しよう!!

  • X線によるダメージと低温測定

    X線による結晶の破壊 ← タンパク質の界面の変性 1次的:X線が直接に 2次的:水がラジカル化して

    回折データは時間的にも劣化する可能性がある

  • 電子密度図とモデルビルディング

  • 位相の落とし穴

  • 波を記述するには

    f = F eiα α

    F

    波長(λ)

    振幅(F) 位相(α)

    波長・振幅・位相の3つのパラメーターが必要 単波長のX線を用いるの場合、振幅と位相が必要

  • 位相の問題点

    直接的な決定は困難(振幅は強度の平方根から得られる) ⇒ いわゆる「位相問題」 初期構造は Fobs と αobs から決定されるが、精密化は Fobs と αcalc で行われる ⇒ モデルバイアスの危険性

  • 位相の重要性

    F

    α

    (英York大学のウェブサイトより)

  • 様々な指標

  • 指標いろいろ

    • グローバル 逆空間(解像度、Rsym、R、 Rfree など) 実空間(立体化学RMSD など) • ローカル 実空間(Real-space R or CC, Ramachandran plot 、 rotamer、 ローカルな立体化学など)

  • 解像度の影響(初期2.5Åマップ)

  • 精密化すると(1.7Å)

  • Ramachandran plotの比較

    Initial model 2.2Å 1.7Å

  • 側鎖の方は(χ1)

    2.2Å

    1.7Å

  • 解析する側のジレンマ

    • 不明瞭な電子密度 “何かある”時に、モデル化するのかしないのか。(リガンドやループなど)

    • 「経験則的な」構造チェック 経験則から外れた場合こそ、面白い。 (Ramachandran outliers、non-Pro cis-

    peptideなど) 精密化に用いる「辞書」も同様。

  • 最終兵器

  • 困った時はマップ(電子密度図) を見よう!

    (結晶中の再現) • Experimental map • 2Fo-Fc map • Omit map (差異の探索) • Fo-Fc map • Fo-Fo map

    結晶解析による構造の精度�~構造解析をしないバイオインフォマティクスの人へ~本日のメニュー何が問題か?PDBデータに関する(大)前提の違い構造決定の“技術的な”問題点具体的な「エラー」実例①(グローバル)スライド番号 8実例②(ローカル)Carp Parvalbumin当然、全体的にはそっくりでも、微妙に違う…よく見ると…一見、よく一致している部分でも(Leu67)X線結晶解析「超入門」タンパク質の(単)結晶単位格子 (unit cell)非対称単位 (asymmetric unit)ブラッグの法則 (Bragg’s law)回折のインデックス実空間と逆空間特殊な撮影をすると�(screened precession photographs)実空間と逆空間の関係X線によるダメージと低温測定電子密度図とモデルビルディング位相の落とし穴波を記述するには位相の問題点位相の重要性様々な指標指標いろいろ解像度の影響(初期2.5Åマップ)精密化すると(1.7Å)Ramachandran plotの比較側鎖の方は(χ1)解析する側のジレンマ最終兵器困った時はマップ(電子密度図)�を見よう!