automated detection and tracking of many cells by using 4d live-cell imaging data@ismb2014読み会
TRANSCRIPT
@ISMB2014 読み会
東大院・新領域・情報生命
岩崎研究室 博士二年 福永 津嵩
自己紹介
研究テーマ:
「動画解析から迫るメダカの社会性行動」
Fukunaga et al. submitted
バイオイメージインフォマティクスとは?
生命画像データを対象としたバイオインフォマティクス
– 細胞や動物のトラッキング
– 核や細胞膜の同定、細胞の形状の定量化
– 単粒子解析
参加者 124名!
Cell tracking problem
• 顕微鏡の発達により、細胞を4次元(3次元+時間)で観測出来るようになった。
• どの細胞がどういう風に動いていったかを知りたい!
• 手動でやるのは大変…→コンピューターの出番です
Multi-tracking の難しさ
• 複数の細胞を全て検出する事
• 細胞が複数ある撮影条件で、細胞のIDをずっと保持しておく事
本研究の目的
• 以下の動画の条件で、IDを保持したまま複数の細胞をトラッキングする
• 動画の条件
–細胞の数は数百個
–細胞は急速に動く事がある
–フレーム間で、細胞は大体同じ方向に動く
–細胞の形は楕円体とする
Dataset
• 共焦点顕微鏡で撮影した線虫の神経核細胞
• 核はRFPで染色。
• 各ボクセルは輝度のデータのみ持つ
Dataset1
• 「細胞を検出できるか調べるためのデータ」
–時間軸データを含まない
• 大きさは512 × 256 × 203
• 各イメージは148-200の細胞を含んでおり、人間によって正解アノテーションが付けられている
• データセット10個
Dataset2
• 「トラッキング成功率検証用のデータ」
– 500フレーム, 2.56fpsの画像から構成される
• 大きさは512 × 256 × 20
• 線虫は固定されているが姿勢は変化する
Outline of the method
• 以下の4つのステップからなる。
1. 各フレームにおいて、画像データをカーネル密度推定し、連続関数に変換する。
2. 1st frameにおいて、密度関数の局所最大値を検出する。その数をgとした時、g個のtrackerを生成する。
3. 後続フレームtにおいて、密度関数とt-1フレーム目でのtrackerの場所を元に、g個のtrackerを移動させる
4. 各trackerの位置を元に細胞をセグメンテーションする。
Outline of the method
カーネル密度推定
n: 標本数
wi: 混合比(輝度を正規化したもの)
xi: voxelの座標
h: バンド幅
カーネル密度推定をする事で、画像データに含まれるノイズの影響を減らせ、正確なzero gradientが求まる
バンド幅と分散行列
• 小データで各データセットに対してチューニング
• データセット1, 2に対して、
– hは0.52と0.97
– Σはdiag(10,10,10)及びdiag(5.06,5.06,1.0)
局所最適解を探す
• 山登りアルゴリズムで局所最適解が求まる
• ψ(0)は任意の初期解
• 本データ対し、500個の初期解から始めて山登りアルゴリズムを試した所、157個中118個しか検出出来なかった
山登りアルゴリズムの改良
• m個の初期解から同時に探索させる
• 近くに他の解があったら、そのボクセルは考えない事にする。近傍の範囲はステップを踏むごとに小さくなっていく。
v0は細胞の大きさを粗く推定したもので、βはv0/500
山登りアルゴリズムの改良
トラッキングアルゴリズム
• トラッキングミスを防ぐために、「近隣の細胞は大体同じ方向に動く事」を利用する
• Cj: j の近傍
–時刻t-1において、マハラノビス距離に基づき完全グラフを作成後、最小全域木を作成
トラッキングアルゴリズム
解
セグメンテーション
• 各trackerの位置を元に細胞をセグメンテーションする。
1. ROIを初期化
2. 各ボクセルがそれぞれのROIに所属する確率を計算
3. 確率が閾値を超えていたらROIに加える
4. 収束するまで2-3を繰り返す
Result: Cell detection
Result: tracking