7. The KITTI Benchmark Suite

カラーステレオ画像の引用

ベンチマーク画像としてTSUKUBAステレオ画像ばかりを使ってきましたので, こんどはもっと新しいベンチマーク画像を使ってみたいと思います. The KITTI Vision Benchmark Suite では,自動車の自動運転技術のためのベンチマーク画像が提供されています. ライセンスは「The Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License」です. ここでは膨大なデータの中から左右2枚の画像を引用します. この2枚の画像の再利用に関してはこのライセンスに従ってください. Stereo Evaluation 2012 ページの Download stereo/optical flow data set (2 GB) ボタンを押して入手できる. data_stereo_flow.zip ファイルを展開して得られるファイル群の中から

  • training/colored_0/000000_10.pngをL000000_10.pngとして引用
  • training/colored_1/000000_10.pngをR000000_10.pngとして引用
しました.カラーによるステレオ画像の最初のシーン000000の10フレーム目ということのようです. 11フレーム目も収められていてオプティカルフローのベンチマークになっているようです. この2枚の画像を以下に示します.
L000000_10.png
R000000_10.png

gaze_line-depth modelの適用結果

記事3のdepth_stereo.cppを適用した結果の視差ファイルは

gaze_line-depth modelによる視差
となりました.実行は
./depth_gpu R000000_10.png L000000_10.png 68 0 14 1023 1 3
としました.最後の3はscale factor値です. 最大視差が68なのは3d_stereo.cppを使って目視で見つけることができます. 非常に遠方の景色が映っているので最小視差は0となります. 次に3d_stereo.cppを適用した結果を動画にすると
2枚のステレオ画像から生成した動画
となりました.3d_stereo.cppは記事3のものに以下の1文字キーコマンドを追加したものを使いました.
1文字キーコマンド一覧
文字機能
6video(result.avi) out
Heye move left
Jeye move down
Keye move up
Leye move right
Feye move forward
Neye move back
Cclear angle and position
また
1文字キーコマンド一覧
文字機能
heye move left angle
jeye move down angle
keye move up angle
leye move right angle
と機能の説明文を変更しました. 小文字の「h,j,k,l,f,nキー」コマンドは原点の周りのアクションなのに対し, 大文字の「H,J,K,L,F,Nキー」コマンドは座標軸に沿っての移動となります. 新しい 3d_stereo.cppmakefileを ダウンロードして,
make 3d_g
と打ち込み,コンパイルと起動を行ってください. makefileを見れば分かりますが,プログラムの起動は
./3d_gpu R000000_10.png L000000_10.png 68 0 14 1023 1
となっています. 動画を作るには,まず「,キー」でグラフカットを行います. 次に「6キー」で動画作成を指示します. 「6キー」では前に進んで,進みながら少し右を見て, 少し前に進んでそれから, 元に戻るという動画が記録されるようになっています. 「qキー」で終了です. この動画ファイルresult.aviはサイズがちょっと大きいので MacかWindowの機能を使って m4vファイルにエンコードします. グラフカットに時間がかかりますのでCPUではちょっと無理です.