科目名 ロボットビジョン特論
単位数 2.0
担当者 システム工学専攻 教授 李 仕剛
履修時期 前期
履修対象 1、2年生
講義形態 講義
講義の目的 ロボットに視覚を持たせるのは、知能ロボットの実現に欠かせないことである。本講義では、ロボット工学において、ロボットの目としてのカメラで撮像された画像に関する様々な処理の基礎について学ぶ。

A mobile robot needs to sense its environment for almost all tasks.
In this course, the basic knowledge and skills about images captured by a camera will be learnt.
到達目標 ・ロボットビジョンの基礎としてのカメラモデル、フィルタリング処理を理解し説明できること。
・ 画像からの特徴の抽出と対応、及び、球面画像モデル、球面画像合成の方法を理解し説明できること。
・画像から3次元情報の算出、立体視、深層学習による物体認識の基礎知識を理解し説明できること。
受講要件 Pythonでのプログラム作成が行えること

Programming skills with Python languages
履修取消の可否
履修取消不可の理由
事前・事後学修 事前学修としては、教科書や配られるプリントを読み,ノートに要点を整理しておくことが望ましい.事後学修として積極的に演習課題を完成することで学習の定着度を高めるようにしてほしい。
授業時間以外の自主的な学習時間として合計30時間程度を想定する。
講義内容 第1回: イントロダクション
第2回: カメラモデルと球面画像の表現
第3回: 正距円筒図法画像から離散球面画像の生成方法 
第4回: 離散球面画像生成の演習 
第5回: 離散球面画像生成の演習課題の発表
第6回: 正距円筒図法画像からキューブマップの生成方法
第7回: キューブマップ生成の演習
第8回:キューブマップ生成の演習課題の発表
第9回: 魚眼カメラモデル
第10回: 研究論文紹介:全方位画像の表現
第11回: 研究論文紹介:全方位画像の処理
第12回:研究論文紹介:全方位画像の応用
第13回: 研究論文紹介:全方位画像を用いた言語視覚ナビゲーション
第14回: 深層学習による全方位画像処理の演習
第15回: まとめ
期末試験実施の有無 実施しない
評価方法・基準 演習課題のプログラム作成に伴うレポート提出ならびに発表会での発表内容(4x25%)を総合的に評価する

Project report & representation (4 x 25%)
教科書等 Richard Szeliski(著):Computer Vision: Algorithms and Applications (Texts in Computer Science), Springer,2010.
http://szeliski.org/Book(Free)

Goodfellow, Bengio and Courville: Deep Learning(https://www.deeplearningbook.org)

参考書:
藤本 雄一郎 (著), 青砥 隆仁 (著), 浦西 友樹 (著), 大倉 史生 (著), & 3 その他:OpenCV 3 プログラミングブック教科書:

参考資料:
https://uni-tuebingen.de/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/autonomous-vision/lectures/deep-learning/
担当者プロフィール 教員室:情報科学部棟8階863号室

大阪大学助手、広島市立大学助教授、岩手大学准教授、鳥取大学教授を経て、2015年4月広島市立大学教授として着任、現在に至る。専門分野は、コンピュータビジョン、ロボットビジョン、知能システムなど。現在、全方位画像を扱う球面視覚、視線や脳波などの生体情報を利用したマンマシンインタフェースに関する研究に従事。システム工学専攻のインタフェースデザイン講座所属。

学習指導・支援について: 授業内容に関する質問や相談は随時受けつけますが、居室を訪ねる場合には、授業前後の空き時間や電子メールなどで事前にアポイントメントを取るようにしてください。
講義に関連する実務経験
課題や試験に対するフィードバック 講義中での解説を行う
アクティブ・ラーニング 画像処理のプログラミング、レポートライティング、課題発表
キーワード カメラモデル、球面画像、正距円筒図法画像、離散球面画像、キューブマップ、深層学習

Camera model, spherical image, equirectangular image, cube-map, deep learning
備考