第36回人工知能学会 AI チャレンジ研究会
第36回 人工知能学会 AIチャレンジ研究会(SIG-Challenge) 開催案内
(人工知能学会 合同研究会(11/15-17)の一環として開催いたします。こちらの詳細は http://www.ai-gakkai.or.jp/jsai/sig/sigconf2012/ をご覧ください.)
- 日時: 2012年11月15日(木) 9:30〜17:30
- 開催場所:慶應義塾大学 日吉キャンパス 来往舎 シンポジウムスペース
(http://www.keio.ac.jp/ja/access/hiyoshi.html 10番の建物)
- テーマ:ロボット聴覚・音環境理解 (聴覚による情景分析)、
ロボット聴覚機能のための音響技術、音声処理、対話処理、音楽ロボット
音声に限らず音一般の知覚・理解
- 参加費・予稿集代: 無料
なお,プログラムと合同資料集(USBメモリ)を4,000円にてご購入いただけます..
また,これまでと同様,本研究会の予稿集は,当日USBメモリにて配布,および,本ホームページからも公開します.
- 担当幹事:
中臺 一博((株)ホンダ・リサーチ・インスティチュート・ジャパン/東京工業大学)
戸嶋 巌樹(NTT コミュニケーション科学研究所)
公文 誠(熊本大学)
9:30-10:20 基調講演
- [基調講演] 両耳間時間差の脳内処理メカニズムへの心理物理学的アプローチ
古川茂人 (NTT コミュニケーション科学基礎研究所)
- 両耳間時間差(ITD)は音源定位の主要な手がかりである。ITD情報がヒトの脳内でどのような段階を経て処理されているか、それを心理物理学的に解明するための我々の取り組みと成果を紹介する。
10:20-12:00 Session 1
- ロボットのための実環境ロバストな実時間超解像三次元音源定位
中村圭佑 (HRI-JP/京都大学)、中臺一博(HRI-JP)、奥乃博(京都大学)
- 本稿では、実環境ロバスト性、空間解像度、実時間性の向上を実現するロボットによる三次元音源定位について述べる。
- 両耳間レベル差を用いた音源定位における耳孔位置の最適化
公文誠、木元大輔 (熊本大学)
- バイノーラル聴覚ロボットにおける両耳間レベル差を用いた音源定位の定位性能を前提に,楕円体型耳介の耳孔位置の最適設計について報告する.
- 複数ロボットによる音源定位結果を統合し発話者を特定するシステム
中島大一、駒谷和範、佐藤理史 (名古屋大学大学院)
- 2体のロボットから得られる音源定位結果の統合に基づき発話者の特定を行い,そのユーザに対して顔を向け応答を返すシステムを開発した.
- 多チャンネルマイクロホンアレイを用いた音声区間検出および音源定位の精度の向上の検討
黄楊暘、大塚琢馬(京都大学大学院)、中臺一博(HRI-JP)、奥乃博(京都大学大学院)
- 本稿では、いつ, どこで, 誰が話しているかを推定する話者ダイアライゼーションシステムの構成を述べる. 様々な観測音に対して頑健な IVA を前処理とすることで,全体のパフォーマンスの改善に寄与していることが確認できた.
12:00-13:00 lunch
13:00-13:50 レクチャー講演
- [レクチャー講演]ノンパラメトリックベイズによるメディア処理
中野允裕 (NTT コミュニケーション科学基礎研究所)
- 本発表では音響, 画像, 自然言語処理を対象にした近年のベイズ的な手法について概観する. 混合モデル, 隠れマルコフモデル, 確率文脈自由文法, nグラム,非負値行列因子分解, 独立成分分析などの基本的な確率モデルのベイズ的な扱い方や応用, それらを無限モデルとして扱うためのディリクレ過程やレヴィ過程について解説するとともに, 最近のノンパラメトリックベイズの発展としてモンドリアン過程や行列式点過程などについても紹介する.
13:50-15:05 Session 2
- 無限混合ガウスモデルを用いた未知クラスに対応可能な実環境音分類法
佐々木洋子,吉井和佳,加賀美聡 (産業技術総合研究所)
- 日常環境中の様々な音を認識するため、音のクラス数や各音モデルの次元数を入力音に合わせて学習する方法について述べる。
- アクティブ視聴覚統合による発話区間検出の検討:因果モデルベースアプローチ
吉田尚水(東京工業大学)、中臺一博(東京工業大学/HRI-JP)
- 本稿では,因果モデルを用いた視聴覚情報とロボットの移動を統一して扱う枠組みを提案し,プロトタイプシステムを用いて評価を行う.
- ベイズモデルによるマイクロホンアレイ処理の移動ロボットへの応用
大塚琢馬 (京都大学)、石黒勝彦、澤田宏 (NTT コミュニケーション科学基礎研究所)、奥乃 博 (京都大学)
- 本稿では,マイクロホンアレイを用いた音源定位・分離問題に対する統一的ベイズモデルを説明し,
移動ロボットによる音環境理解応用への課題と実験結果について述べる.
15:05-15:20 break
15:20-16:35 Session 3
- Multi-modal sound localisation from a mobile platform
Jani Even, Nagasrikanth Kallakuri, Yoichi Morales, Carlos Ishi, Norihiro Hagita (ATR-IRC)
- This paper presents a sound localisation system that is operating on-board a mobile platform. First, the audio data acquired by a microphone array are processed with a steered response power algorithm that searches for the direction of the sound sources. Then the distance to these sound sources are estimated by using the data from the two laser range finders mounted on the mobile platform. Finally the locations of the sound sources are estimated by combining the direction and the distance information with the platform pose estimation.
- 複数のマイクロホンアレイおよび空間情報と反射音を利用した音源定位の検討
石井カルロス寿憲、Jani Even、萩田紀博 (ATR知能ロボティクス研究所)
- 複数のマイクロホンアレイにおいて音源方向推定を行い、空間の情報と反射音の方向の情報を利用し音源定位(3次元空間の位置推定)に利用する枠組みを提案する。
- A Two Microphone-Based Approach for Multiple Speaker Localization on the SIG-2 Humanoid robot
Ui-Hyun Kim, Hiroshi G. Okuno (Kyoto University)
- A system based on the generalized cross-correlation (GCC) method weighted by the phase transform (PHAT) has been developed for multiple speaker localization. In real environments with binaural robot audition, speaker localization is degraded by the interference created when the speech waves arrive at a microphone from two directions around the robot head and by impaired performance when there are multiple speakers. This paper presents a new time delay factor for the GCC-PHAT method to compensate multipath interference on the assumption of spherical robot head and a multisource speech tracking method consisting of voice activity detection and K-means clustering for multiple speaker situations.
16:35-17:30 デモセッション [随時募集中] (応募があり次第,追加していきます.)
- HARKによる三次元音源定位の紹介
中村圭佑 (HRI-JP/京都大学)、中臺一博(HRI-JP)
- ロボット聴覚ソフトウェアHARKの次期リリース版の新機能である三次元音源定位に関するデモを紹介する。
- 静音型バイノーラル聴覚ロボット
木元大輔,公文誠(熊本大学)
- 超音波モータを用いた駆動音の小さな聴覚ロボット(耳介つき)の動作を展示する.
- 頭部運動による聴覚への影響
戸嶋 巌樹(NTT コミュニケーション科学研究所)
- 頭部運動は聴覚へ様々な影響を与える。音の分離感や定位感について、頭部運動を模擬した刺激によって、その影響を体感する。
- グループ会話支援のためのワイヤレスマイクロホンアレイ「くらげクン2号」の開発
ムン・ソンウン(千葉大学)、高木健太郎(SIF)、釜島力(SIF)、中臺一博(東工大/HRI)、大武美保子(千葉大学)
- ワイヤレスマイクロホンアレイ「くらげクン2号」の開発とグループ会話支援のために行った音源定位性能評価実験について報告する。
- 32chマイクロホンアレイによる音源定位
佐々木洋子,加賀美聡(産総研)
- 円板形状のマイクロホンアレイによる音源定位と音圧計測の様子を展示する.
公知日について
公知日は 2012/11/14 となります。
リンク
人工知能学会 AI チャレンジ研究会
Copyright (c) 2012, 人工知能学会 AI チャレンジ研究会.