Visual Recipe Flow —レシピの作業フローに伴う物体の視覚的状態変化を学習するためのデータセット

京都大学との共同プロジェクトの成果が自然言語処理分野の伝統ある国際会議の一つであるCOLING2022にポスター論文として採択されました. Keisuke Shirai, Atsushi Hashimoto, Taichi Nishimura, Hirotaka Kameko, Shuhei Kurita, Yoshitaka Ushiku, Shinsuke Mori, “Visual Recipe Flow: A Dataset for Learning Visual State Changes of Objects with Recipe Flows”, COLING 2022 作業に伴って生じる物体の状態変化を予測することの重要性 自然言語によってロボットに所望の作業を代行させる技術は,人口減少時代を迎えつつある先進諸国において非常に期待が高まっています.しかしながら現在行われている研究の多くは物体の位置や姿勢を変える動作の代行に留まってしまっています.言い換えれば,多様な技術的制約のために材料から価値ある製品を組み立てるといった課題をこなすロボットを言語で動かすというレベルには世界中の誰もが踏み込めていないのが現状です.本研究ではロボットが将来的に複雑な課題をこなすことが可能になった際に,それを言語で制御するための技術を先行して開発することを目的とし,「文章で指示された目標状態を計算機上でどのように表現すべきか?」という課題を切り出し,このような課題実現のための機械学習モデルを獲得するためのデータセットを提供しています(図1)

Visual Recipe Flow —レシピの作業フローに伴う物体の視覚的状態変化を学習するためのデータセット
Visual Recipe Flow —レシピの作業フローに伴う物体の視覚的状態変化を学習するためのデータセット

ノイズありユニバーサルドメイン適応の研究がCVPR2021に採録されました

オムロンサイニックエックスで実施された下記の研究がコンピュータビジョンにおける最難関会議の一つであるIEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2021)に採録されました. Yu Qing, Atsushi Hashimoto, and Yoshitaka Ushiku, “Divergence Optimization for Noisy Universal Domain Adaptation” accepted to CVPR2021. [arXiv] これは第一著者である郁青さん(東大)の弊社におけるインターンの成果です. 教師なしドメイン適応とは? 深層学習の出現以降,機械学習技術を応用したサービスや製品が次々に開発されています.しかし,機械学習技術を利用する場合,開発段階で技術者が収集した正解付きデータと,実際にサービスや製品が利用される運用環境で観測されるデータには異なる偏りが生じることがあります.このような偏りはドメインシフトと呼ばれ,学習済みモデルの推定精度を下げてしまうことが知られています.この機械学習技術を応用する上で避けては通れない問題を解決するために,近年様々な問題設定が提案されていますが,その中でも最も活発に研究が行われているのが教師なしドメイン適応(Unsupervised Domain Adaptation: UDA)です. UDAは事前に技術者がデータを収集した環境(ソースドメイン)の正解付きデータと運用環境(ターゲットドメイン)から収集した正解なしデータを手がかりに,運用環境の正解データなしでドメインシフトを解消することを目指す問題設定です.

ノイズありユニバーサルドメイン適応の研究がCVPR2021に採録されました
ノイズありユニバーサルドメイン適応の研究がCVPR2021に採録されました

弊社でインターンをしていた本多右京さんがNLP2021で若手奨励賞を受賞しました

オムロンサイニックエックスでのインターン成果を元に,奈良先端科学技術大学院大学(NAIST)の松本研,渡辺研で発展させた下記の研究を発表した本多右京さんが言語処理学会第27回年次大会(NLP2021)において若手奨励賞を受賞されました.なお,この研究は自然言語系の国際会議 EACL2021においても発表予定です. 本多右京 , 牛久祥孝, 橋本敦史, 渡辺太郎 , 松本裕治, 画像と単語の不一致を考慮した疑似教師ありキャプション生成, NLP2021 研究の概要 画像キャプション生成は,画像から自然言語で説明文を生成するタスクです.このような生成を行うためには「画像」と「その画像を説明する文」のペアからなる大規模なデータセットが必要となります.しかしながら,そのような大規模データセットが常に準備できるとは限りません.一方で,単に画像のみ,あるいは文のみ,というデータは容易に収集可能です.本研究では,ペアにはなっていない画像と文を用いた場合に画像キャプション生成という課題をどの程度まで解くことができるのかを明らかにするための疑似教師ありキャプション生成という課題に対して,従来以上の精度を達成できる新たな手法を提案しました.また,これを事前学習に用いて,後段で従来手法を適用することで,さらに精度向上を測ることができることも確認しました.

弊社でインターンをしていた本多右京さんがNLP2021で若手奨励賞を受賞しました
弊社でインターンをしていた本多右京さんがNLP2021で若手奨励賞を受賞しました