過去のお知らせ
-
2026年6月3日~6月7日にアメリカ・デンバーにて開催されたコンピュータ・ビジョン分野のトップカンファレンス The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026 (CVPR 2026) のMain Paper Trackにて、当研究室から以下の1件の発表を行いました!
Zhu He, Ren Togo, Takahiro Ogawa, Kenji Hirata, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Noriko Nishioka, Yukie Shimizu, Kohsuke Kudo, Miki Haseyama, “Personalized Longitudinal Medical Report Generation via Temporally-Aware Federated Adaptation,” IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026 (CVPR 2026). (Acceptance Rate: 25.4%)
https://openaccess.thecvf.com/…/Zhu_Personalized…
なお、本研究は北海道大学病院、北海道大学大学院医学研究院および北海道大学大学院保健科学研究院との共同研究の成果です.
北海道大学プレスリリースはこちらから
https://www.hokudai.ac.jp/news/pdf/260601_pr3.pdf




-
生成型データセット蒸留に関する以下の論文(主著:M2 李 銘卓)が国際論文誌 IEEE Open Journal of Signal Processing (IF=2.7) に採択されました!
本研究では,生成型データセット蒸留において重要となるサンプリング過程に着目し,データの意味的情報を考慮した Semantic-aware Sampling(SAS) を提案しています!
Mingzhuo Li, Guang Li, Linfeng Ye, Jiafeng Mao, Takahiro Ogawa, Konstantinos N. Plataniotis, Miki Haseyama, “SAS: Semantic-aware sampling for generative dataset distillation,” IEEE Open Journal of Signal Processing, 2026.
本研究は,トロント大学および東京大学との共同研究であり,ICIP 2026にても発表予定です.
-
8月3日〜6日に出島メッセ長崎にて開催される第29回画像の認識・理解シンポジウムにて、当研究室から投稿した以下の5本の論文が口頭発表(Oral Presentation Track)として選定されました!
[1] 山森 諄也, 藤後 廉, 山城 輝久, 小川 貴弘, 長谷山 美紀, “大規模マルチモーダルモデルの潜在表現を用いた解釈可能なインテリアスタイル意味空間の構築” (IEEE ICIP 2026 採択済)
[2] Tomoya Mitsui, Ren Togo, Naoki Saito, Takahiro Ogawa, Miki Haseyama, “Attention- and Interference-Guided Adaptive VLM-LLM Merging for Improved Perception-Reasoning Trade-offs”
[3] 佐藤 雅也, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀, “出力分布に基づくMLLM推論:Visual Question AnsweringのためのMLLMにおける視覚情報と内部知識の統合改善”
[4] Kaixin Deng, Guang Li, Takahiro Ogawa, Miki Haseyama, “Frequency-Aware Idempotent Projection for Robust Image Hiding”
[5] Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Spatially Consistent Soundscape Generation from 3D Gaussian Splatting Scenes”
※[1] の論文は、北海道大学総合イノベーション創発機構データ駆動型融合研究創発拠点(D-RED)に設置されている寄附講座「ニトリみらい社会デザイン講座」で実施された研究成果となります。
-
サッカー動画における Composed Video Retrievalに関する以下の論文(主著:M2 吉田)が国際論文誌Applied Sciences(IF=2.5)に採択されました!
視覚・テキスト類似度を組み合わせたtriplet 自動構築と、MLLM による妥当性評価を用いて、サッカー動画向けの大規模 CoVR データセット構築手法を提案しています!
Riku Yoshida et al., “Automated Triplet Construction for Composed Video Retrieval in Soccer with Multimodal Similarity and MLLM-based Screening.”
-
手術動画理解 × Vision-Language Learning に関する以下の論文(主著:M2 池井戸)が国際論文誌Bioengineering(IF=3.7)に採択されました!
本論文は北海道大学大学院医学研究院・保健科学研究院との共同研究成果で、「ひと・AI/DX・しくみの三位一体的整備による次世代AI活用・データ駆動・情報循環型医学研究の戦略的推進」事業(愛称:PRISM-HU)の成果となります。
Taiyo Ikeido et al., “Surgical Video Understanding with Alignment-Preserving Temporal Adaptation and Action Triplet Text Alignment.”
PRISM-HUについて:https://prism-hu.med.hokudai.ac.jp/
-
機械学習分野のトップ国際会議 ICML 2026 において、当研究室の 李 広 助教 が Gold Reviewer Award に選ばれました!
-
回路・システム・コンピュータ・通信技術に関する国際会議International Technical Conference on Circuits/Systems, Computers, and Communications (ITC-CSCC 2026)に以下の2本の論文が採択されました!
[1] Riku Yoshida, Ryota Goka, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Multimodal LLM-based Noise Filtering in Composed Video Retrieval Dataset”
[2] Shuailin Du, Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Enhanced Medical Dataset Distillation via Two-Stage Classifier-Guided Diffusion”
https://itc-cscc2026.ecti-thailand.org

-
9月13日から17日にフィンランド・タンペレで開催される世界最大規模の画像処理に関する国際会議 IEEE International Conference on Image Processing (ICIP2026) に当研究室より4本の論文が採択されました!
[1] Ren Togo, Ryo Shichida, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Zero-Shot Memorability Control in Diffusion Models”
[2] Junya Yamamori, Ren Togo, Teruhisa Yamashiro, Takahiro Ogawa, Miki Haseyama, “Learning Interpretable Interior Style Semantics via Large Multimodal Model Representations”
[3] Ryusei Mikami, Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Out-of-Distribution Detection via Uncertainty Distinction with Dirichlet Gaussian Process”
[4] Kotone Mutsuna, Ryota Goka, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Action Difference Identification via Multi-view Reliability Ranking”
[2]の研究は株式会社ニトリホールディングスとの共同研究成果です.

-
スペイン・バルセロナで開催された信号処理分野のトップカンファレンス ICASSP2026 にて当研究室から以下の4件の発表を行いました!
[1] Minghao Yang et al., “Adaptive Shared Experts with Lora-Based Mixture of Experts for Multi-Task Learning”
Paper: https://ieeexplore.ieee.org/document/11462286
[2] Yuki Katayama et al., “H3GM: History-Guided Global Geometric Metric for Single Image to 3D Scene Generation”
Paper: https://ieeexplore.ieee.org/document/11461973
[3] Taiyo Ikeido et al., “Cross-Modal Similar Video Retrieval in Laparoscopic Cholecystectomy Videos Considering Temporal and Hierarchical Information”
Paper: https://ieeexplore.ieee.org/document/11461482
[4] Taiyo Sato et al., “DIAL: Database-Informed Interactive Multi-Agent System Loop for Personalized Image Generation”
Paper: https://ieeexplore.ieee.org/document/11463391




-
Think IT様よりご取材いただいた、当研究室の小川教授のインタビュー記事が公開されました!
-
基盤モデルに対する敵対的防御に関する以下の論文(主著:M2 登石)が国際論文誌Applied Sciences(IF=2.5)に採択されました!
Koshiro Toishi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Leveraging Attack Non-Transferability to Boost Adversarial Robustness for Foundation Models.”

-
マルチメディア検索分野のトップカンファレンスACM International Conference on Multimedia Retrieval (ICMR2026)のShort Paper Trackに当研究室から投稿していた以下の構成画像検索に関する論文(主著:D3 張)が採択されました!
Huaying Zhang, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Reranking-based Analysis on Visual and Textual Query Contribution to Composed Image Retrieval.”

-
コンシューマエレクトロニクス分野の国際会議 IEEE ICCE-TWに当研究室から投稿していた以下の3件の論文(主著:M2 登石,M2 吉田,M2 小玉)が採択されました!
[1]の論文は東京大学との共同研究成果です.
[1] Koshiro Toishi, Keisuke Maeda, Soichiro Kumano, Ren Togo, Toshihiko Yamasaki, Takahiro Ogawa, and Miki Haseyama, “Analysis of Model Merging for Integrating Adversarial Robustness across Diverse Datasets in CLIP models.”
[2] Riku Yoshida, Ryota Goka, Keisuke Maeda, Takahiro Ogawa, and Miki Haseyama, “Reliable Triplet Construction for Soccer Composed Video Retrieval Using Multimodal LLM Evaluation.”
[3] Hideo Kodama, Masaki Yoshida, Ren Togo, Takahiro Ogawa, and Miki Haseyama, “Understanding the Layer-wise Role of Text-Stream Modulation in Diffusion Transformers.”

-
当研究室の研究成果が、国際学術誌 IEEE Access (Impact Factor: 3.6) に採録されました。
本研究では、ブラックボックス型のマルチモーダル大規模言語モデルを活用し、個人ごとの感情の違いを反映した画像感情認識を実現する新しいプロンプト最適化手法を提案しています。
Ryo Takahashi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, and Miki Haseyama, “Discrete Prompt Tuning via Recursive Utilization of Black-box Multimodal Large Language Model for Personalized Visual Emotion Recognition,” IEEE Access

-
情報検索・推薦システム分野のトップカンファレンスSIGIRに論文が採択されました!
2026年7月20日~24日にオーストラリア・メルボルンにて開催される情報検索・推薦システム分野のトップカンファレンスInternational ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR2026) のShort Paper Trackに、当研究室から投稿していた逐次推薦に関する論文が採択されました (採択率:27%)。
Keito Kozaki, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Revisiting the Role of Learned Attention Weighting in SASRec,” International ACM SIGIR Conference on Research and Development in Information Retrieval. (Accepted)

-
本日4月1日付で、データ駆動型融合研究創発拠点(D-RED)にいらした櫻井慶悟先生がメディア創生学研究室の助教に着任されました!
さらに、総合IR本部にいらした斉藤直輝先生および数理データサイエンス教育研究センター特任助教の李広先生が、それぞれ数理データサイエンス教育研究センター助教に着任されました!
誠におめでとうございます!


-
3月25日に北海道大学の学位授与式が開催され、当研究室の博士学生3名、修士学生11名および学部学生6名の計20人にそれぞれ学位が授与されました。
博士学生3名、修士学生9名は研究室を巣立ち、2名の修士学生は博士課程に進学します。また、学部学生全員が修士課程に進学します。
また、卒業生・修了生に以下の賞が授与されました。
●北海道大学 工学部長賞
学部4年生 神崎 恵土
●北海道大学大学院情報科学院 学院長賞
修士2年生 佐藤 雅也
●電子情報通信学会北海道支部学生奨励賞
修士2年生 久保田 健太
修士2年生 佐藤 雅也
修士2年生 太齊 蓮
修士2年生 中島 佑
皆さん、誠におめでとうございます!

-
3月21日から22日にて東京都・成蹊大学で開催された第36回人工知能学会金融情報学研究会(SIG-FIN)にて当研究室から1件の発表を行いました!
櫻井慶悟, 小川貴弘, 長谷山美紀, 阿南晏樹, 中川慧 “効用を考慮したリランキングに基づく株式推薦,” 第36回 人工知能学会 金融情報学研究会 (SIG-FIN), pp. 235-241, 2026.
本研究は野村アセットマネジメント株式会社および大阪公立大学との共同研究成果です.
https://www.jstage.jst.go.jp/…/2026_235/_article/-char/ja

-
3月28日から30日まで山口大学 吉田キャンパスで開催されているコンシューマエレクトロニクス関連の国際会議 IEEE International Conference on Consumer Technology – Pacific 2026 (ICCT-Pacific 2026)にて、2件の発表を行い、D1の清野君の発表がBest Poster Awardを受賞しました!
[1] T. Seino, N. Saito, T. Ogawa, S. Asamizu, M. Haseyama, “Unified Scene Graph Forecasting Considering Node Birth and Disappearance”
[2] R. Takahashi, N. Saito, K. Maeda, T. Yoshioka, T. Konno, T. Ogawa, M. Haseyama, “LLM-in-the-Loop Descriptor Prompt Refinement for Dialogue-Based Big Five Personality Recognition”
[2]の発表は、富士通株式会社との共同研究成果です。




-
医療Vision-Languageモデルにおける個別化連合学習(pFL)に関する以下の研究成果が、医療情報学の主要学術誌であるJournal of Biomedical Informatics (Impact Factor:4.5) に採録されました!
本研究では、医療データの不均一性や膨大な計算コストの課題に対し、パラメータ効率の高い微調整による共有・個別知識の分離と、Dempster-Shafer理論を用いた動的な不確実性校正(DLUC)を導入した新フレームワーク「DSD-pFL」を提案しました 。
He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Personalized Federated Learning for Medical Vision-Language Models via Efficient Fine-Tuning and Uncertainty-Aware Disentanglement” in Journal of Biomedical Informatics. (Accepted for publication) .
https://www.sciencedirect.com/journal/journal-of-biomedical-informatics

