過去のお知らせ
-
音楽情報処理分野のトップ会議ISMIR2024(採択率36%)にて発表を行いました!
2024/11/10-14に米国サンフランシスコにて開催された音楽情報処理分野のトップ会議International Society for Music Information Retrieval Conference (ISMIR2024) に当研究室から1件の発表を行いました。
Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama, “MMT-BERT: Chord-aware Symbolic Music Generation Based on Multitrack Music Transformer and MusicBERT,” The 25th International Society for Music Information Retrieval Conference, 2024.
https://ismir2024.ismir.net/ -
機械学習に関する日本最大の学際的フォーラムIBIS2024にて、当研究室から1件の発表を行いました。
双曲空間上で定義されるガウス過程潜在変数モデルを用いた階層構造の可視化
渡部航史、前田圭介、小川貴弘、長谷山美紀 -
当研究室の下記の論文が、土木学会論文集 特集号(海岸工学)論文に掲載されました。
李 広, 藤後 廉, 前田 圭介, 酒向 章哲, 山内 功, 早川 哲也, 中前 茂之, 小川 貴弘, 長谷山 美紀, “ブルーカーボンによるCO2吸収量推計へ向けた大規模セマンティックセグメンテーションモデルに基づく藻場領域の自動認識”
https://www.jstage.jst.go.jp/article/jscejj/80/17/80_24-17286/_article/-char/ja/
-
令和6年度電気・情報関係学会北海道支部連合大会にてメディアダイナミクス研究室より11件の発表と特別講演を行いました!
[1] 登石 光士郎, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀, “基盤モデル間の攻撃非転移性に基づく敵対的防御に関する検討”
[2] 早川 楓, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀, “クラス情報を考慮可能なデータ選択を用いた生成画像に基づくモデル汎化に関する検討”
[3] 久保田 健太, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀, “モデルの学習軌跡を用いたパーソナライズド連合学習におけるクライアントの非階層的クラスタリングの精度向上に関する検討”
[4] 中島 佑, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀, “脳活動によって強化された敵対的学習によるCLIPの頑健性向上に関する検討”
[5] 堤 彩花, 李 広, 藤後 廉, 小川 貴弘, 近藤 敏志, 長谷山 美紀, “重み選択に基づく少量データセットでの肺疾患分類に関する検討”
[6] 太齊 蓮, 李 広, 藤後 廉, 唐 明輝, 吉村 高明, 杉森 博行, 平田 健司, 小川 貴弘, 工藤 與亮, 長谷山 美紀, “J-MIDデータベースを用いたドメイン知識を考慮した継続自己教師あり学習に基づく肺疾患の分類に関する検討”
[7] 上杉 健大, 斉藤 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀, “反実仮想画像生成モデルを用いた構成画像検索におけるデータ拡張に関する検討”
[8] 高橋 諒, 斉藤 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀, “個人の感情誘起の類似性を考慮したMultimodal LLMによる画像の感情分類に関する検討”
[9] 朱 金龍, 櫻井 慶悟, 藤後 廉, 小川 貴弘, 長谷山 美紀, “拡散モデルに基づくテキスト制御可能なシンボリック音楽生成に関する検討”
[10] 劉 世麟, 上川 恭平, 前田 圭介, 小川 貴弘, 長谷山 美紀, “音楽生成における自己消費的な学習ループに関する分析”
[11] 内田 結子, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀, “物体検出モデルの信頼度スコアに基づくSingle Image-to-3Dモデルの評価指標に関する検討”
さらに、当研究室の長谷山 美紀教授が”AIを基盤とした異分野融合研究 ~産官学地域連携による取組~”について特別講演を行いました! -
マルチメディア分野のトップ会議ACM MULTIMEDIA 2024にてメディアダイナミクス研究室より2件の発表を行いました!
本会議 Oral発表(top 3.87%)
Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama, “DQG: Database question generation for exact text-based image retrieval,” ACM Multimedia (ACM MM), 2024.
ワークショップ MMSports
Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “What to do and where to go next? Action prediction in soccer using multimodal co-attention transformer,” ACM Multimedia (ACM MM) MMSports, 2024.
また、藤後特任助教がoutstanding reviewerに選定されました!
https://2024.acmmm.org/outstanding-ac-reviewer -
IEEE Consumer Technology Society (CTSoc)のフラグシップ国際会議 2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)にメディアダイナミクス研究室より下記の12件の発表を行いました。また、学部4年生の登石君がExcellent Student Poster Gold Prizeを受賞しました。
[1] Tasuku Nakajima, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Multimodal Adversarial Defense Trained on Features Extracted From Images and Brain Activity”
[2] Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “An Evaluation Metric for Single Image-To-3D Models Based on a Class Confidence Score of Object Detection Models”
[3] Kenta Kubota, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “MLLM-Based Automatic Exploration of Editing Prompt for High Engagement Image Generation”
[4] Kenta Uesugi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Zero-Shot Composed Video Retrieval With Projection Module Bridging Modality Gap”
[5] Koshiro Toishi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Improving Zero-Shot Adversarial Robustness via Integrating Image Features of Foundation Models”
[6] Ren Tasai, Guang Li, Ren Togo, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Kenji Hirata, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama, “Lung Cancer Classification Using Masked Autoencoder Pretrained on J-MID Database”
[7] Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Structured Polyphonic Music Generation With Diffusion Transformer”
[8] Kaede Hayakawa, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Emotion-Conditional Image Generation Reflecting Semantic Alignment With Text-To-Image Models”
[9] Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Generative Dataset Distillation Based on Large Model Pool”
[10] Ayaka Tsutsumi, Guang Li, Ren Togo, Takahiro Ogawa, Satoshi Kondo, Miki Haseyama, “Lung Disease Classification With Limited Training Data Based on Weight Selection Technique”
[11] Ryo Takahashi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Personalized Visual Emotion Classification via In-Context Learning in Multimodal LLM”
[12] Shilin Liu, Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Zero-Shot Controllable Music Generation From Videos Using Facial Expressions” -
IEEE ICIP 2024に当研究室から論文3件の発表を行いました!
UAEアブダビにて開催されている世界最大規模の画像処理系国際会議2024 IEEE International Conference on Image Processing (IEEE ICIP 2024、採択率:48%)に当研究室から以下の3件の論文を発表しました.
①
Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “REINFORCING PRE-TRAINED MODELS USING COUNTERFACTUAL IMAGE”
②
Yaozong Gan, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “CROSS-DOMAIN FEW-SHOT IN-CONTEXT LEARNING FOR ENHANCING TRAFFIC SIGN RECOGNITION”
③
Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama, “ZERO-SHOT COMPOSED IMAGE RETRIEVAL CONSIDERING QUERY-TARGET RELATIONSHIP LEVERAGING MASKED IMAGE-TEXT PAIRS” -
土木情報分野のトップジャーナルComputer-Aided Civil and Infrastructure Engineering(IF=8.5)に論文が採択されました!
本論文では、AIの実社会応用で必要となる「信頼性」と「精度」を同時に向上させるマルチモーダルXAIを提案しています。
本研究は、NEXCO東日本との共同研究による成果です。Keisuke Maeda, Naoki Ogawa, Takahiro Ogawa, Miki Haseyama, “Damage Level Classification Considering Both Correlation between Image and Text Data and Confidence of Attention Map,” Computer-Aided Civil and Infrastructure Engineering, 2024. (Accepted for publication)
https://onlinelibrary.wiley.com/journal/14678667
-
International Workshop on Advanced Image Technology (IWAIT 2025)に採録されました!
2025年1月6-8日に台湾にて開催予定の国際会議 International Workshop on Advanced Image Technology (IWAIT 2025)に,メディアダイナミクス研究室から投稿した以下の5件の論文が採録されました.
[1] Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Enhanced Framework for Generating Counterfactual Images with Sophisticated Caption and Inversion-free Image Editing”[2] Tasuku Nakajima, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Improving Robustness of CLIP by Adversarial Training Enhanced by Brain Activity”
[3] Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Huang-Chia Shih, Satishi Asamizu, Miki Haseyama, “Expert Comment Generation from Sports Videos Using Multimodal LLM”
[4] Huaying Zhang, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Learning Hierarchical Video-Text Relationship via Large Language Model for Cross-modal Video Retrieval”
[5] Kenta Kubota, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Balancing Generalization and Personalization by Sharing Layers in Clustered Federated Learning”
-
ECCV2024 Workshopにて研究成果を発表しました!
2024年9月29日~10月4日にイタリアのミラノで開催中のコンピュータ・ビジョン分野のトップカンファレンス European Conference on Computer Vision (ECCV 2024) にて,生成型データセット蒸留に関する研究成果が The First Dataset Distillation Challenge の Generative Track において第3位を獲得し,表彰されました!
なお,本研究は清華大学,香港科技大学,ミュンヘン工科大学との国際連携研究となります.
また,自己教師あり学習に関する研究成果をワークショップ論文として発表しました.
[1] Duo Su†, Junjie Hou†, Guang Li*, Ren Togo, Rui Song, Takahiro Ogawa, Miki Haseyama, “Generative dataset distillation based on diffusion model,” European Conference on Computer Vision (ECCV) Workshops, Milan, Italy, 2024.
† Equal Contribution * Team Lead
[2] Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama, “RGMIM: Region-guided masked image modeling for learning meaningful representations from X-ray images,” European Conference on Computer Vision (ECCV) Workshops, Milan, Italy, 2024.
https://eccv2024.ecva.net/ -
学部・学科紹介を実施しました!
2024年9月30日(月)に開催された学部・学科紹介にて、当研究室の研究・技術の紹介を行いました。
約120名の学生が来場し、メディアネットワークコースの紹介を聞いていただきました! -
SIGGRAPH ASIA (Technical Communications, Poster) に採択されました!
2024年12月3-6日に東京にて開催予定のコンピュータグラフィックスとインタラクティブ技術に関する国際会議SIGGRAPH ASIAに以下の2件の論文が採択されました.
[Technical Communications]
Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “An Evaluation Metric for Single Image-to-3D Models Based on Object Detection Perspective,” SIGGRAPH Asia Technical Communications, 2024.
[Posters]
Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Generalizing Human Motion Style Transfer Method Based on Metadata-independent Learning,” SIGGRAPH Asia Posters, 2024. -
工事現場における高リスクシーン検出に関する研究が,BUILT-ITmediaにて紹介されました.
https://built.itmedia.co.jp/bt/articles/2409/11/news040.html
本内容は,以下の論文成果によるものです.
大羽賀 駿也, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀: “工事現場の定点カメラを用いた物体検出および姿勢推定に基づくZero-shot高リスク状況検出”, AI・データサイエンス論文集, vol.5, no.1, pp.110-116 (2024)
https://www.jstage.jst.go.jp/article/jsceiii/5/1/5_110/_article/-char/ja -
2024年9月15日(日)に北海道大学 創成研究機構 データ駆動型融合研究創発拠点にて,『画像処理・AIの最先端技術』の内容について,高校生を対象に体験講義を実施しました!
2024年9月15日(日)に北海道大学 創成研究機構 データ駆動型融合研究創発拠点にて,『画像処理・AIの最先端技術』の内容について,高校生を対象に体験講義を実施しました!
-
当研究室の長谷山教授が、9月11日北海道大学で開催された日本神経回路学会全国大会(JNNS2024)にて基調講演を行いました。
当研究室の長谷山教授が、9月11日北海道大学で開催された日本神経回路学会全国大会(JNNS2024)にて基調講演を行いました。
講演タイトル『Energizing the Youth through AI Research and
their Social Implementation ~Examples of Advanced Research and Education at Hokkaido University and Potential of the Semiconductors~』
最先端のAI研究とその実社会応用、若手人材育成、次世代半導体分野とAI研究の関わりについて講演を行いました。 -
ECCV 2024 Workshopに2本の論文が採択されました!
ECCV 2024 Workshopに2本の論文が採択されました!
当研究室から投稿した以下の2本の論文が,コンピュータービジョン分野のトップ会議であるEuropean Conference on Computer Vision (ECCV 2024)のワークショップに採択されました!
ECCV 2024は,2024年9月29日から10月4日にイタリア・ミラノにて開催予定です.
尚、データセット蒸留に関する研究成果は,清華大学(中国),香港科技大学,ミュンヘン工科大学との国際連携研究として実施され、ECCV 2024のThe First Dataset Distillation ChallengeのGenerative Trackにおいて第3位を獲得し,表彰される予定です.
[1] Duo Su†, Junjie Hou†, Guang Li*, Ren Togo, Rui Song, Takahiro Ogawa, Miki Haseyama, “Generative dataset distillation based on diffusion model,” ECCV Workshop, 2024. (The Third Place Winner in Generative Track of the ECCV 2024 DD Challenge)
† Equal Contribution * Team Lead
[2] Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama, “RGMIM: Region-guided masked image modeling for learning meaningful representations from X-ray images,” ECCV Workshop, 2024. (Accepted) -
土木学会 AI・データサイエンス論文集において受賞しました!
土木学会 AI・データサイエンス論文集において受賞しました!
【デジタルツイン・DX奨励賞】
五箇 亮太, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀: “Spatial-temporal attentionを導入した再帰型ニューラルネットワークに基づく重機との接触事故リスクの推定”, AI・データサイエンス論文集, vol.5, no.1, pp.117-125 (2024) -
2024年8月6日~9日に熊本で開催された国内最大規模の画像の認識・理解シンポジウムMIRU2024にて,3件の口頭発表,11件のポスター発表を行いました!
2024年8月6日~9日に熊本で開催された国内最大規模の画像の認識・理解シンポジウムMIRU2024にて,3件の口頭発表,11件のポスター発表を行いました!
また,様々な分野で活躍されている研究室OBとの交流会も行いました.
【口頭発表】- He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Reliable and Personalized Federated Learning with Prompt-based Method for Visual Question Answering in Medical Domain”
- Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Integrating Query-target Relationship to Zero-shot Composed Image Retrieval from Masked Image-text Pairs”
- Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Refining Generative Class Incremental Learning Performance through Model Forgetting Strategies”
【ポスター発表】
- Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Generative Dataset Distillation Considering Global-local Coherence”
- Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Noisy Label Learning-based Self-consuming Iterative Re-training”
- Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Strategic Classification Model Reinforcement: Introducing Language-guided Counterfactual Images to Identify and Address Classification Weaknesses”
- Ren Togo, Nao Nakagawa, Takahiro Ogawa, Miki Haseyama, “Exponential Dissimilarity-Dispersion Family for VAE-based Domain-Specific Representation Learning”
- Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Machine Unlearning Framework based on Aggregation of Gaussian Process-based Submodels”
- Yaozong Gan, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Fine-grained Traffic Sign Recognition Via Cross-domain Few-shot In-context Learning”
- Ziwen Lan, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Adversarial Attack Focused on Manipulating Semantic Information for Personalized Text-to-Image Diffusion Models”
- Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Metadata-independent Learning and Unified Dataset for Generalized Motion Generation Method”
- 岡村洋希, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀 (北大), “協調フィルタリングにおける潜在因子モデルの埋め込み表現のICAを用いた線形的構造の分析”
- 佐藤雅也, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀 (北大), “Identify-and-generate: VQAにおける大規模マルチモーダルモデルの獲得知識と視覚情報の統合強化”
- 七田亮, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀 (北大), “深層距離学習に基づく画像記憶性スコアの制御機構を導入したテキストからの画像生成に関する検討”
-
マルチメディア分野のトップ会議ACM MULTIMEDIA 2024にて開催されるスポーツAIに関するワークショップMMSports(採択率50%)に採択されました!
マルチメディア分野のトップ会議ACM MULTIMEDIA 2024にて開催されるスポーツAIに関するワークショップMMSports(採択率50%)に採択されました!
The 32nd ACM Multimedia Conference (ACM MM) 2024 MMSportsに当研究室から投稿していた以下の論文が採択されました!2024/10/28-11/01にオーストラリア・メルボルンにて開催予定です.
Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “What to do and where to go next? Action prediction in soccer using multimodal co-attention transformer,” ACM Multimedia (ACM MM) MMSports, 2024.
また本会議に採択された以下の論文はOral発表となりました。
Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama, “DQG: Database question generation for exact text-based image retrieval,” ACM Multimedia (ACM MM), 2024. -
コンシューマーエレクトロニクスに関する国際会議 2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)にメディアダイナミクス研究室より投稿した以下の12件の論文が採録されました!
コンシューマーエレクトロニクスに関する国際会議 2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)にメディアダイナミクス研究室より投稿した以下の12件の論文が採録されました!
[1] Tasuku Nakajima, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Multimodal Adversarial Defense Trained on Features Extracted From Images and Brain Activity”
[2] Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “An Evaluation Metric for Single Image-To-3D Models Based on a Class Confidence Score of Object Detection Models”
[3] Kenta Kubota, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “MLLM-Based Automatic Exploration of Editing Prompt for High Engagement Image Generation”
[4] Kenta Uesugi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Zero-Shot Composed Video Retrieval With Projection Module Bridging Modality Gap”
[5] Koshiro Toishi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Improving Zero-Shot Adversarial Robustness via Integrating Image Features of Foundation Models”
[6] Ren Tasai, Guang Li, Ren Togo, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Kenji Hirata, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama, “Lung Cancer Classification Using Masked Autoencoder Pretrained on J-MID Database”
[7] Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Structured Polyphonic Music Generation With Diffusion Transformer”
[8] Kaede Hayakawa, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama, “Emotion-Conditional Image Generation Reflecting Semantic Alignment With Text-To-Image Models”
[9] Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Generative Dataset Distillation Based on Large Model Pool”
[10] Ayaka Tsutsumi, Guang Li, Ren Togo, Takahiro Ogawa, Satoshi Kondo, Miki Haseyama, “Lung Disease Classification With Limited Training Data Based on Weight Selection Technique”
[11] Ryo Takahashi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Personalized Visual Emotion Classification via In-Context Learning in Multimodal LLM”
[12] Shilin Liu, Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, “Zero-Shot Controllable Music Generation From Videos Using Facial Expressions”