ACHIEVEMENTS 研究業績

著書、論文、講演発表一覧

著書

表示する研究業績がありません。

論文(学会誌)

Damage-level classification considering both correlation between image and text data and confidence of attention map

Keisuke Maeda, Naoki Ogawa, Takahiro Ogawa, Miki Haseyama

Computer-Aided Civil and Infrastructure Engineering

点検記録作成支援のための生成 AI を用いた所見の自動生成 -データプール抽出を用いた類似画像検索に基づく in-context learning の導入-

Masaya Sato, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

AI・データサイエンス論文集

ブルーカーボンによるCO2吸収量推計へ向けた大規模セマンティックセグメンテーションモデルに基づく藻場領域の自動認識

李 広, 藤後 廉, 前田 圭介, 酒向 章哲, 山内 功, 早川 哲也, 中前 茂之, 小川 貴弘, 長谷山 美紀

土木学会論文集

ConcVAE: conceptual representation learning

Ren Togo, Nao Nakagawa, Takahiro Ogawa, Miki Haseyama

IEEE Transactions on Neural Networks and Learning Systems

Multimodal shot prediction based on spatial-temporal interaction between players in soccer videos

Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Applied Sciences

Snow- or ice-covered road detection in winter road surface conditions using deep neural networks

Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Computer-Aided Civil and Infrastructure Engineering

Multimodal transformer model using time-series data to classify winter road surface conditions

Yuya Moroto, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

Sensors

Trial analysis of brain activity information for the presymptomatic disease detection of rheumatoid arthritis

Keisuke Maeda, Takahiro Ogawa, Tasuku Kayama, Takuya Sasaki, Kazuki Tainaka, Masaaki Murakami, Miki Haseyama

Bioengineering

Generalizing deep learning-based distress segmentation models for subway tunnel images by test-time training

Zongyao Li, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

Intelligence, Informatics and Infrastructure

工事現場の定点カメラを用いた物体検出および姿勢推定に基づくZero-shot高リスク状況検出

大羽賀 駿也, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

AI・データサイエンス論文集

大規模言語モデルを用いた通報音声からの事象発生地点予測

吉田 将規, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

AI・データサイエンス論文集

Spatial-temporal attentionを導入した再帰型ニューラルネットワークに基づく重機との接触事故リスクの推定

五箇 亮太, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

AI・データサイエンス論文集

地下鉄トンネル点検における技術者のモーションデータを用いた熟練度分類 – 説明可能なGraph Convolutional Networkの導入 –

清野竜生, 斉藤直輝, 前田圭介, 小川貴弘, 長谷山美紀

AI・データサイエンス論文集

Algal bed region segmentation based on a ViT adapter using aerial images for estimating CO2 absorption capacity

Guang Li, Ren Togo, Keisuke Maeda, Akinori Sako, Isao Yamauchi, Tetsuya Hayakawa, Shigeyuki Nakamae, Takahiro Ogawa, Miki Haseyama

Remote Sensing

A novel frame-selection metric for video inpainting to enhance urban feature extraction

Yuhu Feng, Jiahuan Zhang, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

Expert–novice level classification using graph convolutional network introducing confidence-aware node-level attention mechanism

Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama

Sensors

Analysis of continual learning techniques for image generative models with learned class information management

Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

Automatic findings generation for distress images using in-context few-shot learning of visual language model based on image similarity and text diversity

Yuto Watanabe, Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Journal of Robotics and Mechatronics

論文(国際会議)

Generalizing human motion style transfer method based on metadata-independent learning

Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

SIGGRAPH Asia 2024 Posters

An evaluation metric for single image-to-3D models based on object detection perspective

Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

SIGGRAPH Asia 2024 Technical Communications

MMT-BERT: Chord-aware symbolic music generation based on multitrack music transformer and MusicBERT

Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama

The 25th International Society for Music Information Retrieval Conference (ISMIR2024)

Personalized visual emotion classification via in-context learning in multimodal LLM

Ryo Takahashi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Generative dataset distillation based on large model pool

Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Multimodal adversarial defense trained on features extracted from images and brain activity

Tasuku Nakajima, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Improving zero-shot adversarial robustness via integrating image features of foundation models

Koshiro Toishi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Lung disease classification with limited training data based on weight selection technique

Ayaka Tsutsumi, Guang Li, Ren Togo, Takahiro Ogawa, Satoshi Kondo, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Zero-shot controllable music generation from videos using facial expressions

Shilin Liu, Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Zero-shot composed video retrieval with projection module bridging modality gap

Kenta Uesugi, Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Zero-shot composed image retrieval considering query-target relationship leveraging masked image-text pairs

Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Image Processing (ICIP 2024)

Lung cancer classification using masked autoencoder pretrained on J-MID database

Ren Tasai, Guang Li, Ren Togo, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Kenji Hirata, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

An evaluation metric for single image-to-3D models based on a class confidence score of object detection models

Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

MLLM-based automatic exploration of editing prompt for high engagement image generation

Kenta Kubota, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Emotion-conditional image generation reflecting semantic alignment with text-to-image models

Kaede Hayakawa, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

What to do and where to go next? action prediction in soccer using multimodal co-attention transformer

Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

7th ACM International Workshop on Multimedia Content Analysis in Sports (MMSports ’24)

Structured polyphonic music generation with diffusion transformer

Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE 13th Global Conference on Consumer Electronics (GCCE 2024)

Reinforcing pre-trained models using counterfactual images

Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Image Processing(ICIP 2024)

RGMIM: region-guided masked image modeling for learning meaningful representations from X-ray images

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

The 18th European Conference on Computer Vision (ECCV 2024) Workshops

Motion-STUDiO : Motion style transfer utilized for dancing operation by considering both style and dance features

Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2024)

Introducing class replacement technique in class incremental learning in generative models

Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2024)

Discriminator-enhanced music generation based on multitrack music transformer

Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2024)

Graph convolutional network-based sports skill-level recognition via deep metric learning

Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama

2024 International Conference on Circuits, Systems, Computers and Communications (ITC-CSCC 2024)

Zero-shot high-risk situation detection based on semantic segmentation and pose estimation using fixed-point cameras at construction sites

Taro Togo, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 International Conference on Circuits, Systems, Computers and Communications (ITC-CSCC 2024)

Generative dataset distillation: balancing global structure and local details

Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2024) Workshops

Prompt-based personalized federated learning for medical visual question answering

He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

Privacy preserving gaze estimation via federated learning adapted to egocentric video

Yuhu Feng, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

Confidence-aware spatial-temporal attention graph convolutional network for skeleton-based expert-novice level classification

Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

Enhancing noisy label learning via unsupervised contrastive loss with label correction based on prior knowledge

Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

Caption unification for multi-view lifelogging images based on in-context learning with heterogeneous semantic contents

Masaya Sato, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

Multi-object editing in personalized text-to-image diffusion model via segmentation guidance

Haruka Matsuda, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)

論文(技術報告)

1人称視点映像の行動認識におけるモダリティ欠損下でのクラス増分学習に関する検討

山本 一輝, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

第39回 信号処理シンポジウム

自己教師あり学習を導入したプロンプト学習に基づく医用画像を対象としたドメイン汎化に関する検討

國枝 翼, 藤後 廉, 小川 貴弘, 前田 圭介, 長谷山 美紀

第39回 信号処理シンポジウム

Exponential dissimilarity-dispersion family for VAE-based domain-specific representation learning

Ren Togo, Nao Nakagawa, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Machine unlearning framework based on aggregation of Gaussian process-based submodels

Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Fine-grained traffic sign recognition via cross-domain few-shot in-context learning

Yaozong Gan, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Adversarial attack focused on manipulating semantic information for personalized text-to-Image diffusion models

Ziwen Lan, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Reliable and personalized federated learning with prompt-based method for visual question answering in medical domain

He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Integrating query-target relationship to zero-shot composed image retrieval from masked image-text pairs

Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Metadata-independent learning and unified dataset for generalized motion generation method

Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

協調フィルタリングにおける潜在因子モデルの埋め込み表現 の ICA を用いた線形的構造の分析

岡村 洋希, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

第27回 画像の認識・理解シンポジウム (MIRU2024)

深層距離学習に基づく画像記憶性スコアの制御機構を導入したテキストからの画像生成に関する検討

七田 亮, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

第27回 画像の認識・理解シンポジウム (MIRU2024)

Refining generative class incremental learning performance through model forgetting strategies

Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Strategic classification model reinforcement: Introducing language-guided counterfactual images to identify and address classification weaknesses

Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回画像の認識・理解シンポジウム(MIRU2024)

Noisy label learning-based self-consuming iterative re-training

Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

Identify-and-generate: VQAにおける大規模マルチモーダルモデルの獲得知識と視覚情報の統合強化

佐藤 雅也, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

第27回 画像の認識・理解シンポジウム (MIRU2024)

Generative dataset distillation considering global-local coherence

Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第27回 画像の認識・理解シンポジウム (MIRU2024)

講演発表(学会)

脳活動によって強化された敵対的学習によるCLIPの頑健性向上に関する検討

中島 佑, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

基盤モデル間の攻撃非転移性に基づく敵対的防御に関する検討

登石 光士郎, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

重み選択に基づく少量データセットでの肺疾患分類に関する検討

堤 彩花, 李 広, 藤後 廉, 小川 貴弘, 近藤 敏志, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

音楽生成における自己消費的な学習ループに関する分析

劉 世麟, 上川 恭平, 前田 圭介, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

反実仮想画像生成モデルを用いた構成画像検索におけるデータ拡張に関する検討

上杉 健大, 斉藤 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

物体検出モデルの信頼度スコアに基づくSingle Image-to-3Dモデルの評価指標に関する検討

内田 結子, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

モデルの学習軌跡を用いたパーソナライズド連合学習におけるクライアントの非階層的クラスタリングの精度向上に関する検討

久保田 健太, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

クラス情報を考慮可能なデータ選択を用いた生成画像に基づくモデル汎化に関する検討

早川 楓, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

令和6年度 電気・情報関係学会北海道支部連合大会

個人の感情誘起の類似性を考慮したMultimodal LLMによる画像の感情分類に関する検討

高橋 諒, 斉藤 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀

令和6年度電気・情報関係学会北海道支部連合大会

J-MIDデータベースを用いたドメイン知識を考慮した継続自己教師あり学習に基づく肺疾患の分類に関する検討

太齊 蓮, 李 広, 藤後 廉, 唐 明輝, 吉村 高明, 杉森 博行, 平田 健司, 小川 貴弘, 工藤 與亮, 長谷山 美紀

令和6年度電気・情報関係学会北海道支部連合大会

拡散モデルに基づくテキスト制御可能なシンボリック音楽生成に関する検討

朱 金龍, 櫻井 慶悟, 藤後 廉, 小川 貴弘, 長谷山 美紀

令和6年度電気・情報関係学会北海道支部連合大会

半導体製造装置のセンサデータを用いた深層距離学習による類似事例検索に関する検討

斉藤 直輝, 藤後 廉, 前田 圭介, 小林 累輝, 中村 隆央, 岡谷 基弘, 数井 誠人, 松沢 貴仁, 小川 貴弘, 長谷山 美紀

第38回 人工知能学会全国大会 (JSAI2024)

ゴム材料の物性値に影響する工程 · 環境要因の推定に関する検討

柳 凜太郎, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

第38回 人工知能学会全国大会 (JSAI2024)

Graph masked autoencoderを用いた知識グラフ推論に基づく説明可能性のある推薦に関する検討

櫻井 慶悟, 藤後 廉, 小川 貴弘, 長谷山 美紀

第38回 人工知能学会全国大会 (JSAI2024)

工事現場映像における深度情報を活用した重機接触事故リスクの推定

五箇 亮太, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

第38回 人工知能学会全国大会 (JSAI2024)

モーションおよび視線データを用いたSpatial Temporal Attention GCNによる熟練度分類に関する検討

清野竜生, 斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀

第38回 人工知能学会全国大会 (JSAI2024)