ACHIEVEMENTS 研究業績

著書、論文、講演発表一覧

著書

表示する研究業績がありません。

論文(学会誌)

Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts

Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama

International Journal of Multimedia Information Retrieval

Individual persistence adaptation for user-centric evaluation of user satisfaction in recommender systems

Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE Access

Text-guided image editing based on post score for gaining attention on social media

Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

Importance-aware adaptive dataset distillation

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

Neural Networks

Zero-shot visual sentiment prediction via cross-domain knowledge distillation

Yuya Moroto, Yingrui Ye, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

IEEE Open Journal of Signal Processing

Source-data-free cross-domain knowledge transfer for semantic segmentation

Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

IEEE Open Journal of Signal Processing

TolerantGAN: text-guided image manipulation tolerant to real-world image

Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE Open Journal of Signal Processing

Flexibly manipulating popularity bias for tackling trade-offs in recommendation

Hiroki Okamura, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

Information Processing & Management

Zero-shot traffic sign recognition based on midlevel feature matching

Yaozong Gan, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

Manipulation direction: evaluating text-guided image manipulation based on similarity between changes in image and text modalities

Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
Sensors

社会インフラ維持管理効率化に向けた最先端AI研究

前田 圭介, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

時系列データを用いたMulti-modal Transformerに基づく冬期路面状態の分類

諸戸 祐哉, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

社会インフラ点検時の変状画像を対象とした変状種と劣化レベルのマルチタスク分類

小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

セマンティックセグメンテーションに基づく道路走行中の車載映像を用いた枯損木の検出

小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

地下鉄トンネル点検技術者の新規変状の発見率向上に向けた一人称視点映像からの変状検出

櫻井 慶悟, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

Attention-based multiple instance learningに基づく背景の多様性に頑健な道路附属物の異状判定

渡部 航史, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

Visual language modelを用いた変状画像に対する所見の自動生成-類似画像検索によるFew-shot learningの導入-

渡邉 優宇人, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

変状の劣化レベル判定支援に向けたグラフニューラルネットワークによるレコードデータの特徴表現の獲得

山本 一輝, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
AI・データサイエンス論文集

Visual emotion recognition through multimodal cyclic-label dequantized gaussian process latent variable model

Naoki Saito, Keisuke Maeda, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama

Journal of Robotics and Mechatronics

Dataset distillation using parameter pruning

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

Material compound-property retrieval using electron microscope images for rubber material development

Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama

IEEE Access

A Gaussian process decoder with spectral mixtures and a locally estimated manifold for data visualization

Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Applied Sciences

Developing technologies for the practical application of deep learning-based distress segmentation in subway tunnel images

李 宗曜, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

AI・データサイエンス論文集

データ横断型対照学習を用いた道路構造物における変状画像の劣化レベル分類

東 孝明, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀

AI・データサイエンス論文集

Multi-label classification in anime illustration based on hierarchical relationships of attributes

Ziwen Lan, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

SpectralMAP: approximating data manifold with spectral decomposition

Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE Access

Gaze-dependent image re-ranking technique for enhancing content-based image retrieval

Yuhu Feng, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Applied Sciences

Multimodal natural language explanation generation for visual question answering based on multiple reference data

He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama

Electronics

Off-screen sound separation based on audio-visual pre-training using binaural audio

Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama

Sensors

Prediction of shooting events in soccer videos using complete bipartite graphs and players’ spatial-temporal relations

Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

Sensors

Text-guided image manipulation via generative adversarial network with referring image segmentation-based guidance

Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE Access

画像の感情推定のためのラベル逆量子化を導入した正準相関分析

斉藤 直輝, 前田 圭介, 小川 貴弘, 浅水 仁, 長谷山 美紀

電子情報通信学会論文誌 D

Hierarchical multi-label attribute classification with graph convolutional networks on anime illustration

Ziwen Lan, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

IEEE Access

Self-supervised learning for gastritis detection with gastric X-ray images

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

International Journal of Computer Assisted Radiology and Surgery

Boosting automatic COVID-19 detection performance with self-supervised learning and batch knowledge ensembling

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

Computers in Biology and Medicine

論文(国際会議)

Real-world application of multimedia artificial intelligence and development of its sustainable improvement technology

Takahiro Ogawa
International Workshop on the New Frontiers in Convergence Science and Technology: The 26th HU-SNU Joint Symposium Satellite Session

Visually guided binaural audio generation considering camera rotation

Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama
International Workshop on the New Frontiers in Convergence Science and Technology: The 26th HU-SNU Joint Symposium Satellite Session

Estimating graph topology with smooth latent signals via Gaussian process

Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
International Workshop on the New Frontiers in Convergence Science and Technology: The 26th HU-SNU Joint Symposium Satellite Session

Personalized content recommender system via non-verbal interaction using face mesh and facial expression

Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
ACM International Conference on Multimedia 2023 (ACM MM 2023)

Bundle detection based on graph convolutional network considering categorical hierarchical relationship

Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

A controllable recoloring method for novel views using segment anything model

Haoyang Wang, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Skill level classification using motion data via spatial temporal graph convolutional network

Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Novel feature extraction for classification of auditory-visual stimuli from fNIRS signals

Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Improving visual counterfactual explanation models for image classification via CLIP

Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Deterioration level estimation for infrastructures considering noisy labels via dividemix

Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Caption unification for multiple viewpoint lifelogging images and its verification

Masaya Sato, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Text-to-image diffusion model suppressing catastrophic forgetting via elastic weight consolidation

Haruka Matsuda, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE 12th Global Conference on Consumer Electronics (GCCE 2023)

Multi-view variational recurrent neural network for human emotion recognition using multi-modal biological signals

Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE International Conference on Image Processing (ICIP 2023)

Feature integration via back-projection ordering multi-modal Gaussian process latent variable model for rating prediction

Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE International Conference on Image Processing (ICIP 2023)

Interpretable visual question answering referring to outside knowledge

He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama
2023 IEEE International Conference on Image Processing (ICIP 2023)

Video-music retrieval with fine-grained cross-modal alignment

Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
2023 IEEE International Conference on Image Processing (ICIP 2023)

Shoot event prediction in soccer considering expected goals based on players’ positions

Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Prediction of shoot events by considering spatio-temporal relations of multimodal features

Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Binaural audio generation with data augmentation from 360° videos

Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

A medical domain visual question generation model via large language model

He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Parameter-efficient tuning of a pre-trained model via prompt learning in cross-modal retrieval

Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Estimation of amyloid-β positivity using QSM images considering age information

Tsubasa Kunieda, Ren Togo, Noriko Nishioka, Yukie Shimizu, Shiro Watanabe, Kenji Hirata, Keisuke Maeda, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Proficiency-level estimation using heterogeneous features via label dequantized CCA

Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama

2023 IEEE International Conference on Consumer Electronics-Taiwan (ICCE-TW 2023)

Defense against black-box adversarial attacks via heterogeneous fusion features

Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

Binauralization robust to camera rotation using 360° videos

Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

Learning graph Laplacian from intrinsic patterns via Gaussian process

Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

Improving dropout in graph convolutional networks for recommendation via contrastive loss

Hiroki Okamura, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

Estimation of visual contents from human brain signals via VQA based on brain-specific attention

Ryo Shichida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

Gromov-wasserstein autoencoders

Nao Nakagawa, Ren Togo, Takahiro Ogawa, Miki Haseyama

The Eleventh International Conference on Learning Representations (ICLR 2023)

論文(技術報告)

[特別講演] 次世代インフラ維持管理に向けた研究と北海道開発局との連携協定における取組み

前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

物体の属性と関係性を考慮したマルチモーダル大規模言語モデルの高精度化に関する検討

大羽賀 駿也, 藤後 廉, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

[特別講演] 音声認識・生成AIを用いた通報音声からの事象発生地点予測

吉田 将規, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

[特別講演] 道路附属物のドローン映像を用いたvision transformerに基づく変状検出技術

渡部 航史, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

[特別講演] 橋梁点検効率化のための生成AIを用いた所見生成技術

渡邉 優宇人, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

アメリカンフットボールにおける選手位置情報を利用したパス可能領域の推定に関する一検討

河合 雅斗, 柳 凜太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

Neural radiance fields におけるreduced reference 画質評価に関する一検討

河合 雅斗, 柳 凜太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

双方向Transformerに基づいたサッカー選手のイベントデータからの行動推定に関する検討

五箇 亮太, 諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

複数のキャプションモデルに基づくLLMの説明文を用いたゼロショット映像検索の精度向上に関する一検討

王 昊陽, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

視覚言語モデルにおける注目する特徴を指定可能なドメイン適応に関する検討

岡村 洋希, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

画像注視時の脳活動データを用いた Stable Diffusion に基づくテキストからの画像生成に関する検討 −潜在空間における脳活動データに基づく制御機構の導入−

七田 亮, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀

映像情報メディア学会技術報告

モーションデータを用いたSpatial Temporal Attention Graph Convolutional Networkによる熟練度分類の高精度化に関する検討

清野 竜生, 斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀

映像情報メディア学会技術報告

Human emotion recognition while viewing images based on multi-view variational recurrent neural network

Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

Source-data-free domain-adaptive semantic segmentation with inter-domain and intra-domain style transfer

Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

Dataset distillation via self-adaptive parameter matching

Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

Feature integration introducing back-projection based on ordering in labels for rating prediction

Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

Text-guided image manipulation tolerant to real-world image

Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

Zero-shot visual sentiment prediction with cross-domain sentiments using knowledge distillation

Yingrui Ye, Yuya Moroto, Keisuke Maeda, Ren Togo, Takahiro Ogawa, Miki Haseyama

第26回 画像の認識・理解シンポジウム (MIRU2023)

講演発表(学会)

画像とテキストの関係性を考慮したTextual Inversionに基づくzero-shot composed image retrieval手法に関する検討

張 華瀛, 柳 凜太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

Spatial Temporal Attention Graph Convolutional Network によるモーションデータを用いた熟練度の分類に関する検討

清野 竜生, 斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

マルチモーダル大規模言語モデルを用いた fMRI からの言語情報の推定に関する検討 – In-context Learning に基づく時系列聴覚刺激からの言語情報の推定 –

藤後 太郎, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

視覚反実仮想機械学習モデルにおける精度向上に関する一検討 – 特徴抽出モデルが精度に与える影響の検証 –

李 想, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

事前学習済みモデルを用いたラベル修正に基づくNoisy Labels Learningの精度向上に関する検討

柏木 將希, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

In-context Learning を用いた複数視点ライフログ画像のキャプションの統一化に関する検討

佐藤 雅也, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会

拡散モデルによる画像生成における複数対象へのパーソナライズ手法に関する検討

松田 遥, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
令和5年度 電気・情報関係学会北海道支部連合大会