Research Interests
- Vision & Language
- NLP
略歴
-
2018.04
東北大学(学士)
電気情報物理工学科
April 2018 - March 2022
-
2022.04
東北大学(修士)
情報科学研究科 システム情報科学専攻 鈴木(潤)研究室
April 2022 - March 2024
-
2024.04
東北大学(博士)
情報科学研究科 システム情報科学専攻 鈴木(潤)研究室
April 2024 - present
ジャーナル(査読あり)
-
Instruction-Following Evaluation of Large Vision-Language Models
Daiki Shiono, Shumpei Miyawaki, Ryota Tanaka, Jun Suzuki.
New Generation Computing, Volume 44, Article 7, January 2026.
-
Aoba_v3 bot: a multimodal chatbot system combining rules and various response generation models
Shoji Moriya*, Daiki Shiono*, Riki Fujihara, Yosuke Kishinami, Subaru Kimura, Shusaku Sone, Reina Akama, Yuta Matsumoto, Jun Suzuki and Kentaro Inui. (*: equal contribution)
Advanced Robotics, Volume 37, Issue 21, pp.1392-1405, August 2023.
国際会議(査読あり)
-
STRIDE-QA: Visual Question Answering Dataset for Spatiotemporal Reasoning in Urban Driving Scenes
Keishi Ishihara, Kento Sasaki, Tsubasa Takahashi, Daiki Shiono, Yu Yamaguchi.
Proceedings of the AAAI Conference on Artificial Intelligence (AAAI 2026), Singapore, January 2026.
-
Batch-wise Convergent Pre-training: Step-by-Step Learning Inspired by Child Language Development
Ko Yoshida, Daiki Shiono, Kai Sato, Toko Miura, Momoka Furuhashi, Jun Suzuki.
Proceedings of the First BabyLM Workshop on Association for Computational Linguistics, Suzhou, China, November 2025.
-
Evaluating Model Alignment with Human Perception: A Study on Shitsukan in LLMs and LVLMs
Daiki Shiono, Ana Brassard, Yukiko Ishizuki, Jun Suzuki.
Proceedings of the 31st International Conference on Computational Linguistics (COLING 2025), Abu Dhabi, UAE, January 2025.
-
Instruction-Following Evaluation for Large Vision-Language Models
Daiki Shiono, Shumpei Miyawaki, Ryota Tanaka, Jun Suzuki.
Non-archival submission for the 2024 Conference of the North American Chapter of the Association for Computational Linguistics Student Research Workshop (NAACL SRW 2024), Mexico City, Mexico, June 2024.
-
Detecting Response Generation Not Requiring Factual Judgment
Ryohei Kamei, Daiki Shiono, Reina Akama, Jun Suzuki.
Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics Student Research Workshop (NAACL SRW 2024), Mexico City, Mexico, June 2024.
-
Exploring Large Language Models' Understanding of Shitsukan
Yukiko Ishizuki*, Daiki Shiono*, Ana Brassard, Jun Suzuki. (*: equal contribution)
Non-archival submission for the 18th Conference of the European Chapter of the Association for Computational Linguistics Student Research Workshop (EACL SRW 2024), Malta, March 2024.
国内会議・シンポジウム
-
MOMIJI: 日本語大規模インターリーブ視覚言語データセット
塩野 大輝, 横井 慎吾, 犬塚 眞太郎, 髙橋 翼, 鈴木 潤, 山口 祐.
言語処理学会第32回年次大会(NLP 2026), 宇都宮, 栃木, pp.XXXX-XXXX, March 2026.
-
JCuisines: 日本の地域文化の理解にむけた郷土料理視覚言語ベンチマーク
猪股 和樹, 吉田 遥音, 塩野 大輝, 赤間 怜奈, 坂口 慶祐.
言語処理学会第32回年次大会(NLP 2026), 宇都宮, 栃木, pp.XXXX-XXXX, March 2026.
-
注意機構における Attention Sink のバイアス項的解釈
大橋 諭貴, 木谷 頼斗, 佐藤 宏亮, 高橋 良允, 鴨田 豪, 山本 悠士, 塩野 大輝, 坂口 慶祐, 小林 悟郎.
言語処理学会第32回年次大会(NLP 2026), 宇都宮, 栃木, pp.XXXX-XXXX, March 2026.
-
Attention Sink および Massive Activation の発生機序の分解
木谷 頼斗, 大橋 諭貴, 佐藤 宏亮, 鴨田 豪, 高橋 良允, 山本 悠士, 塩野 大輝, 坂口 慶祐, 小林 悟郎.
言語処理学会第32回年次大会(NLP 2026), 宇都宮, 栃木, pp.XXXX-XXXX, March 2026.
-
バッチ単位収束型事前学習:子どもの言語発達に着想を得た一歩ずつの学習
吉田 倖, 塩野 大輝, 佐藤 魁, 古橋 萌々香, 三浦 東子, 鈴木 潤.
NLP若手の会第20回シンポジウム(YANS 2025), 浜松, 静岡, August 2025. 奨励賞受賞.
-
Padding vs. Packing: 大規模言語モデルのファインチューニングにおける学習効果の検証
塩野 大輝, 田中 涼太, 宮脇 峻平, 工藤 慧音, 鈴木 潤.
言語処理学会第31回年次大会(NLP 2025), 長崎, pp.1698-1703, March 2025.
-
大規模視覚言語モデルの質感知覚能力の分析
松田 陵佑, 塩野 大輝, Ana Brassard, 鈴木 潤.
言語処理学会第31回年次大会(NLP 2025), 長崎, pp.2550-2555, March 2025.
-
日本語バイト符号化マスク言語モデルの開発と分析
工藤 慧音, 鴨田 豪, 塩野 大輝, 鈴木 潤.
言語処理学会第31回年次大会(NLP 2025), 長崎, pp.3356-3361, March 2025.
-
大規模視覚言語モデルに関する指示追従能力の検証
塩野 大輝, 宮脇 峻平, 田中 涼太, 鈴木 潤.
言語処理学会第30回年次大会(NLP 2024), 神戸, pp.2057-2062, March 2024. 委員特別賞受賞.
-
事実正誤判定が不要な生成応答の検出に向けたデータセットの収集と分析
亀井 遼平, 塩野 大輝, 赤間 怜奈, 鈴木 潤.
言語処理学会第30回年次大会(NLP 2024), 神戸, pp.2125-2130, March 2024.
-
Instruction-Following Evaluation for Large Vision-Language Models
塩野 大輝.
The 5th International Symposium on AI Electronics, 仙台, February 2023.
-
生成応答に含まれる事実に基づかない情報の自動検出の試み
亀井 遼平, 塩野 大輝, 赤間 怜奈, 鈴木 潤.
NLP若手の会第18回シンポジウム(YANS 2023), 浅草橋, August 2023. 奨励賞受賞. スポンサー賞受賞.
-
画像キャプションを利用したIconQAタスクへのアプローチ
塩野 大輝, 宮脇 峻平, 長澤 春希, 鈴木 潤.
言語処理学会第29回年次大会(NLP 2023), 宜野湾, pp.1857-1862, March 2023.
-
aoba_v3 bot: 多様な応答生成モデルとルールベースを統合したマルチモーダル雑談対話システム
守屋 彰二*, 塩野 大輝*, 岸波 洋介, 藤原 吏生, 木村 昴, 松本 悠太, 曾根 周作, 赤間 怜奈, 鈴木 潤, 乾 健太郎.(*: 共同主著)
人工知能学会 音声・言語理解と対話処理研究会第96回研究会(JSAI SIG-SLUD 96)第13回対話システムシンポジウム, 立川, December 2022. 第5回対話システムライブコンペティション 優秀賞受賞(第2位).
受賞
-
第5回対話システムライブコンペティション オープントラック 優秀賞受賞(第2位)
December 2022.
-
言語処理学会第30回年次大会(NLP 2024) 委員特別賞受賞
March 2024. (26件/567件≒4.59%)
活動
研究助成金 / 奨学金
-
次世代AI人材育成 (BOOST) プログラム
※ BOOST: Broadening Opportunities for Outstanding young researchers and doctoral students in STrategic areas
Research Fellow (科学技術振興機構 (JST) 補助事業)
September 2024 - present
-
東北大学人工知能エレクトロニクス (AIE) 卓越大学院プログラム
Research Fellow (文部科学省補助金事業).
April 2020 - March 2025
-
日本学生支援機構 (JASSO) 奨学金
Scholership. 特に優れた業績による半額返済免除.
April 2022 - March 2024
インターン・アルバイト
-
Research Intern @ Turing Inc.
Member of Fundamental AI Group
大規模視覚言語モデル (LVLM) の学習 / 大規模日本語視覚-言語事前学習データセットの構築 / 日本語 Visual Instruction Tuning データセットの構築 に関する業務を担当
April 2024 - present
-
Machine Learning Engineer Part-time @ Future Inc.
Member of Strategic AI Group
March 2023 - December 2023
Teaching Assistant
-
自然言語処理学
東北大学大学院 情報科学研究科 講義
October 2023 - February 2024
-
人工知能技術のためのプログラミング入門
東北大学 全学教育 課外講義
October 2022 - December 2023
Research Assistant
-
東北大学データ駆動科学・AI教育研究センター
研究題目の研究遂行に必要な環境・ドキュメント・データ整備・実験・その他補助業務
April 2023 - present
-
研究室内サーバー管理
April 2023 - July 2024
Slide
-
Words or Vision: Do Vision-Language Models Have Blind Faith in Text? (CVPR2025)
第 17 回 最先端 NLP 勉強会 (SNLP2025) 発表資料
August 2025
-
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
November 2024
ブログ
-
【日本語V&Lデータセット】The Cauldron JA, Wikipedia Vision JA を公開しました!
Blog post from my internship at Turing Inc.
スキル
- Python
- PyTorch
- Docker
- Singularity
- HTML/CSS