Publications

14 papers · Google Scholar

2026

ListenCare: Encounter-Grounded Audio Question Answering for Long-Form Clinical Conversation Speech

Seongsu Bae^*, Chaeeun Shim^*, Sungbae Park, Edward Choi

ICML 2026 Workshop on Machine Learning for Audio

Workshop

KorMedMCQA-V: A Multimodal Benchmark for Evaluating Vision-Language Models on Korean Medical Licensing Exam

Byungjin Choi^*, Seongsu Bae^*, Sunjun Kweon, Edward Choi

Preprint

Paper Dataset Code

2025

PatientSim: A Persona-Driven Simulator for Realistic Doctor-Patient Interactions

Daeun Kyung, Hyunseung Chung, Seongsu Bae, Jiho Kim, Jae Ho Sohn, Taerim Kim, Soo Kyung Kim, Edward Choi

NeurIPS 2025 Datasets and Benchmarks (Spotlight)

Paper Code

AOR: Anatomical Ontology-Guided Reasoning for Medical Large Multimodal Model in Chest X-Ray Interpretation

Qingqiu Li, Zihang Cui, Seongsu Bae, Jilan Xu, Runtian Yuan, Yuejie Zhang, Rui Feng, Quanli Shen, Xiaobo Zhang, Junjun He, Shujun Wang

NeurIPS 2025

Paper Code

2024

EHRCon: Dataset for Checking Consistency between Unstructured Notes and Structured Tables in Electronic Health Records

Yeonsu Kwon, Jiho Kim, Gyubok Lee, Seongsu Bae, Daeun Kyung, Wonchul Cha, Tom Pollard, Alistair Johnson, Edward Choi

NeurIPS 2024 Datasets and Benchmarks (Spotlight)

Paper Code

Overview of the EHRSQL 2024 Shared Task on Reliable Text-to-SQL Modeling on Electronic Health Records

Gyubok Lee, Sunjun Kweon, Seongsu Bae, Edward Choi

NAACL 2024 Clinical NLP Workshop (Oral)

Publicly Shareable Clinical Large Language Model Built on Synthetic Clinical Notes

Sunjun Kweon, Junu Kim, Jiyoun Kim, Sujeong Im, Eunbyeol Cho, Seongsu Bae, Jungwoo Oh, Gyubok Lee, Jong Hak Moon, Seng Chan You, Seungjin Baek, Chang Hoon Han, Yoon Bin Jung, Yohan Jo, Edward Choi

ACL 2024 Findings

Paper Code

2023

EHRXQA: A Multi-Modal Question Answering Dataset for Electronic Health Records with Chest X-ray Images

Seongsu Bae^*, Daeun Kyung^*, Jaehee Ryu, Eunbyeol Cho, Gyubok Lee, Sunjun Kweon, Jungwoo Oh, Lei Ji, Eric I-Chao Chang, Tackeun Kim, Edward Choi

NeurIPS 2023 Datasets and Benchmarks

Paper Code

ECG-QA: A Comprehensive Question Answering Dataset Combined With Electrocardiogram

Jungwoo Oh, Gyubok Lee, Seongsu Bae, Joon-myoung Kwon, Edward Choi

NeurIPS 2023 Datasets and Benchmarks

Paper Code

KU-DMIS-MSRA at RadSum23: Pre-trained Vision-Language Model for Radiology Report Summarization

Gangwoo Kim, Hajung Kim, Lei Ji, Seongsu Bae, Chanhwi Kim, Mujeen Sung, Hyunjae Kim, Kun Yan, Eric Chang, Jaewoo Kang

BioNLP Workshop 2023

Paper

2022

EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records

Gyubok Lee, Hyeonji Hwang, Seongsu Bae, Yeonsu Kwon, Woncheol Shin, Seongjun Yang, Minjoon Seo, Jong-Yeup Kim, Edward Choi

NeurIPS 2022 Datasets and Benchmarks

Paper Code

Graph-Text Multi-Modal Pre-training for Medical Representation Learning

Sungjin Park, Seongsu Bae, Jiho Kim, Tackeun Kim, Edward Choi

CHIL 2022

Paper Code

Uncertainty-Aware Text-to-Program for Question Answering on Structured Electronic Health Records

Daeyoung Kim, Seongsu Bae, Seungho Kim, Edward Choi

CHIL 2022

Paper Code

2021

Question Answering for Complex Electronic Health Records Database using Unified Encoder-Decoder Architecture

Seongsu Bae, Daeyoung Kim, Jiho Kim, Edward Choi

ML4H 2021 (Oral Spotlight)

Paper