브라우저 인쇄 또는 PDF 저장에 맞게 최적화된 포트폴리오입니다.
SYS_SHEET_01 / COVER

출력용 포트폴리오

웹 포트폴리오

Portfolio for Technical Review

Data & Applied AI Engineer

Data & Applied AI Engineer

데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 바탕으로 문제 정의부터 구현, 검증, 전달까지 이어지는 작업을 수행한다.

피드백 & 데이터 루프 실시간 서빙 & 모니터링 데이터 파이프라인 & 오케 NLP / LLM Research Data Systems AI-DLC / MLOps

[SYS_ROLE: EXECUTIVE_SUMMARY] · 역할 요약

Data Systems 그래프 네이티브 깊이를 가진 데이터 시스템 스페셜리스트

이질적인 데이터를 모델과 시스템이 함께 다룰 수 있는 표현, 파이프라인, 그래프 구조로 바꿉니다.

AI-DLC / MLOps AI-DLC 기반 운영형 MLOps 엔지니어

AI 작업의 실행 기록, 산출물, 모델 행동, 피드백 경로를 다시 검토하고 개선할 수 있게 만듭니다.

NLP / LLM 응용 NLP 및 LLM 연구 엔지니어

언어 모델 연구 경험을 실제 시스템에서 더 나은 모델링과 평가 판단으로 번역합니다.

[SYS_EVIDENCE: VERIFICATION_MATRIX]

증거 항목 (Evidence) Data Systems AI-DLC / MLOps NLP / LLM
대표 프로젝트 (Featured Cases)
2026 / 개인 주도형 ML 플랫폼 프로젝트 Contexta: 로컬 퍼스트 ML Observability 프로젝트 연결된 축 주요 역할
2026 / 그래프 시스템 엔진 프로젝트 Lynxes: 그래프 분석 엔진 프로젝트 주요 역할 연결된 축
2025 / 의료 AI 연구 EMR 기반 간호감시 자동 ICD 코딩 시스템 연결된 축 주요 역할
2024 / 사내 커머스 플랫폼 Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼 연결된 축 주요 역할
2024 / LLM 응용 프로토타입 Devridge: 개발자를 위한 LLM 기반 피드백 브리지 연결된 축 주요 역할
2023 / 협업형 NLP 프로젝트 BloGeek: 블로그 프로젝트 연결된 축 주요 역할
2023 / 대화형 AI 프로젝트 FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI 연결된 축 주요 역할
연구 논문 (Research Papers)
2026 / 연구 논문 고도화된 임상 의사결정을 위한 문맥 적응형 게이트 임베딩 프레임워크 연결된 축 주요 역할
2025 / 연구 논문 복부수술 환자의 간호감시를 위한 딥러닝 기반 진단명 분류 모델 연결된 축 주요 역할
2025 / 연구 논문 AI 피드백 기반 강화학습을 이용한 공감 대화 생성 모델 주요 역할
교육과 학업 스터디 (Capability Studies)
2023 / 학습 스터디 NEKA: NLP 스터디 (KoBERT) 주요 역할
2023 / 학습 스터디 수나로움: 금융 AI 스터디 연결된 축 주요 역할
2022 / 학습 스터디 이다: 추천 시스템 스터디 (지식 그래프) 주요 역할
2022 / 학습 스터디 MLADS: 머신러닝 기초 스터디 주요 역할 연결된 축
Email eastlighting1@gachon.ac.kr
깃허브 github.com/eastlighting1
링크드인 www.linkedin.com/in/동현-김-350b4b29b
SYS_SHEET_02 / CASE_STUDY

01 / 개인 주도형 ML 플랫폼 프로젝트 / 2026

Contexta: 로컬 퍼스트 ML Observability 프로젝트

로컬 환경에서도 ML 실행 이력과 산출물을 일관된 contract로 추적, 비교, 복구할 수 있게 만든 observability 라이브러리 프로젝트입니다.

구현 완료

[SYS_PIPELINE: TIMELINE]

WARN 문제

머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다.

EXEC 핵심 결정

`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.

OK 결과

ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다.

[SYS_FLOW: ARCHITECTURE]

Python facade, CLI, workspace storage, report/recovery 흐름이 같은 contract를 공유하는 로컬 퍼스트 ML observability 구조입니다.

Python API CLI Canonical Contract Local Workspace Reports & Recovery

[SYS_SPEC: CONSTRAINTS] · 제약 제어

  • 외부 백엔드 없이 로컬 workspace만으로 동작해야 했습니다.
  • 라이브러리 API와 CLI가 같은 contract를 공유해야 했습니다.
  • 실행 기록, 아티팩트, 비교 리포트, 복구 흐름을 하나의 경험으로 묶어야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
Canonical workspace

`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.

근거: 사용자가 로컬 파일 시스템에서도 실행 이력을 신뢰할 수 있게 하기 위해서입니다.
EXEC
Schema-first contract

캡처, 조회, 비교, 복구 기능이 동일한 데이터 계약을 따르도록 설계했습니다.

근거: 기능이 늘어나도 데이터 의미가 흩어지지 않게 하기 위해서입니다.

ML 도구는 모델 성능뿐 아니라 실행 흔적을 얼마나 다시 설명할 수 있는지가 제품성을 좌우한다는 점을 확인했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
연결된 축 Data Systems
주요 역할 AI-DLC / MLOps
NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Local-first · Architecture
Schema-first · Contract
Trace / Compare / Recover · Workflow

AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면
structuredhybrid
AI-DLC 단계
dataexperimentevaluationobservabilityfeedback-recovery
SYS_SHEET_03 / CASE_STUDY

02 / 그래프 시스템 엔진 프로젝트 / 2026

Lynxes: 그래프 분석 엔진 프로젝트

Arrow 기반 컬럼 메모리와 그래프 네이티브 탐색 구조를 결합해 Python에서 사용할 수 있는 고성능 그래프 분석 엔진을 설계한 프로젝트입니다.

구현 완료

[SYS_PIPELINE: TIMELINE]

WARN 문제

기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다.

EXEC 핵심 결정

GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.

OK 결과

Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다.

[SYS_FLOW: ARCHITECTURE]

Arrow RecordBatch, CSR 인덱스, lazy logical plan, Rust 알고리즘, Python 바인딩을 결합한 그래프 분석 엔진 구조입니다.

Arrow RecordBatch GraphFrame CSR Index LogicalPlan Python Bindings

[SYS_SPEC: CONSTRAINTS] · 제약 제어

  • 노드와 엣지 데이터를 컬럼 지향 구조로 다뤄야 했습니다.
  • 이웃 탐색은 선형 스캔이 아니라 그래프 구조에 맞는 복잡도를 가져야 했습니다.
  • Rust 엔진과 Python 사용성 사이의 경계를 안정적으로 설계해야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
Arrow-owned GraphFrame

GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.

근거: 컬럼 지향 메모리 효율과 Python 분석 생태계와의 연결 가능성을 함께 얻기 위해서입니다.
EXEC
CSR adjacency index

EdgeFrame에 CSR 기반 인접성 인덱스를 결합해 이웃 조회를 O(degree)로 만들었습니다.

근거: 그래프 탐색을 범용 테이블 스캔이 아니라 그래프 네이티브 연산으로 다루기 위해서입니다.
EXEC
Lazy logical plan

질의 연결은 LogicalPlan으로 누적하고 실제 계산은 `.collect()`에서 수행하도록 설계했습니다.

근거: 분석 파이프라인을 최적화 가능한 실행 흐름으로 유지하기 위해서입니다.

시스템 성능은 알고리즘만이 아니라 데이터 소유권, 메모리 레이아웃, 사용자 API가 함께 맞물릴 때 설득력을 갖는다는 점을 확인했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
주요 역할 Data Systems
연결된 축 AI-DLC / MLOps
NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

O(degree) · Neighbor lookup
Arrow · Memory model
Lazy collect · Execution

그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면
structuredgraphhybrid
AI-DLC 단계
dataexperimentevaluation
SYS_SHEET_04 / CASE_STUDY

03 / 의료 AI 연구 / 2025

EMR 기반 간호감시 자동 ICD 코딩 시스템

간호 현장에서 바로 접근 가능한 핵심 EMR만으로도 진단 관련 분류를 실용적으로 지원할 수 있음을 검증한 의료 AI 연구입니다.

논문 기반 요약 공개

[SYS_PIPELINE: TIMELINE]

WARN 문제

간호감시에 필요한 진단 관련 신호가 검사 데이터, 환자정보, 간호기록 등 이질적인 EMR 소스에 분산되어 있었습니다.

EXEC 핵심 결정

간호 텍스트를 두 개의 KM-BERT 모델로 독립 학습하고 raw logits를 평균해 텍스트 표현의 안정성을 높였습니다.

OK 결과

최종 모델은 단순 전체 점수보다 희소 클래스 재현율과 실무 사용 가능성을 함께 확인할 수 있는 결과를 보였습니다.

[SYS_FLOW: ARCHITECTURE]

구조화 EMR과 간호 텍스트를 병렬로 처리한 뒤 스태킹 분류기로 결합하는 의료 AI 파이프라인입니다.

Structured EMR Nursing Text Dual KM-BERT PCA + XGBoost Rare-class Evaluation

[SYS_SPEC: CONSTRAINTS] · 제약 제어

  • 의사 판독문이나 퇴원기록 같은 사후 문서에 의존하지 않아야 했습니다.
  • 희소 클래스에서도 실무적으로 의미 있는 재현율을 확보해야 했습니다.
  • 구조화 데이터와 한국어 임상 텍스트를 함께 다뤄야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
이중 KM-BERT 표현

간호 텍스트를 두 개의 KM-BERT 모델로 독립 학습하고 raw logits를 평균해 텍스트 표현의 안정성을 높였습니다.

근거: 임상 텍스트 신호의 변동성을 줄이고 앙상블 효과를 얻기 위해서입니다.
EXEC
PCA와 XGBoost 스태킹

BERT 기반 표현을 PCA로 축소한 뒤 XGBoost를 메타 분류기로 사용했습니다.

근거: 고차원 임베딩과 구조화 EMR 피처를 함께 다루면서 과적합 위험을 낮추기 위해서입니다.

의료 AI에서는 단순 최고 점수보다 어떤 문서와 피처를 언제 사용할 수 있는지가 실제 적용 가능성을 좌우한다는 점을 배웠습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
연결된 축 Data Systems
AI-DLC / MLOps
주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Balanced · Evaluation Scope
Core EMR · Available Data
High · Rare-class Recall

이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면
structuredtexthybrid
AI-DLC 단계
datatrainingevaluation

[SYS_LINK: ARTIFACTS]

SYS_SHEET_05 / CASE_STUDY

04 / 사내 커머스 플랫폼 / 2024

Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼

사내 커머스 플랫폼의 제품 완성도를 뒷받침하기 위해 배포, 운영, 보안, 관측 가능성 기반을 정리한 DevSecOps 프로젝트입니다.

구현 완료 요약 공개

[SYS_PIPELINE: TIMELINE]

WARN 문제

사내 전용 커머스 플랫폼은 검색, 알림, 관리자 기능을 안정적으로 뒷받침할 수 있는 클라우드 인프라와 운영 체계가 필요했습니다.

EXEC 핵심 결정

React와 Spring 기반 서비스가 배포, 운영, 모니터링 흐름 안에서 동작하도록 CI/CD와 클라우드 기반을 정리했습니다.

OK 결과

폐쇄형 사내 마일리지 몰을 위한 실무형 서비스 기반을 팀 프로젝트 안에서 구축했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
Platform foundation

React와 Spring 기반 서비스가 배포, 운영, 모니터링 흐름 안에서 동작하도록 CI/CD와 클라우드 기반을 정리했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
연결된 축 Data Systems
주요 역할 AI-DLC / MLOps
NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

CI/CD + Cloud · Foundation

서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면
structuredimagehybrid
AI-DLC 단계
datadeploymentobservabilityfeedback-recovery
SYS_SHEET_06 / CASE_STUDY

05 / LLM 응용 프로토타입 / 2024

Devridge: 개발자를 위한 LLM 기반 피드백 브리지

역할별 제약과 구조화된 입력으로 LLM 피드백을 더 실용적인 개발 검토 경험으로 바꾸는 프로토타입입니다.

프로토타입 요약 공개

[SYS_PIPELINE: TIMELINE]

WARN 문제

솔로 개발자는 UI, 성능, 코드 품질 등 여러 관점의 피드백이 필요하지만, 적절한 시점에 역할별 의견을 얻기 어렵습니다.

EXEC 핵심 결정

응답이 범용 조언으로 흐르지 않도록 역할별 제약과 입력 맥락을 분리했습니다.

OK 결과

구조화된 프롬프트와 역할 제약을 통해 LLM 응답을 더 실용적인 프로젝트 피드백으로 바꾸는 프로토타입을 구현했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
Role-aware prompting

응답이 범용 조언으로 흐르지 않도록 역할별 제약과 입력 맥락을 분리했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
Data Systems
연결된 축 AI-DLC / MLOps
주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Role-based · Feedback modes

역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면
text
AI-DLC 단계
dataexperimentinferenceevaluation
SYS_SHEET_07 / CASE_STUDY

06 / 협업형 NLP 프로젝트 / 2023

BloGeek: 블로그 프로젝트

블로그 서비스 안에서 감성 분류와 스타일 변환 모델을 실제 콘텐츠 흐름에 연결한 한국어 NLP 프로젝트입니다.

구현 완료 요약 공개

[SYS_PIPELINE: TIMELINE]

WARN 문제

서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다.

EXEC 핵심 결정

극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.

OK 결과

웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
KoBERT와 KoBART 분리

극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
Data Systems
연결된 축 AI-DLC / MLOps
주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Classification + Generation · Model scope

분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면
text
AI-DLC 단계
dataexperimenttraininginferenceevaluation
SYS_SHEET_08 / CASE_STUDY

07 / 대화형 AI 프로젝트 / 2023

FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI

감정 인식, 챗봇, 요약 모델을 대화형 일기 흐름에 연결한 한국어 conversational AI 프로젝트입니다.

구현 완료 요약 공개

[SYS_PIPELINE: TIMELINE]

WARN 문제

서비스는 사용자 대화에서 감정을 인식하고, 이를 일기 생성 흐름과 연결할 수 있는 머신러닝 구성 요소가 필요했습니다.

EXEC 핵심 결정

KoBERT 기반 감정 인식 모델을 중심으로 챗봇과 요약 흐름이 연결되도록 지원했습니다.

OK 결과

감정 인식 중심의 ML 파이프라인을 포함한 MVP 수준의 대화형 일기 경험을 구현했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC
Emotion-first ML pipeline

KoBERT 기반 감정 인식 모델을 중심으로 챗봇과 요약 흐름이 연결되도록 지원했습니다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
Data Systems
연결된 축 AI-DLC / MLOps
주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Korean NLP · Pipeline

한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면
text
AI-DLC 단계
dataexperimenttraininginferenceevaluation
SYS_SHEET_09 / RESEARCH_CASE

01 / 저널 논문 / 2026

고도화된 임상 의사결정을 위한 문맥 적응형 게이트 임베딩 프레임워크

Mathematics / 2026 / 저널 논문

[SYS_RESEARCH: ABSTRACT]

ICU 임상 의사결정 지원을 위해, 부분 라벨 기반 자동 ICD 코딩으로 추정한 진단 문맥을 불규칙 시계열과 결합하고, 문맥 적응형 게이팅을 통해 기계환기 전이 사건을 예측하는 계층형 프레임워크를 제안한 연구이다. 진단 문맥을 하위 시계열 해석에 재주입함으로써 희귀 전이 이벤트 탐지 성능을 크게 높였다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 자동 ICD 코딩에서 얻은 진단 문맥을 ICU 시계열 예측에 재주입하는 문맥 적응형 게이트 임베딩 프레임워크를 제안했다.

설계 방법론: 부분 라벨 기반 진단 문맥, TCN 시계열 표현, 게이팅 구조를 결합해 희귀 전이 이벤트 예측을 강화했다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
주요 역할 NLP / LLM
연결된 축 Data Systems

[SYS_METRIC: RELEVANCE]

데이터 표면을 분리해 처리하는 대신 진단 문맥과 시계열 신호를 계층적으로 연결하는 모델링 판단을 보여준다.

[SYS_RESEARCH: BIBTEX]

@article{math14081397,
  title={A Context-Adaptive Gated Embedding Framework for Advanced Clinical Decision-Making},
  author={Donghyeon Kim, Daeho Kim, Okran Jeong},
  journal={Mathematics},
  volume={14},
  number={8},
  year={2026}
}

[SYS_SPEC: METADATA]

임상 의사결정지원시스템자동 ICD 코딩ICU 시계열기계환기 예측부분 라벨 학습극단 다중분류TCN게이팅희귀 이벤트 탐지
Email eastlighting1@gachon.ac.kr
깃허브 github.com/eastlighting1
링크드인 www.linkedin.com/in/동현-김-350b4b29b
SYS_SHEET_010 / RESEARCH_CASE

02 / 저널 논문 / 2025

복부수술 환자의 간호감시를 위한 딥러닝 기반 진단명 분류 모델

한국컴퓨터정보학회논문지 / 2025 / 저널 논문

[SYS_RESEARCH: ABSTRACT]

복부수술 환자의 EMR에서 검사 데이터, 환자정보, 간호기록을 통합하여 간호감시를 지원하기 위한 자동 ICD 코딩 모델을 제안한 연구이다. KM-BERT 이중 앙상블과 XGBoost, PCA를 결합한 스태킹 구조를 통해 기존 단일 모델 및 단순 앙상블보다 더 높은 진단명 분류 성능을 보였다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 간호감시 맥락의 자동 ICD 코딩을 위해 EMR 정형 정보와 간호기록을 결합한 딥러닝 분류 모델을 제안했다.

설계 방법론: KM-BERT 앙상블, PCA, XGBoost 스태킹을 통해 희소 진단명과 도메인 민감 label을 평가했다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
주요 역할 NLP / LLM
연결된 축 Data Systems

[SYS_METRIC: RELEVANCE]

NLP/LLM 시스템의 성능을 단순 정확도가 아니라 도메인 데이터 구조와 오류 분포까지 함께 판단해야 한다는 포트폴리오 주장을 보강한다.

[SYS_RESEARCH: BIBTEX]

@article{kim2025deep,
  title={Deep Learning based Automatic ICD Coding for Nursing Surveillance of Abdominal Surgery Patients},
  author={Donghyeon Kim, Daeho Kim, Seyoung Kim, Okran Jeong},
  journal={Journal of The Korea Society of Computer and Information},
  volume={30},
  number={5},
  pages={21--30},
  year={2025},
  publisher={The Korean Society Of Computer And Information}
}

[SYS_SPEC: METADATA]

의료 AI간호감시EMR자동 ICD 코딩딥러닝KM-BERTXGBoost앙상블복부수술
Email eastlighting1@gachon.ac.kr
깃허브 github.com/eastlighting1
링크드인 www.linkedin.com/in/동현-김-350b4b29b
SYS_SHEET_011 / RESEARCH_CASE

03 / 학회 논문 / 2025

AI 피드백 기반 강화학습을 이용한 공감 대화 생성 모델

한국컴퓨터종합학술대회 / 2025 / 학회 논문

[SYS_RESEARCH: ABSTRACT]

기존 공감 대화 생성 모델의 낮은 다양성과 인간 피드백 의존 문제를 해결하기 위해, AI 기반 피드백(RLAIF)을 활용한 강화학습 공감 대화 생성 모델을 제안한 연구이다. LLM을 평가자로 활용하여 보상을 구성하고, EmpRL 구조에 통합함으로써 더 다양한 공감 응답 생성을 달성했다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 공감 대화 생성에서 인간 피드백 의존을 줄이기 위해 AI 피드백 기반 강화학습 구조를 제안했다.

설계 방법론: LLM 평가자를 보상 모델처럼 활용하고 PPO 기반 정책 업데이트로 응답 다양성과 공감 수준을 조정했다.

[SYS_ROLE: TELEMETRY]

NLP Data MLOps
주요 역할 NLP / LLM

[SYS_METRIC: RELEVANCE]

LLM 응답 품질을 프롬프트 결과가 아니라 평가자, 보상, 정책 업데이트가 연결된 시스템 판단으로 다뤄야 한다는 관점을 보강한다.

[SYS_RESEARCH: BIBTEX]

@inproceedings{joo2025empathetic,
  title={Empathetic Dialogue Generation Model Using Reinforcement Learning with AI-Based Feedback},
  author={Yongwan Joo, Donghyun Lim, Donghyeon Kim, Seungyeon Sun, Okran Jeong},
  booktitle={Proceedings of the Korea Computer Congress 2025},
  pages={2410--2412},
  year={2025}
}

[SYS_SPEC: METADATA]

공감 대화강화학습RLAIFRLHF 대체LLM대화 생성자연어처리AI 피드백
Email eastlighting1@gachon.ac.kr
깃허브 github.com/eastlighting1
링크드인 www.linkedin.com/in/동현-김-350b4b29b
SYS_SHEET_12 / CREDENTIALS_GROWTH

출력용 포트폴리오

학술 자격 · 자기주도 학습

[SYS_CREDENTIAL: PATHWAY] · 자격 및 학습 경로

// 01_ACADEMIC_STUDIES

2024.03 - 2026.02

Gachon University

인공지능 전공 석사 · GPA 4.14/4.5. Intelligent Data Analytics Lab. 지도교수 OkRan Jeong. 임상 AI, 평가, 구현 중심 연구 전달을 중심으로 연구를 수행하고 있습니다.

FOCUS: 인공지능 특론, 그래프 신경망(GNN), 의료 시계열 데이터 분석
2019.03 - 2024.02

Gachon University

소프트웨어학과 학사 · 공식 프로그래밍 동아리 활동과 기본 ML, 심화 ML, 금융 ML, GNN 등 다양한 스터디 그룹 운영을 통해 리더십과 커뮤니티 운영 경험을 쌓았습니다.

FOCUS: 자료구조, 알고리즘, 선형대수학, 통계적 기계학습

// 02_PROFESSIONAL_COURSES

2023.11

데브옵스 환경의 모니터링과 테스트 실전구현

LLOYDK · Elastic 기반 DevOps 모니터링 및 테스트 실무 교육을 이수했습니다.

2023.12

Multi Cloud Orchestration Program

5Works · HashiCorp 기반 멀티 클라우드 오케스트레이션 및 IaC 교육을 이수했습니다.

2024.02

기업주도 집중프로젝트 교육

디케이테크인 · 보안 및 DevOps 엔지니어링 중심의 기업 연계 실무 교육에 참여했습니다.

2024.02

소프트웨어 전문인재 Micro Degree

가천대학교 · 소프트웨어 전문인재 양성을 위한 마이크로디그리 과정을 이수했습니다.

// 03_CONTINUOUS_LEARNING

2024.03

AWS Builders Online Series 이수

AWS · 서버리스 아키텍처 및 Amazon Bedrock 기반 생성형 AI 어플리케이션 통합 워크플로 학습

2023.08

오픈소스 NLP/LLM 지속 학습

Community · 오픈소스 LLM 경량 최적화(LoRA, QLoRA) 기법 및 RAG 패턴 기반 검색 증강 생성 실무 아키텍처 분석

[SYS_LOG: PIPELINE_EXECUTION] · 시스템 훈련 로그

[INFO] 2026-05-25 02:09:03 - Initializing training pipeline...
[SPEC] CUDA Version: 12.2 / Device: NVIDIA RTX 4090 x2
[LOAD] Loading pretrained model: kobert-base-v3-medical
· Config: 12-layer, 768-hidden, 12-heads (110M Params)
[TRAIN] Epoch [4/10] - Step [4500/12000] - Loss: 0.1842
· Optimizer: AdamW (lr=3e-5) with linear warmups
[EVAL] Evaluating tokenization on clinical NER testsets...
· F1-Score: 0.8816 / Precision: 0.8842 / Recall: 0.8791
* SYSTEM SIMULATION LOG FOR VISUALIZATION PURPOSE.
* ALL SOURCE ALGORITHMS MAPPED TO LIVE PRODUCTION SERVICES.

[SYS_CREDENTIAL: STUDY_GROUPS] · 자기주도 역량 개발 스터디