브라우저 인쇄 및 PDF 저장에 맞게 최적화되었습니다.
이력서

김동현

데이터 구조화와 NLP/LLM 평가를 시스템 구현으로 연결하는 엔지니어

Data & Applied AI Engineer Data SystemsAI-DLC / MLOpsNLP / LLM
위치 인천, 대한민국
프로젝트 7
연구 및 발표 3
수료 및 교육 4

요약

데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 바탕으로 문제 정의부터 구현, 검증, 전달까지 이어지는 작업을 수행합니다.

  • 다양한 데이터 표면을 모델링과 운영에 연결 가능한 구조와 파이프라인으로 바꾸는 일을 중요하게 생각합니다.
  • AI 실험과 운영 흐름을 재현 가능하고 관측 가능하게 만드는 데 집중합니다.

연구, 프로그램, 리더십

대학원생 연구원
Intelligent Data Analytics Lab., Gachon University | 2024.03 - 2026.02
  • EMR 기반 간호감시 의사결정 지원과 진단 분류를 주제로 대학원 연구를 수행했습니다.
  • 정형 데이터와 텍스트 데이터를 함께 활용해 KM-BERT 앙상블과 XGBoost 기반 엔드투엔드 모델링 파이프라인을 구축했습니다.
연구과제 참여 연구원
정보통신기획평가원 (IITP) | 2025.09 - 2025.12
  • 인간지향적 멀티모달 AI 프로젝트에서 평가 관련 코드를 구현했습니다.
  • 평가 요구사항을 실제 코드와 검토 가능한 산출물로 연결하는 작업을 수행했습니다.
연구과제 참여 연구원
한국연구재단 (NRF) | 2024.03 - 2025.12
  • EMR 데이터를 활용한 간호감시 의사결정 지원 연구과제에서 임상 AI 워크플로 구현에 참여했습니다.
  • 임상 텍스트 이해를 위해 키워드 추출, 의존구문 기반 전처리, 토픽 모델링, 유사도 분석 워크플로를 구현했습니다.
학생 리더 및 커뮤니티 운영자
Gachon University / Notion Community Program | 2019.03 - 2025.02
  • 교내 공식 프로그래밍 동아리에서 여러 리더십 역할을 맡았고, 2022년에는 회장을 역임했습니다.
  • 머신러닝, 빅데이터, 금융 ML, GNN 관련 스터디 그룹을 직접 기획하고 운영했습니다.

대표 프로젝트

EMR 기반 간호감시 자동 ICD 코딩 시스템
의료 AI 연구 | 2025

복부수술 환자의 간호감시를 지원하기 위해 핵심 EMR 데이터만으로 자동 ICD 코딩 모델을 구축했다.

  • 전체 성능과 희소 클래스 재현율 동시 검토
  • 사후 문서 없이 핵심 EMR 기반 분류
프로젝트 상세 보기
Contexta: 로컬 퍼스트 ML Observability 프로젝트
개인 주도형 ML 플랫폼 프로젝트 | 2026

로컬 환경에서 머신러닝 실험과 실행 기록을 일관되게 수집, 저장, 조회, 비교, 복구할 수 있도록 설계한 Contexta 프로젝트를 개발했으며, canonical contract와 workspace 중심의 ML observability 구조 구현에 집중했습니다.

  • 로컬 퍼스트 observability 구조 설계
  • canonical contract 및 workspace 구현
프로젝트 상세 보기
Lynxes: 그래프 분석 엔진 프로젝트
그래프 시스템 엔진 프로젝트 | 2026

Apache Arrow 기반의 그래프 분석 엔진 Lynxes를 직접 설계하고 구현했으며, CSR 인덱스와 lazy execution을 중심으로 고성능 그래프 처리 경험을 만드는 데 집중했습니다.

  • 그래프 엔진 아키텍처 설계
  • CSR 탐색 구조 구현
프로젝트 상세 보기