EMR 및 다양한 피처 테이블 등 관계형/정형 데이터 표현 및 스키마 설계
Portfolio for Technical Review
Data & Applied AI Engineer
데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 실제 프로젝트와 연구 기록으로 설명합니다.
각 작업에서 문제 정의, 설계 판단, 구현 결과, 공개 가능한 산출물을 함께 확인할 수 있습니다.
먼저 볼 관점 선택
공식 기록과 역할 적합성을 먼저 보고, 대표 케이스로 기술 판단을 보강합니다.
Focus Areas
관심 분야별로 대표 작업을 다시 정렬합니다
데이터, AI 개발 흐름, NLP/LLM 관점 중 하나를 선택하면 관련성이 높은 프로젝트가 먼저 보입니다.
관점을 선택하면 관련 프로젝트가 먼저 보입니다.
Development Flow
AI 프로젝트에서 반복해서 다룬 개발 흐름
한 프로젝트의 단계별 진행표가 아니라, 여러 프로젝트에서 반복적으로 다뤄온 데이터 준비, 실험, 평가, 배포, 기록 관리의 작업 방식을 요약합니다.
비구조화 텍스트 데이터의 토큰화 및 시맨틱 임베딩 공간 구조화
GNN 및 추천 모델에 연동 가능한 실시간 지식 그래프 구조 설계
이질적인 데이터 소스들을 통합하여 고성능 처리가 가능한 파이프라인 구축
정형, 텍스트, 이미지, 그래프 입력을 목적에 맞는 구조로 정리합니다.
가설, 설정, 메트릭, 산출물을 다시 검토할 수 있게 남깁니다.
재현 가능한 환경과 파이프라인으로 모델 학습을 관리합니다.
정확도만이 아니라 오류, 희소 클래스, 도메인 요구를 함께 확인합니다.
검토 가능한 산출물과 실행 표면으로 결과를 전달합니다.
로그, 아티팩트, 실행 기록을 통해 시스템 상태를 설명 가능하게 만듭니다.
비교, 복구, 회고를 다음 개선 사이클로 연결합니다.
특정 도메인에 맞춘 사전 학습(Pre-training) 및 태스크 미세 조정(Fine-tuning)
정확도 지표를 넘어 희소 클래스 오류, 편향, 도메인 제약을 고려한 다차원 평가 설계
지시어 튜닝(Instruction tuning) 및 RLAIF/RLHF 등을 통한 인간/AI 선호도 정렬
최신 NLP 논문 연구 성과를 실생활 웹 서비스 API 및 경량화 모델로 배포 및 통합
Project Records
프로젝트 기록
각 프로젝트의 제목과 설명은 위쪽에 두고, 데이터 형태와 공개 범위 같은 메타 정보는 별도 영역으로 분리했습니다.
그래프 네이티브 깊이를 가진 데이터 시스템 스페셜리스트
이질적인 데이터를 모델과 시스템이 함께 다룰 수 있는 표현, 파이프라인, 그래프 구조로 바꿉니다.
Contexta: 로컬 퍼스트 ML Observability 프로젝트
AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.
Lynxes: 그래프 분석 엔진 프로젝트
그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.
EMR 기반 간호감시 자동 ICD 코딩 시스템
이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.
Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼
서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.
AI-DLC 기반 운영형 MLOps 엔지니어
AI 작업의 실행 기록, 산출물, 모델 행동, 피드백 경로를 다시 검토하고 개선할 수 있게 만듭니다.
Contexta: 로컬 퍼스트 ML Observability 프로젝트
AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.
Lynxes: 그래프 분석 엔진 프로젝트
그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.
Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼
서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.
Devridge: 개발자를 위한 LLM 기반 피드백 브리지
역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.
BloGeek: 블로그 프로젝트
분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.
FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI
한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.
응용 NLP 및 LLM 연구 엔지니어
언어 모델 연구 경험을 실제 시스템에서 더 나은 모델링과 평가 판단으로 번역합니다.
EMR 기반 간호감시 자동 ICD 코딩 시스템
이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.
Devridge: 개발자를 위한 LLM 기반 피드백 브리지
역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.
BloGeek: 블로그 프로젝트
분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.
FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI
한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.
Project Comparison
문제, 결정, 결과가 함께 보이는 대표 작업
포트폴리오의 핵심은 프로젝트 목록이 아니라 판단 과정과 결과의 연결입니다.
대표 프로젝트를 같은 기준으로 비교합니다
대표 프로젝트를 문제, 결정, 결과, 공개 범위 기준으로 먼저 비교한 뒤 상세 설명으로 이동합니다.
| 대표 케이스 | 문제 | 설계 판단 | 구현 결과 | 공개 범위 | 보기 |
|---|---|---|---|---|---|
| Lynxes: 그래프 분석 엔진 프로젝트 그래프 시스템 엔진 프로젝트 / 2026 | 기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다. | GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다. | Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다. | 구현 완료 공개 자료 | 보기 |
| Contexta: 로컬 퍼스트 ML Observability 프로젝트 개인 주도형 ML 플랫폼 프로젝트 / 2026 | 머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다. | `.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다. | ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다. | 구현 완료 공개 자료 | 보기 |
| BloGeek: 블로그 프로젝트 협업형 NLP 프로젝트 / 2023 | 서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다. | 극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다. | 웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다. | 구현 완료 요약 공개 | 보기 |
그래프 시스템 엔진 프로젝트 / 2026
Lynxes: 그래프 분석 엔진 프로젝트
Arrow 기반 컬럼 메모리와 그래프 네이티브 탐색 구조를 결합해 Python에서 사용할 수 있는 고성능 그래프 분석 엔진을 설계한 프로젝트입니다.
기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다.
GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.
Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다.
개인 주도형 ML 플랫폼 프로젝트 / 2026
Contexta: 로컬 퍼스트 ML Observability 프로젝트
로컬 환경에서도 ML 실행 이력과 산출물을 일관된 contract로 추적, 비교, 복구할 수 있게 만든 observability 라이브러리 프로젝트입니다.
머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다.
`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.
ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다.
협업형 NLP 프로젝트 / 2023
BloGeek: 블로그 프로젝트
블로그 서비스 안에서 감성 분류와 스타일 변환 모델을 실제 콘텐츠 흐름에 연결한 한국어 NLP 프로젝트입니다.
서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다.
극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.
웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다.
프로세스
반복 가능한 작업 방식
연구, 실험, 구현, 전달을 어떤 순서로 엮는지 보여줍니다.
피처 엔지니어링
데이터의 구성과 관리
복잡한 데이터를 목적에 맞게 전처리하고, 데이터의 품질과 일관성을 유지하기 위한 파이프라인을 설계합니다.
재현 가능한 실험
훈련 자동화하기
코드와 환경을 철저히 통제하여 모델을 학습시키고, 체계적으로 추적하여 언제든 재현 가능한 실험 환경을 구축합니다.
강건한 평가
검증하고 평가하기
단순한 정확도를 넘어 모델의 강건성, 오류 사례, 적용 맥락의 요구사항을 다각도로 검토하여 실제 사용 전 신뢰성을 확인합니다.
데브옵스
인프라와 배포
AWS 혹은 Docker 환경에서 모델을 배포하고, 지속적인 통합과 자동화를 통해 모델이 실제 환경에서 안정적으로 운영될 수 있도록 합니다.
시스템 관측 가능성
모니터링과 피드백 루프
배포된 AI 시스템의 로그, 리소스, 예측 결과를 실시간으로 수집하고 시각화하여 파이프라인 내부 상태를 투명하게 관측합니다.
Research
연구 기록
연구는 별도 실적 목록이 아니라, 프로젝트에서 사용한 모델링과 평가 판단의 배경으로 연결됩니다.
복부수술 환자의 간호감시를 위한 딥러닝 기반 진단명 분류 모델
NLP/LLM 시스템의 성능을 단순 정확도가 아니라 도메인 데이터 구조와 오류 분포까지 함께 판단해야 한다는 포트폴리오 주장을 보강한다.
EMR 기반 간호감시 자동 ICD 코딩 시스템
수료와 수상
학습과 실무 기반을 보강한 이력
자격과 수상은 주장이 아니라 프로젝트 근거를 보강하는 보조 신호입니다.
데브옵스 환경의 모니터링과 테스트 실전구현
LLOYDK / 2023.11
Elastic 기반 DevOps 모니터링 및 테스트 실무 교육을 이수했습니다.
Multi Cloud Orchestration Program
5Works / 2023.12
HashiCorp 기반 멀티 클라우드 오케스트레이션 및 IaC 교육을 이수했습니다.
기업주도 집중프로젝트 교육
디케이테크인 / 2024.02
보안 및 DevOps 엔지니어링 중심의 기업 연계 실무 교육에 참여했습니다.
소프트웨어 전문인재 Micro Degree
가천대학교 / 2024.02
소프트웨어 전문인재 양성을 위한 마이크로디그리 과정을 이수했습니다.
공식 검토는 이력서로, 기술 검토는 케이스로 이어집니다
데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 바탕으로 문제 정의부터 구현, 검증, 전달까지 이어지는 작업을 수행합니다.