Portfolio for Technical Review

Data & Applied AI Engineer

데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 실제 프로젝트와 연구 기록으로 설명합니다.

각 작업에서 문제 정의, 설계 판단, 구현 결과, 공개 가능한 산출물을 함께 확인할 수 있습니다.

Review Mode

먼저 볼 관점 선택

공식 기록과 역할 적합성을 먼저 보고, 대표 케이스로 기술 판단을 보강합니다.

Focus Areas

관심 분야별로 대표 작업을 다시 정렬합니다

데이터, AI 개발 흐름, NLP/LLM 관점 중 하나를 선택하면 관련성이 높은 프로젝트가 먼저 보입니다.

관심 분야를 누르면 대표 프로젝트의 읽는 순서가 바뀝니다.

관점을 선택하면 관련 프로젝트가 먼저 보입니다.

주요 작업
연결 신호
주요 작업
연결 신호
주요 작업

Development Flow

AI 프로젝트에서 반복해서 다룬 개발 흐름

한 프로젝트의 단계별 진행표가 아니라, 여러 프로젝트에서 반복적으로 다뤄온 데이터 준비, 실험, 평가, 배포, 기록 관리의 작업 방식을 요약합니다.

Structured Data 정형 데이터 설계

EMR 및 다양한 피처 테이블 등 관계형/정형 데이터 표현 및 스키마 설계

Text & Embedding 텍스트 및 임베딩

비구조화 텍스트 데이터의 토큰화 및 시맨틱 임베딩 공간 구조화

Knowledge Graph 지식 그래프

GNN 및 추천 모델에 연동 가능한 실시간 지식 그래프 구조 설계

Hybrid Pipeline 하이브리드 파이프라인

이질적인 데이터 소스들을 통합하여 고성능 처리가 가능한 파이프라인 구축

Data 데이터 표면

정형, 텍스트, 이미지, 그래프 입력을 목적에 맞는 구조로 정리합니다.

Experiment 실험 추적

가설, 설정, 메트릭, 산출물을 다시 검토할 수 있게 남깁니다.

Training 학습 흐름

재현 가능한 환경과 파이프라인으로 모델 학습을 관리합니다.

Evaluation 평가 설계

정확도만이 아니라 오류, 희소 클래스, 도메인 요구를 함께 확인합니다.

Deployment 전달 구조

검토 가능한 산출물과 실행 표면으로 결과를 전달합니다.

Observability 관측 가능성

로그, 아티팩트, 실행 기록을 통해 시스템 상태를 설명 가능하게 만듭니다.

Feedback / Recovery 복구와 개선

비교, 복구, 회고를 다음 개선 사이클로 연결합니다.

Language Modeling 언어 모델링

특정 도메인에 맞춘 사전 학습(Pre-training) 및 태스크 미세 조정(Fine-tuning)

Evaluation Design 평가 및 벤치마크

정확도 지표를 넘어 희소 클래스 오류, 편향, 도메인 제약을 고려한 다차원 평가 설계

Alignment & Preference 정렬 및 선호도

지시어 튜닝(Instruction tuning) 및 RLAIF/RLHF 등을 통한 인간/AI 선호도 정렬

Research-to-System 연구의 실무 전환

최신 NLP 논문 연구 성과를 실생활 웹 서비스 API 및 경량화 모델로 배포 및 통합

Project Records

프로젝트 기록

각 프로젝트의 제목과 설명은 위쪽에 두고, 데이터 형태와 공개 범위 같은 메타 정보는 별도 영역으로 분리했습니다.

Data Systems

그래프 네이티브 깊이를 가진 데이터 시스템 스페셜리스트

이질적인 데이터를 모델과 시스템이 함께 다룰 수 있는 표현, 파이프라인, 그래프 구조로 바꿉니다.

구현 완료

Contexta: 로컬 퍼스트 ML Observability 프로젝트

AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.

structuredhybrid
프로젝트 보기
구현 완료

Lynxes: 그래프 분석 엔진 프로젝트

그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.

structuredgraphhybrid
프로젝트 보기
논문 기반 / 요약 공개

EMR 기반 간호감시 자동 ICD 코딩 시스템

이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.

structuredtexthybrid
프로젝트 보기
구현 완료 / 요약 공개

Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼

서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.

structuredimagehybrid
프로젝트 보기
AI-DLC / MLOps

AI-DLC 기반 운영형 MLOps 엔지니어

AI 작업의 실행 기록, 산출물, 모델 행동, 피드백 경로를 다시 검토하고 개선할 수 있게 만듭니다.

구현 완료

Contexta: 로컬 퍼스트 ML Observability 프로젝트

AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.

structuredhybrid
프로젝트 보기
구현 완료

Lynxes: 그래프 분석 엔진 프로젝트

그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.

structuredgraphhybrid
프로젝트 보기
구현 완료 / 요약 공개

Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼

서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.

structuredimagehybrid
프로젝트 보기
프로토타입 / 요약 공개

Devridge: 개발자를 위한 LLM 기반 피드백 브리지

역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.

text
프로젝트 보기
구현 완료 / 요약 공개

BloGeek: 블로그 프로젝트

분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.

text
프로젝트 보기
구현 완료 / 요약 공개

FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI

한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.

text
프로젝트 보기
NLP / LLM

응용 NLP 및 LLM 연구 엔지니어

언어 모델 연구 경험을 실제 시스템에서 더 나은 모델링과 평가 판단으로 번역합니다.

논문 기반 / 요약 공개

EMR 기반 간호감시 자동 ICD 코딩 시스템

이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.

structuredtexthybrid
프로젝트 보기
프로토타입 / 요약 공개

Devridge: 개발자를 위한 LLM 기반 피드백 브리지

역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.

text
프로젝트 보기
구현 완료 / 요약 공개

BloGeek: 블로그 프로젝트

분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.

text
프로젝트 보기
구현 완료 / 요약 공개

FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI

한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.

text
프로젝트 보기

Project Comparison

문제, 결정, 결과가 함께 보이는 대표 작업

포트폴리오의 핵심은 프로젝트 목록이 아니라 판단 과정과 결과의 연결입니다.

Project Comparison

대표 프로젝트를 같은 기준으로 비교합니다

대표 프로젝트를 문제, 결정, 결과, 공개 범위 기준으로 먼저 비교한 뒤 상세 설명으로 이동합니다.

대표 케이스 문제 설계 판단 구현 결과 공개 범위 보기
Lynxes: 그래프 분석 엔진 프로젝트 그래프 시스템 엔진 프로젝트 / 2026 기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다. GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다. Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다. 구현 완료 공개 자료 보기
Contexta: 로컬 퍼스트 ML Observability 프로젝트 개인 주도형 ML 플랫폼 프로젝트 / 2026 머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다. `.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다. ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다. 구현 완료 공개 자료 보기
BloGeek: 블로그 프로젝트 협업형 NLP 프로젝트 / 2023 서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다. 극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다. 웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다. 구현 완료 요약 공개 보기

그래프 시스템 엔진 프로젝트 / 2026

Lynxes: 그래프 분석 엔진 프로젝트

Arrow 기반 컬럼 메모리와 그래프 네이티브 탐색 구조를 결합해 Python에서 사용할 수 있는 고성능 그래프 분석 엔진을 설계한 프로젝트입니다.

문제

기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다.

핵심 결정

GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.

결과

Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다.

개인 주도형 ML 플랫폼 프로젝트 / 2026

Contexta: 로컬 퍼스트 ML Observability 프로젝트

로컬 환경에서도 ML 실행 이력과 산출물을 일관된 contract로 추적, 비교, 복구할 수 있게 만든 observability 라이브러리 프로젝트입니다.

문제

머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다.

핵심 결정

`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.

결과

ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다.

협업형 NLP 프로젝트 / 2023

BloGeek: 블로그 프로젝트

블로그 서비스 안에서 감성 분류와 스타일 변환 모델을 실제 콘텐츠 흐름에 연결한 한국어 NLP 프로젝트입니다.

문제

서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다.

핵심 결정

극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.

결과

웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다.

프로세스

반복 가능한 작업 방식

연구, 실험, 구현, 전달을 어떤 순서로 엮는지 보여줍니다.

01

피처 엔지니어링

데이터의 구성과 관리

복잡한 데이터를 목적에 맞게 전처리하고, 데이터의 품질과 일관성을 유지하기 위한 파이프라인을 설계합니다.

02

재현 가능한 실험

훈련 자동화하기

코드와 환경을 철저히 통제하여 모델을 학습시키고, 체계적으로 추적하여 언제든 재현 가능한 실험 환경을 구축합니다.

03

강건한 평가

검증하고 평가하기

단순한 정확도를 넘어 모델의 강건성, 오류 사례, 적용 맥락의 요구사항을 다각도로 검토하여 실제 사용 전 신뢰성을 확인합니다.

04

데브옵스

인프라와 배포

AWS 혹은 Docker 환경에서 모델을 배포하고, 지속적인 통합과 자동화를 통해 모델이 실제 환경에서 안정적으로 운영될 수 있도록 합니다.

05

시스템 관측 가능성

모니터링과 피드백 루프

배포된 AI 시스템의 로그, 리소스, 예측 결과를 실시간으로 수집하고 시각화하여 파이프라인 내부 상태를 투명하게 관측합니다.

Research

연구 기록

연구는 별도 실적 목록이 아니라, 프로젝트에서 사용한 모델링과 평가 판단의 배경으로 연결됩니다.

한국컴퓨터정보학회논문지 / 2025

복부수술 환자의 간호감시를 위한 딥러닝 기반 진단명 분류 모델

NLP/LLM 시스템의 성능을 단순 정확도가 아니라 도메인 데이터 구조와 오류 분포까지 함께 판단해야 한다는 포트폴리오 주장을 보강한다.

EMR 기반 간호감시 자동 ICD 코딩 시스템

수료와 수상

학습과 실무 기반을 보강한 이력

자격과 수상은 주장이 아니라 프로젝트 근거를 보강하는 보조 신호입니다.

수료

데브옵스 환경의 모니터링과 테스트 실전구현

LLOYDK / 2023.11

Elastic 기반 DevOps 모니터링 및 테스트 실무 교육을 이수했습니다.

수료

Multi Cloud Orchestration Program

5Works / 2023.12

HashiCorp 기반 멀티 클라우드 오케스트레이션 및 IaC 교육을 이수했습니다.

수료

기업주도 집중프로젝트 교육

디케이테크인 / 2024.02

보안 및 DevOps 엔지니어링 중심의 기업 연계 실무 교육에 참여했습니다.

수료

소프트웨어 전문인재 Micro Degree

가천대학교 / 2024.02

소프트웨어 전문인재 양성을 위한 마이크로디그리 과정을 이수했습니다.

공식 검토는 이력서로, 기술 검토는 케이스로 이어집니다

데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 바탕으로 문제 정의부터 구현, 검증, 전달까지 이어지는 작업을 수행합니다.