SYS_SHEET_01 / COVER

Portfolio for Technical Review

Data & Applied AI Engineer

데이터 구조화, AI 개발 흐름, NLP/LLM 평가 경험을 바탕으로 문제 정의부터 구현, 검증, 전달까지 이어지는 작업을 수행한다.

[SYS_ROLE: EXECUTIVE_SUMMARY] · 역할 요약

Data Systems 그래프 네이티브 깊이를 가진 데이터 시스템 스페셜리스트

이질적인 데이터를 모델과 시스템이 함께 다룰 수 있는 표현, 파이프라인, 그래프 구조로 바꿉니다.

AI-DLC / MLOps AI-DLC 기반 운영형 MLOps 엔지니어

AI 작업의 실행 기록, 산출물, 모델 행동, 피드백 경로를 다시 검토하고 개선할 수 있게 만듭니다.

NLP / LLM 응용 NLP 및 LLM 연구 엔지니어

언어 모델 연구 경험을 실제 시스템에서 더 나은 모델링과 평가 판단으로 번역합니다.

[SYS_EVIDENCE: VERIFICATION_MATRIX]

증거 항목 (Evidence)	Data Systems	AI-DLC / MLOps	NLP / LLM
대표 프로젝트 (Featured Cases)
2026 / 개인 주도형 ML 플랫폼 프로젝트 Contexta: 로컬 퍼스트 ML Observability 프로젝트	연결된 축	주요 역할	—
2026 / 그래프 시스템 엔진 프로젝트 Lynxes: 그래프 분석 엔진 프로젝트	주요 역할	연결된 축	—
2025 / 의료 AI 연구 EMR 기반 간호감시 자동 ICD 코딩 시스템	연결된 축	—	주요 역할
2024 / 사내 커머스 플랫폼 Dalkom Shop: 임직원 전용 마일리지 커머스 플랫폼	연결된 축	주요 역할	—
2024 / LLM 응용 프로토타입 Devridge: 개발자를 위한 LLM 기반 피드백 브리지	—	연결된 축	주요 역할
2023 / 협업형 NLP 프로젝트 BloGeek: 블로그 프로젝트	—	연결된 축	주요 역할
2023 / 대화형 AI 프로젝트 FRIMO: 정서적 지원과 일기 생성을 위한 대화형 AI	—	연결된 축	주요 역할
연구 논문 (Research Papers)
2026 / 연구 논문 고도화된 임상 의사결정을 위한 문맥 적응형 게이트 임베딩 프레임워크	연결된 축	—	주요 역할
2025 / 연구 논문 복부수술 환자의 간호감시를 위한 딥러닝 기반 진단명 분류 모델	연결된 축	—	주요 역할
2025 / 연구 논문 AI 피드백 기반 강화학습을 이용한 공감 대화 생성 모델	—	—	주요 역할
교육과 학업 스터디 (Capability Studies)
2023 / 학습 스터디 NEKA: NLP 스터디 (KoBERT)	—	—	주요 역할
2023 / 학습 스터디 수나로움: 금융 AI 스터디	—	연결된 축	주요 역할
2022 / 학습 스터디 이다: 추천 시스템 스터디 (지식 그래프)	주요 역할	—	—
2022 / 학습 스터디 MLADS: 머신러닝 기초 스터디	주요 역할	연결된 축	—

SYS_SHEET_02 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

머신러닝 실험과 배포 과정에서는 메타데이터, 레코드, 아티팩트가 여러 도구에 흩어지기 쉽고, 재현 가능한 observability 흐름을 유지하기 어렵습니다.

EXEC 핵심 결정

`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.

OK 결과

ML 시스템의 실행 이력과 산출물을 로컬에서 일관되게 관리하고 조사할 수 있는 observability 기반을 구현했습니다.

[SYS_FLOW: ARCHITECTURE]

Python facade, CLI, workspace storage, report/recovery 흐름이 같은 contract를 공유하는 로컬 퍼스트 ML observability 구조입니다.

Python API → CLI → Canonical Contract → Local Workspace → Reports & Recovery

[SYS_SPEC: CONSTRAINTS] · 제약 제어

외부 백엔드 없이 로컬 workspace만으로 동작해야 했습니다.
라이브러리 API와 CLI가 같은 contract를 공유해야 했습니다.
실행 기록, 아티팩트, 비교 리포트, 복구 흐름을 하나의 경험으로 묶어야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

Canonical workspace

`.contexta/` workspace를 기준으로 메타데이터, 레코드, 아티팩트를 분리 저장했습니다.

근거: 사용자가 로컬 파일 시스템에서도 실행 이력을 신뢰할 수 있게 하기 위해서입니다.

EXEC

Schema-first contract

캡처, 조회, 비교, 복구 기능이 동일한 데이터 계약을 따르도록 설계했습니다.

근거: 기능이 늘어나도 데이터 의미가 흩어지지 않게 하기 위해서입니다.

ML 도구는 모델 성능뿐 아니라 실행 흔적을 얼마나 다시 설명할 수 있는지가 제품성을 좌우한다는 점을 확인했습니다.

[SYS_ROLE: TELEMETRY]

연결된 축 Data Systems

주요 역할 AI-DLC / MLOps

— NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Local-first · Architecture

Schema-first · Contract

Trace / Compare / Recover · Workflow

AI 실행 기록과 산출물을 추적, 비교, 복구할 수 있는 운영형 observability 설계 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면

structuredhybrid

AI-DLC 단계

dataexperimentevaluationobservabilityfeedback-recovery

SYS_SHEET_03 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

기존 Python 그래프 라이브러리나 범용 데이터프레임 래퍼만으로는 메모리 효율, 탐색 성능, 지연 실행 기반 최적화를 함께 만족시키기 어려웠습니다.

EXEC 핵심 결정

GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.

OK 결과

Arrow 컬럼 메모리 모델과 CSR 기반 그래프 탐색, lazy collect 실행 흐름을 갖춘 그래프 분석 엔진의 기반을 마련했습니다.

[SYS_FLOW: ARCHITECTURE]

Arrow RecordBatch, CSR 인덱스, lazy logical plan, Rust 알고리즘, Python 바인딩을 결합한 그래프 분석 엔진 구조입니다.

Arrow RecordBatch → GraphFrame → CSR Index → LogicalPlan → Python Bindings

[SYS_SPEC: CONSTRAINTS] · 제약 제어

노드와 엣지 데이터를 컬럼 지향 구조로 다뤄야 했습니다.
이웃 탐색은 선형 스캔이 아니라 그래프 구조에 맞는 복잡도를 가져야 했습니다.
Rust 엔진과 Python 사용성 사이의 경계를 안정적으로 설계해야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

Arrow-owned GraphFrame

GraphFrame이 Arrow RecordBatch를 직접 소유하도록 설계했습니다.

근거: 컬럼 지향 메모리 효율과 Python 분석 생태계와의 연결 가능성을 함께 얻기 위해서입니다.

EXEC

CSR adjacency index

EdgeFrame에 CSR 기반 인접성 인덱스를 결합해 이웃 조회를 O(degree)로 만들었습니다.

근거: 그래프 탐색을 범용 테이블 스캔이 아니라 그래프 네이티브 연산으로 다루기 위해서입니다.

EXEC

Lazy logical plan

질의 연결은 LogicalPlan으로 누적하고 실제 계산은 `.collect()`에서 수행하도록 설계했습니다.

근거: 분석 파이프라인을 최적화 가능한 실행 흐름으로 유지하기 위해서입니다.

시스템 성능은 알고리즘만이 아니라 데이터 소유권, 메모리 레이아웃, 사용자 API가 함께 맞물릴 때 설득력을 갖는다는 점을 확인했습니다.

[SYS_ROLE: TELEMETRY]

주요 역할 Data Systems

연결된 축 AI-DLC / MLOps

— NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

O(degree) · Neighbor lookup

Arrow · Memory model

Lazy collect · Execution

그래프 데이터를 1급 실행 모델로 다루는 시스템 설계와 구현 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면

structuredgraphhybrid

AI-DLC 단계

dataexperimentevaluation

SYS_SHEET_04 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

간호감시에 필요한 진단 관련 신호가 검사 데이터, 환자정보, 간호기록 등 이질적인 EMR 소스에 분산되어 있었습니다.

EXEC 핵심 결정

간호 텍스트를 두 개의 KM-BERT 모델로 독립 학습하고 raw logits를 평균해 텍스트 표현의 안정성을 높였습니다.

OK 결과

최종 모델은 단순 전체 점수보다 희소 클래스 재현율과 실무 사용 가능성을 함께 확인할 수 있는 결과를 보였습니다.

[SYS_FLOW: ARCHITECTURE]

구조화 EMR과 간호 텍스트를 병렬로 처리한 뒤 스태킹 분류기로 결합하는 의료 AI 파이프라인입니다.

Structured EMR → Nursing Text → Dual KM-BERT → PCA + XGBoost → Rare-class Evaluation

[SYS_SPEC: CONSTRAINTS] · 제약 제어

의사 판독문이나 퇴원기록 같은 사후 문서에 의존하지 않아야 했습니다.
희소 클래스에서도 실무적으로 의미 있는 재현율을 확보해야 했습니다.
구조화 데이터와 한국어 임상 텍스트를 함께 다뤄야 했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

이중 KM-BERT 표현

간호 텍스트를 두 개의 KM-BERT 모델로 독립 학습하고 raw logits를 평균해 텍스트 표현의 안정성을 높였습니다.

근거: 임상 텍스트 신호의 변동성을 줄이고 앙상블 효과를 얻기 위해서입니다.

EXEC

PCA와 XGBoost 스태킹

BERT 기반 표현을 PCA로 축소한 뒤 XGBoost를 메타 분류기로 사용했습니다.

근거: 고차원 임베딩과 구조화 EMR 피처를 함께 다루면서 과적합 위험을 낮추기 위해서입니다.

의료 AI에서는 단순 최고 점수보다 어떤 문서와 피처를 언제 사용할 수 있는지가 실제 적용 가능성을 좌우한다는 점을 배웠습니다.

[SYS_ROLE: TELEMETRY]

연결된 축 Data Systems

— AI-DLC / MLOps

주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Balanced · Evaluation Scope

Core EMR · Available Data

High · Rare-class Recall

이질적인 구조화 EMR과 한국어 임상 텍스트를 평가 가능한 NLP 파이프라인으로 결합한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면

structuredtexthybrid

AI-DLC 단계

datatrainingevaluation

[SYS_LINK: ARTIFACTS]

Published paper 논문

SYS_SHEET_05 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

사내 전용 커머스 플랫폼은 검색, 알림, 관리자 기능을 안정적으로 뒷받침할 수 있는 클라우드 인프라와 운영 체계가 필요했습니다.

EXEC 핵심 결정

React와 Spring 기반 서비스가 배포, 운영, 모니터링 흐름 안에서 동작하도록 CI/CD와 클라우드 기반을 정리했습니다.

OK 결과

폐쇄형 사내 마일리지 몰을 위한 실무형 서비스 기반을 팀 프로젝트 안에서 구축했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

Platform foundation

React와 Spring 기반 서비스가 배포, 운영, 모니터링 흐름 안에서 동작하도록 CI/CD와 클라우드 기반을 정리했습니다.

[SYS_ROLE: TELEMETRY]

연결된 축 Data Systems

주요 역할 AI-DLC / MLOps

— NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

CI/CD + Cloud · Foundation

서비스 기능이 실제 운영 환경에서 동작할 수 있도록 배포, 보안, 관측 가능성 기반을 정리한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면

structuredimagehybrid

AI-DLC 단계

datadeploymentobservabilityfeedback-recovery

SYS_SHEET_06 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

솔로 개발자는 UI, 성능, 코드 품질 등 여러 관점의 피드백이 필요하지만, 적절한 시점에 역할별 의견을 얻기 어렵습니다.

EXEC 핵심 결정

응답이 범용 조언으로 흐르지 않도록 역할별 제약과 입력 맥락을 분리했습니다.

OK 결과

구조화된 프롬프트와 역할 제약을 통해 LLM 응답을 더 실용적인 프로젝트 피드백으로 바꾸는 프로토타입을 구현했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

Role-aware prompting

응답이 범용 조언으로 흐르지 않도록 역할별 제약과 입력 맥락을 분리했습니다.

[SYS_ROLE: TELEMETRY]

— Data Systems

연결된 축 AI-DLC / MLOps

주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Role-based · Feedback modes

역할 기반 제약과 구조화된 입력으로 LLM 출력을 실무 검토 경험에 맞추는 설계 역량을 보여줍니다.

[SYS_SPEC: METADATA]

데이터 표면

text

AI-DLC 단계

dataexperimentinferenceevaluation

SYS_SHEET_07 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

서비스는 블로그 콘텐츠 흐름을 더 풍부하게 만들기 위해 텍스트의 감성 극성을 분류하고, 문장 스타일 변형을 생성할 수 있는 머신러닝 구성 요소가 필요했습니다.

EXEC 핵심 결정

극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.

OK 결과

웹 서비스 맥락에서 활용 가능한 감성 분류 및 스타일 변환 AI 모듈을 제공했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

KoBERT와 KoBART 분리

극성 분류는 KoBERT, 스타일 변환은 KoBART 파이프라인으로 나누어 구현했습니다.

[SYS_ROLE: TELEMETRY]

— Data Systems

연결된 축 AI-DLC / MLOps

주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Classification + Generation · Model scope

분류와 생성 기반 한국어 NLP 모델을 제품형 웹 서비스 기능으로 연결한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면

text

AI-DLC 단계

dataexperimenttraininginferenceevaluation

SYS_SHEET_08 / CASE_STUDY

[SYS_PIPELINE: TIMELINE]

WARN 문제

서비스는 사용자 대화에서 감정을 인식하고, 이를 일기 생성 흐름과 연결할 수 있는 머신러닝 구성 요소가 필요했습니다.

EXEC 핵심 결정

KoBERT 기반 감정 인식 모델을 중심으로 챗봇과 요약 흐름이 연결되도록 지원했습니다.

OK 결과

감정 인식 중심의 ML 파이프라인을 포함한 MVP 수준의 대화형 일기 경험을 구현했습니다.

[SYS_DECISIONS: DESIGN_TRADE_OFFS] · 설계 결정과 트레이드오프

EXEC

Emotion-first ML pipeline

KoBERT 기반 감정 인식 모델을 중심으로 챗봇과 요약 흐름이 연결되도록 지원했습니다.

[SYS_ROLE: TELEMETRY]

— Data Systems

연결된 축 AI-DLC / MLOps

주요 역할 NLP / LLM

[SYS_METRIC: IMPACT] · 검토 포인트

Korean NLP · Pipeline

한국어 NLP 모델을 사용자 흐름 안에서 동작하는 서비스형 AI 파이프라인으로 연결한 작업입니다.

[SYS_SPEC: METADATA]

데이터 표면

text

AI-DLC 단계

dataexperimenttraininginferenceevaluation

SYS_SHEET_09 / RESEARCH_CASE

[SYS_RESEARCH: ABSTRACT]

ICU 임상 의사결정 지원을 위해, 부분 라벨 기반 자동 ICD 코딩으로 추정한 진단 문맥을 불규칙 시계열과 결합하고, 문맥 적응형 게이팅을 통해 기계환기 전이 사건을 예측하는 계층형 프레임워크를 제안한 연구이다. 진단 문맥을 하위 시계열 해석에 재주입함으로써 희귀 전이 이벤트 탐지 성능을 크게 높였다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 자동 ICD 코딩에서 얻은 진단 문맥을 ICU 시계열 예측에 재주입하는 문맥 적응형 게이트 임베딩 프레임워크를 제안했다.

설계 방법론: 부분 라벨 기반 진단 문맥, TCN 시계열 표현, 게이팅 구조를 결합해 희귀 전이 이벤트 예측을 강화했다.

[SYS_ROLE: TELEMETRY]

주요 역할 NLP / LLM

연결된 축 Data Systems

[SYS_METRIC: RELEVANCE]

데이터 표면을 분리해 처리하는 대신 진단 문맥과 시계열 신호를 계층적으로 연결하는 모델링 판단을 보여준다.

[SYS_RESEARCH: BIBTEX]

@article{math14081397,
  title={A Context-Adaptive Gated Embedding Framework for Advanced Clinical Decision-Making},
  author={Donghyeon Kim, Daeho Kim, Okran Jeong},
  journal={Mathematics},
  volume={14},
  number={8},
  year={2026}
}

[SYS_SPEC: METADATA]

임상 의사결정지원시스템자동 ICD 코딩ICU 시계열기계환기 예측부분 라벨 학습극단 다중분류TCN게이팅희귀 이벤트 탐지

SYS_SHEET_010 / RESEARCH_CASE

[SYS_RESEARCH: ABSTRACT]

복부수술 환자의 EMR에서 검사 데이터, 환자정보, 간호기록을 통합하여 간호감시를 지원하기 위한 자동 ICD 코딩 모델을 제안한 연구이다. KM-BERT 이중 앙상블과 XGBoost, PCA를 결합한 스태킹 구조를 통해 기존 단일 모델 및 단순 앙상블보다 더 높은 진단명 분류 성능을 보였다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 간호감시 맥락의 자동 ICD 코딩을 위해 EMR 정형 정보와 간호기록을 결합한 딥러닝 분류 모델을 제안했다.

설계 방법론: KM-BERT 앙상블, PCA, XGBoost 스태킹을 통해 희소 진단명과 도메인 민감 label을 평가했다.

[SYS_ROLE: TELEMETRY]

주요 역할 NLP / LLM

연결된 축 Data Systems

[SYS_METRIC: RELEVANCE]

NLP/LLM 시스템의 성능을 단순 정확도가 아니라 도메인 데이터 구조와 오류 분포까지 함께 판단해야 한다는 포트폴리오 주장을 보강한다.

[SYS_RESEARCH: BIBTEX]

@article{kim2025deep,
  title={Deep Learning based Automatic ICD Coding for Nursing Surveillance of Abdominal Surgery Patients},
  author={Donghyeon Kim, Daeho Kim, Seyoung Kim, Okran Jeong},
  journal={Journal of The Korea Society of Computer and Information},
  volume={30},
  number={5},
  pages={21--30},
  year={2025},
  publisher={The Korean Society Of Computer And Information}
}

[SYS_SPEC: METADATA]

의료 AI간호감시EMR자동 ICD 코딩딥러닝KM-BERTXGBoost앙상블복부수술

SYS_SHEET_011 / RESEARCH_CASE

[SYS_RESEARCH: ABSTRACT]

기존 공감 대화 생성 모델의 낮은 다양성과 인간 피드백 의존 문제를 해결하기 위해, AI 기반 피드백(RLAIF)을 활용한 강화학습 공감 대화 생성 모델을 제안한 연구이다. LLM을 평가자로 활용하여 보상을 구성하고, EmpRL 구조에 통합함으로써 더 다양한 공감 응답 생성을 달성했다.

[SYS_RESEARCH: BACKGROUND] · 연구 배경

본 연구는 해당 도메인의 핵심 병목과 학술적 한계를 돌파하기 위해 설계되었습니다. EMR 정형 데이터와 비정형 텍스트/임베딩 도메인의 복잡성을 다루며, 단순 정확도를 넘어 실무적 가치를 창출하는 모델링 판단을 담고 있습니다.

[SYS_RESEARCH: METHODOLOGY] · 핵심 기여

학술 기여 주장: 공감 대화 생성에서 인간 피드백 의존을 줄이기 위해 AI 피드백 기반 강화학습 구조를 제안했다.

설계 방법론: LLM 평가자를 보상 모델처럼 활용하고 PPO 기반 정책 업데이트로 응답 다양성과 공감 수준을 조정했다.

[SYS_ROLE: TELEMETRY]

주요 역할 NLP / LLM

[SYS_METRIC: RELEVANCE]

LLM 응답 품질을 프롬프트 결과가 아니라 평가자, 보상, 정책 업데이트가 연결된 시스템 판단으로 다뤄야 한다는 관점을 보강한다.

[SYS_RESEARCH: BIBTEX]

@inproceedings{joo2025empathetic,
  title={Empathetic Dialogue Generation Model Using Reinforcement Learning with AI-Based Feedback},
  author={Yongwan Joo, Donghyun Lim, Donghyeon Kim, Seungyeon Sun, Okran Jeong},
  booktitle={Proceedings of the Korea Computer Congress 2025},
  pages={2410--2412},
  year={2025}
}

[SYS_SPEC: METADATA]

공감 대화강화학습RLAIFRLHF 대체LLM대화 생성자연어처리AI 피드백

SYS_SHEET_12 / CREDENTIALS_GROWTH

[SYS_CREDENTIAL: PATHWAY] · 자격 및 학습 경로

// 01_ACADEMIC_STUDIES

2024.03 - 2026.02

Gachon University

인공지능 전공 석사 · GPA 4.14/4.5. Intelligent Data Analytics Lab. 지도교수 OkRan Jeong. 임상 AI, 평가, 구현 중심 연구 전달을 중심으로 연구를 수행하고 있습니다.

FOCUS: 인공지능 특론, 그래프 신경망(GNN), 의료 시계열 데이터 분석

2019.03 - 2024.02

Gachon University

소프트웨어학과 학사 · 공식 프로그래밍 동아리 활동과 기본 ML, 심화 ML, 금융 ML, GNN 등 다양한 스터디 그룹 운영을 통해 리더십과 커뮤니티 운영 경험을 쌓았습니다.

FOCUS: 자료구조, 알고리즘, 선형대수학, 통계적 기계학습

// 02_PROFESSIONAL_COURSES

2023.11

데브옵스 환경의 모니터링과 테스트 실전구현

LLOYDK · Elastic 기반 DevOps 모니터링 및 테스트 실무 교육을 이수했습니다.

2023.12

Multi Cloud Orchestration Program

5Works · HashiCorp 기반 멀티 클라우드 오케스트레이션 및 IaC 교육을 이수했습니다.

2024.02

기업주도 집중프로젝트 교육

디케이테크인 · 보안 및 DevOps 엔지니어링 중심의 기업 연계 실무 교육에 참여했습니다.

2024.02

소프트웨어 전문인재 Micro Degree

가천대학교 · 소프트웨어 전문인재 양성을 위한 마이크로디그리 과정을 이수했습니다.

// 03_CONTINUOUS_LEARNING

2024.03

AWS Builders Online Series 이수

AWS · 서버리스 아키텍처 및 Amazon Bedrock 기반 생성형 AI 어플리케이션 통합 워크플로 학습

2023.08

오픈소스 NLP/LLM 지속 학습

Community · 오픈소스 LLM 경량 최적화(LoRA, QLoRA) 기법 및 RAG 패턴 기반 검색 증강 생성 실무 아키텍처 분석

[SYS_LOG: PIPELINE_EXECUTION] · 시스템 훈련 로그

[INFO] 2026-05-25 02:09:03 - Initializing training pipeline...

[SPEC] CUDA Version: 12.2 / Device: NVIDIA RTX 4090 x2

[LOAD] Loading pretrained model: kobert-base-v3-medical
· Config: 12-layer, 768-hidden, 12-heads (110M Params)

[TRAIN] Epoch [4/10] - Step [4500/12000] - Loss: 0.1842
· Optimizer: AdamW (lr=3e-5) with linear warmups

[EVAL] Evaluating tokenization on clinical NER testsets...
· F1-Score: 0.8816 / Precision: 0.8842 / Recall: 0.8791

* SYSTEM SIMULATION LOG FOR VISUALIZATION PURPOSE.
* ALL SOURCE ALGORITHMS MAPPED TO LIVE PRODUCTION SERVICES.

[SYS_CREDENTIAL: STUDY_GROUPS] · 자기주도 역량 개발 스터디

NEKA

NLP 스터디

KoBERT를 활용한 Keyword Extraction 및 NER 모델 구현을 목표로 진행한 스터디

STACK: PyTorch, Transformers, KoBERT, Scikit-Learn

학습 목표 (OBJECTIVE):

KoBERT 기반 의학 및 국어 도메인의 형태소 분석, 중요 키워드 추출(Keyword Extraction), 개체명 인식(NER) 성능 고도화 및 도메인 특화 사전 구축 학습

주요 성과 (KEY OUTCOMES):

PyTorch와 Transformers 라이브러리를 활용해 KoBERT 모델 파인튜닝 파이프라인 설계 및 의학 임상 데이터 NER 처리 F1-Score 0.88 달성 및 시각화 구현

핵심 배움 (LESSONS LEARNED):

"Attention Map 레이어 분석을 통해 의료 전문 용어의 토큰 경계 분절 현상을 정교하게 튜닝하였으며, 도메인 특화 어휘 임베딩 튜닝이 엔티티 boundary 경계 인식에 미치는 높은 민감도를 실증함"

연계 문헌 (RESEARCH REFERENCE):

Attention Is All You Need (Vaswani et al., 2017) 및 BERT (Devlin et al., 2018)의 트랜스포머 아키텍처 이론 분석

수나로움

금융 AI 스터디

기업의 재무제표와 금융지표를 기반으로 매수 추천 여부를 평가하는 모델을 목표로 진행한 스터디

STACK: XGBoost, Pandas, Numpy, Backtrader

학습 목표 (OBJECTIVE):

금융 시계열 거시 경제 지표 및 재무제표 텍스트 데이터를 멀티모달 형태로 결합하여 매수/매도 시그널을 생성하는 실무 퀀트 트레이딩 모델 아키텍처 설계

주요 성과 (KEY OUTCOMES):

재무 지표 변수 임베딩과 XGBoost 예측 모델을 결합하고 Backtrader를 활용해 수익률 극대화 및 최대 낙폭(MDD) 제어 성능을 검증하는 투자 백테스팅 시스템 설계

핵심 배움 (LESSONS LEARNED):

"이종 데이터(시계열+텍스트) 결합 시 단순 concatenation보다 gating 메커니즘을 적용하는 것이 노이즈가 많은 금융 도메인에서 모델 오버핏을 방지하고 강건한 일반화 신호 생성에 효과적임을 실증함"

연계 문헌 (RESEARCH REFERENCE):

Multimodal Deep Learning (Ngiam et al., 2011) 및 XGBoost: A Scalable Tree Boosting System (Chen et al., 2016) 수식 분석

이다

MLADS

머신러닝 기초 스터디

데이터사이언스와 머신러닝의 기본기를 체계적으로 학습하는 스터디

STACK: Python, NumPy, SciPy, Matplotlib

학습 목표 (OBJECTIVE):

확률분포, 베이지안 추론, 선형대수학 등 통계학적 기초 위에 머신러닝의 수렴성, 최적화 및 복잡한 정규화 메커니즘의 수학적 정형화를 깊이 있게 탐구하는 학습

주요 성과 (KEY OUTCOMES):

주요 차원 축소 알고리즘(PCA, t-SNE) 및 핵심 지도학습 수식들을 밑바닥(Scratch)부터 NumPy로 직접 수학적으로 유도하고 코드로 구현하여 수치적 최적화 신뢰도 검증

핵심 배움 (LESSONS LEARNED):

"수학적 수식을 증명하고 직접 알고리즘을 빌딩함으로써, 프레임워크 추상화 레이어 뒤에 숨겨진 그라디언트 소실(Vanishing Gradient) 및 로컬 미니마 최적화 제약 조건과 수렴 속도 한계를 깊이 있게 명확히 체득함"

연계 문헌 (RESEARCH REFERENCE):

Deep Learning (Goodfellow et al., 2016) 및 Pattern Recognition and Machine Learning (PRML) (Bishop, 2006) 확률론/선형대수 기초