배경
BloGeek은 React와 Spring으로 구성된 블로그 플랫폼 프로젝트였습니다. 저는 이 프로젝트에서 전체 웹 개발이 아니라 AI 파트만 담당했고, 텍스트 처리 기능을 보강할 수 있는 머신러닝 모듈을 만드는 역할에 집중했습니다.
문제
블로그 시스템이 더 풍부한 텍스트 경험을 제공하려면 단순한 게시 기능만으로는 부족했습니다. 머신러닝 관점에서는 문장의 감성 극성을 분류하고, 다양한 말투나 표현 스타일로 문장을 변환할 수 있는 NLP 구성 요소가 필요했습니다. 이런 기능은 콘텐츠 처리 자체에도 쓰일 수 있고, 데이터 확장 측면에서도 의미가 있었습니다.
구현
저는 두 가지 핵심 NLP 과제에 집중했습니다. 첫째, KoBERT 기반 분류기를 사용해 입력 문장이 긍정, 부정, 중립 중 어느 극성에 가까운지 판별하는 감성 극성 분류 모델을 구현했습니다. 둘째, KoBART 기반 스타일 변환 파이프라인을 다루며 한국어 문장을 여러 스타일로 바꾸는 작업에 기여했습니다. 이 과정에서 데이터셋 처리, 학습 및 추론 코드, 반복 실험을 통해 모델 품질과 동작을 다듬었습니다.
결과
프로젝트는 웹 애플리케이션 맥락에서 활용 가능한 극성 분류와 스타일 변환 AI 모듈을 갖추게 되었습니다. 개인적으로는 React + Spring 기반 팀 프로젝트 안에서 풀스택 전반이 아니라 머신러닝 레이어에 집중해, 한국어 분류 모델과 생성 모델을 실제 제품 흐름에 연결해본 경험이 큰 자산이 되었습니다.