Pipeline텍스트 → 이미지중간 크레딧

영상 데이터 전처리 파이프라인

BGR 읽기 → 크롭 → CLAHE → 리사이즈 → 정규화 → 텐서 변환의 5단계 컴퓨터비전 전처리.

한국어·중국어 텍스트 렌더링 안내

현재 AI 이미지 모델은 빽빽한 CJK 텍스트 렌더링이 불안정합니다. '복사' 또는 '생성기에서 열기'를 누르면 텍스트 렌더링 가이드(짧은 라벨, 인용부호, 흔한 단어 우선)가 자동으로 덧붙습니다. 그래도 약 10% 문자 오류는 남을 수 있어요 — 출판용 도식은 AI 결과를 80% 초안으로 보고 핵심 라벨은 Figma / Illustrator 텍스트로 덮어쓰는 걸 권장합니다.

사용 시점

컴퓨터 비전 모델 학습 파이프라인 도식, 데이터 전처리 발표, 영상 분류 코드베이스 시각화.

프롬프트 본문

영상 데이터 전처리 파이프라인 도식을 그려라. 그림 안의 모든 텍스트는 한국어. 영어 단어 사용 금지(BGR, RGB 같은 색상 약자만 허용).

레이아웃: 좌에서 우로 5단계 흐름, 각 단계는 둥근 사각형.

단계 1: 영상 읽기
- 라벨: "BGR 영상 읽기"
- 출력 형상: "(높이, 너비, 3)"
- 작은 일러스트: 카메라 아이콘 → BGR 채널 분리 시각화

단계 2: 영역 크롭
- 라벨: "OSD 영역 크롭"
- 부가: "관심 영역만 추출"
- 일러스트: 점선 사각형으로 크롭 영역 표시

단계 3: 대비 향상
- 라벨: "CLAHE 적용"
- 부가: "히스토그램 균등화로 대비 향상"
- 일러스트: 어두운 영상 → 선명한 영상 비교

단계 4: 리사이즈
- 라벨: "리사이즈 720x1280"
- 부가: "기본 해상도로 변환"
- 일러스트: 큰 사각형 → 작은 사각형 화살표

단계 5: 정규화 및 텐서 변환
- 라벨: "RGB 변환 + 0~1 스케일링 + 평균/표준편차 정규화"
- 부가: "ImageNet 통계 사용"
- 출력: "텐서 (3, 720, 1280) float32"

각 단계 사이에 화살표 + 변환 결과 라벨.

각 학습 샘플이 반환하는 3가지(우측 박스):
1. 영상 텐서: (3, 720, 1280) float32
2. 분류 라벨: 0, 1, 2 중 하나
3. 정규화 시정거리: 0~1 범위 실수

분류 기준 박스(하단):
- 0: 50m 미만
- 1: 50m 이상 10km 이하
- 2: 10km 초과

스타일:
- 학술 코드베이스 시각화 스타일
- 색상: 청록 + 회색 + 주황 강조
- 모든 박스는 둥근 모서리
- 글씨는 또렷하게, 오타 없도록

변형

데이터 증강 단계 추가

단계 4와 5 사이에 "데이터 증강" 단계를 추가하고, 회전/뒤집기/색상 지터링 작은 아이콘 3개를 표시.

작성 팁

  • 각 단계의 출력 형상(텐서 차원)을 명시하면 코드 리뷰에 유용.
  • CLAHE는 한국어로 풀어 쓰지 않고 약자 그대로 — 분야 표준.
  • 우측의 "샘플 반환 3가지" 박스는 데이터셋 클래스의 인터페이스를 명확히 보여줌.

자주 묻는 질문

지금 이 프롬프트 시도하기

생성기에 자동으로 채워진 상태로 열립니다.

이 프롬프트 시도

관련 프롬프트