← 홈으로 돌아가기
🏗️

AI Infrastructure & MLOps

대규모 AI 인프라와 ML 파이프라인 구축

MLOpsAdvanced36시간

이 모듈은 현재 개발 중입니다. 곧 완성된 콘텐츠로 만나보실 수 있습니다.

예정된 챕터

AI 인프라 개요

대규모 AI 시스템 아키텍처

120

분산 학습

Data Parallel, Model Parallel, Pipeline Parallel

240

ML 파이프라인

Kubeflow, MLflow로 ML 파이프라인 구축

210

모델 서빙

TensorFlow Serving, TorchServe, Triton

180

피처 스토어

Feast, Tecton으로 피처 관리

150

모델 모니터링

모델 드리프트 감지와 성능 추적

180

실험 추적

MLflow, Weights & Biases, Neptune

150

GPU 오케스트레이션

GPU 클러스터 관리와 스케줄링

210

데이터 버전 관리

DVC, LakeFS로 데이터 버전 관리

120

ML CI/CD

머신러닝을 위한 CI/CD 파이프라인

180

AI 인프라 비용 최적화

GPU 리소스 최적화와 비용 관리

120

프로덕션 사례 연구

대규모 AI 시스템 구축 사례

150

예정된 시뮬레이터

AI 인프라 아키텍트

대규모 AI 시스템 아키텍처 설계

분산 학습 시뮬레이터

멀티 GPU 분산 학습 환경

MLOps 파이프라인 빌더

End-to-End ML 파이프라인 구축

모델 모니터링 대시보드

실시간 모델 성능 추적

모델 서빙 최적화기

인퍼런스 성능 최적화

실험 추적 시스템

ML 실험 관리 도구

피처 스토어 시뮬레이터

피처 엔지니어링 파이프라인

GPU 스케줄러

GPU 리소스 할당 최적화

드리프트 감지기

데이터/모델 드리프트 감지

AI 비용 분석기

인프라 비용 분석 및 최적화