실시간 영상은 왜 쿠버네티스에서 어려웠을까: WebRTC 스트리밍 아키텍처 개선기
쿠버네티스 Native WebRTC architecture
Plaid Labs AI 에이전트 Part. 2: 필요한 Context만 사용하는 방법
플래드랩스가 필요한 context를 뽑을 수 있었던 방법
NVIDIA Blackwell 전용 추론 엔진 NVFP4를 활용한 vLLM 로컬 모델 서빙
NVFP4를 쉬운 비유와 실전 예시로 설명하고, Blackwell 듀얼 GPU에서 vLLM 로컬 서빙을 안정적으로 운영하는 방법을 정리한 가이드.