새로운 Microsoft 파트너십으로 생성적 AI 개발 가속화
7월 11~12일 샌프란시스코에서 최고 경영진과 함께 리더들이 성공을 위해 AI 투자를 통합하고 최적화하는 방법을 들어보세요. 더 알아보기
올해 인공지능(AI)의 가장 뜨거운 트렌드 중 하나는 인기 있는 생성 AI 모델의 등장이었습니다. DALL-E 및 Stable Diffusion을 포함한 기술을 통해 점점 더 많은 스타트업과 사용 사례가 등장하고 있습니다.
Generative AI는 변환기 모델 사용을 포함한 다양한 기본 기술을 기반으로 구축됩니다. 생성 AI 및 기타 사용 사례에 변환기를 사용하면 시스템이 모델 결과를 예측하고 구축하는 추론 측면에서 리소스 집약적일 수 있습니다.
트랜스포머 모델에 대한 AI 추론을 가속화하는 데 도움이 되는 기술을 구축하고 있는 벤더 중에는 AI 가속기 하드웨어 기술 구축을 지원하기 위해 지난 4월 시리즈 A 자금 조달 라운드에서 4,400만 달러를 모금한 스타트업 d-Matrix가 있습니다. 이 회사는 아직 공개되지 않은 디지털 인 메모리 컴퓨팅(DIMC) 기술을 개발했지만 이미 Microsoft의 관심을 끌었습니다.
Microsoft와 d-Matrix는 오늘 Microsoft Project Bonsai 강화 학습이 d-Matrix DIMC 기술에서 지원될 것이라고 발표했습니다. 두 공급업체는 이를 통해 AI 추론을 크게 가속화할 수 있기를 바랍니다.
트랜스폼 2023
7월 11~12일 샌프란시스코에서 최고 경영진이 성공을 위해 AI 투자를 통합하고 최적화하고 일반적인 함정을 피한 방법을 공유합니다.
Microsoft의 수석 응용 AI 엔지니어인 Kingsuk Maitra는 VentureBeat에 "Project Bonsai는 우리 버전의 심층 강화 학습을 가능하게 하는 플랫폼이며 우리는 이를 머신 티칭이라고 부릅니다."라고 말했습니다. "우리는 d-Matrix의 독특한 디지털 인메모리 컴퓨팅 기술에 대한 컴파일러를 교육했으며 초기 결과는 매우 고무적입니다."
Project Bonsai는 지난 몇 년 동안 Microsoft에서 개발 중이며 현재 미리 보기로 제공됩니다.
Maitra는 이 노력의 목표가 심층 강화 학습 네트워크와 관련된 복잡성을 추상화하는 것이라고 말했습니다. Project Bonsai의 초기 목표는 칩 설계 및 제조를 포함한 산업 제어입니다. 기술의 일부는 Microsoft Project Bonsai에서 개발한 Inkling이라는 고급 언어를 사용하여 심층 강화 에이전트를 훈련시켜 제어 작업을 수행하는 모델을 훈련하는 기능입니다.
심층 강화 학습에는 레이블이 지정된 데이터가 필요하지 않다고 Maitra는 설명했습니다. 오히려 본질적으로 시뮬레이터로 에뮬레이트할 수 있는 환경의 피드백을 통해 학습합니다. 훈련 루프가 끝나면 Microsoft가 "브레인"이라고 부르는 훈련된 RL(강화 학습) 에이전트가 생성됩니다. 두뇌는 배포되면 당면한 작업을 완료하기 위해 의미 있는 조치를 취할 수 있습니다.
Maitra는 "우리는 실제 작업 부하를 실행하고 실제 작업 부하와 관련하여 컴파일러를 교육하고 있으며 대부분은 다양한 Bonsai 두뇌를 갖춘 잘 알려진 대규모 언어 모델을 사용하고 있습니다"라고 말했습니다.
현재 d-Matrix에는 공개적으로 사용 가능한 칩이 없지만 코드명 Corsair라는 첫 번째 칩은 2023년에 데뷔할 예정입니다.
d-Matrix의 공동 창업자이자 CTO인 Sudeep Bhoja는 VentureBeat에 "우리는 트랜스포머를 위한 가속 컴퓨팅 플랫폼을 구축하고 있으며 특히 생성 AI에 중점을 두고 있습니다."라고 말했습니다.
Bhoja는 d-Matrix가 개발 중인 칩이 매우 모듈식 방식으로 구축될 수 있으며 CPU와 함께 패키지되거나 클라우드의 서버에 연결되는 PCI 카드에 통합될 수 있다고 설명했습니다. d-Matrix 기술은 고성능과 낮은 대기 시간을 제공하는 DIMC 기술을 통해 AI 추론을 가속화하도록 설계되었습니다.
Microsoft의 Project Bonsai를 통해 d-Matrix는 이제 자사 실리콘에 대한 심층 강화 학습 도구를 구축할 수 있는 컴파일러를 갖게 되었습니다. d-Matrix의 주요 최종 목표는 생성 AI 모델의 지속적인 성장과 배포를 지원하는 것입니다.
Bhoja는 "우리는 처리 능력이 많이 필요하고 대기 시간 제약이 있으며 사용자가 직면하는 문제이기 때문에 [생성 AI 모델]을 활성화하고 싶습니다."라고 말했습니다. "데이터 센터가 더 많은 전력을 공급할 필요가 없도록 매우 에너지 효율적인 방식으로 이를 수행할 수 있어야 합니다…."