- 구글은 모든 사람을 위한 유용한 AI를 만드는 데 믿음을 가지고 있으며, Transformers, TensorFlow, BERT, T5, JAX, AlphaFold, AlphaCode 등과 같은 오픈 커뮤니티에 혁신을 기여해왔음
- Gemma는 Gemini 모델을 만드는 데 사용된 것과 동일한 연구와 기술을 바탕으로 제작된 경량의 최첨단 오픈 모델군
- 구글 DeepMind 및 다른 팀들이 개발하였으며, 라틴어로 '보석'을 의미하는 'gemma' 에서 영감을 받았음
- 오늘부터 전 세계적으로 사용 가능하며, 모델 가중치, 개발자 혁신을 지원하는 도구, 협업 촉진 및 Gemma 모델의 책임 있는 사용을 안내하는 도구들을 함께 제공함
- Gemini와 기술 및 인프라 구성 요소를 공유하여 Gemma 2B와 7B가 다른 오픈 모델과 비교하여 크기에 비해 최고의 성능을 달성
- 개발자의 랩톱이나 데스크톱 컴퓨터에서 직접 실행할 수 있으며, 주요 벤치마크에서 훨씬 큰 모델들을 능가하면서도 안전하고 책임 있는 결과물을 제공하기 위한 엄격한 기준을 준수함
- Native Keras 3.0을 통해 JAX, PyTorch, TensorFlow 등 모든 주요 프레임워크에 걸쳐 추론 및 SFT(감독 미세 조정)를 위한 툴체인을 제공
- Colab 및 Kaggle 노트북과 Hugging Face , MaxText , NVIDIA NeMo 및 TensorRT-LLM 과 같은 인기 도구와의 통합을 통해 Gemma를 쉽게 시작할수 있음
- 사전 학습되고 인스트럭션 튜닝된 Gemma 모델은 Vertex AI 및 Google Kubernetes Engine (GKE) 에 쉽게 배포하여 노트북, 워크스테이션 또는 Google Cloud에서 실행할수 있음
- NVIDIA GPU 및 Google Cloud TPU를 포함하여 여러 AI 하드웨어 플랫폼에 대한 최적화를 통해 업계 최고의 성능을 보장
- 사용 약관에 따라 규모에 관계없이 모든 조직에서 상업적 사용 및 배포를 허용
Responsible by design
- Gemma는 AI 원칙을 최우선으로 설계되었으며, 훈련 세트에서 개인 정보 및 기타 민감한 데이터를 필터링하기 위해 자동화된 기술을 사용
- 또한, 책임 있는 행동과 일치하도록 지시 튜닝된 모델을 위해 인간 피드백에서의 강화 학습(RLHF)을 광범위하게 사용
- Gemma 모델의 위험 프로필을 이해하고 줄이기 위해 수동 레드팀, 자동 적대적 테스트, 위험한 활동에 대한 모델 능력 평가 등의 강력한 평가를 수행
프레임워크, 도구 및 하드웨어 전반에 걸쳐 최적화
- Gemma 모델은 특정 애플리케이션 요구 사항에 맞게 자체 데이터에 대해 미세 조정할 수 있으며, 다양한 도구 및 시스템을 지원
- 멀티 프레임워크 도구: Keras 3.0, 네이티브 PyTorch, JAX 및 Hugging Face Transformers등 선호하는 프레임워크 이용 가능. 레퍼런스 구현체 제공
- 크로스 디바이스 호환성 : 랩톱, 데스크톱, IoT, 모바일 및 클라우드를 포함한 인기 있는 디바이스에서 실행 가능
- 최첨단 하드웨어 플랫폼 : NVIDIA와 파트너십을 통해 데이터 센터부터 클라우드, 로컬 RTX AI PC에 이르기까지 NVIDIA GPU를 위한 최적화로 업계 최고의 성능과 최첨단 기술과의 통합을 보장
- 구글 클라우드에서 최적화 : Vertex AI를 사용하여 광범위한 MLOps 도구 세트와 다양한 튜닝 옵션을 제공하며, 내장된 추론 최적화를 사용한 원클릭 배포가 가능함
연구 및 개발을 위한 무료 크레딧
- Gemma는 AI 혁신을 주도하는 개발자 및 연구자 커뮤니티를 위해 구축되었으며, Kaggle에서의 무료 접근, Colab 노트북의 무료 계층, 첫 번째 Google Cloud 사용자를 위한 $300 크레딧을 사용하여 오늘부터 작업을 시작할 수 있음
- 연구자들은 자신의 프로젝트를 가속화하기 위해 최대 $500,000의 Google Cloud 크레딧을 신청 가능