Google Deepmind, 에이전틱 시대를 위한 새

▲

GN⁺ 2024-12-12 | parent | ★ favorite | on: Google Deepmind, 에이전틱 시대를 위한 새 AI 모델 Gemini 2.0 공개 (blog.google)

Hacker News 의견

새로운 llm-gemini 플러그인이 Gemini 2.0 Flash 모델을 지원함. 터미널에서 사용 방법을 공유함
- Gemini 모델은 Python 코드를 작성하고 실행할 수 있는 기능이 있음
- 네트워크 호출은 불가능하지만, 다양한 접근을 시도함
- 시각적 설명에 뛰어난 성능을 보임
대기업은 방향 전환이 느리지만, 일단 방향을 잡으면 작은 기업이 할 수 없는 것을 이룰 수 있음
- Google은 이 분야에서 많은 인재를 보유하고 있으며, 좋은 결과를 얻고 있음
- LLM 모델의 제품화와 마케팅 능력은 아직 미지수지만, 성능은 뛰어남
Gemini 1.5 Pro를 대부분의 벤치마크에서 능가함
- Google DeepMind는 LLM 시대에 적응 중임
- TPU를 통해 하드웨어를 직접 제어함
새로운 SDK가 발표됨. 현대적 모범 사례를 따르는 것으로 보임
- OpenAI 호환 엔드포인트를 제공해 왔지만, 장기 지원 여부는 불확실했음
- Kubernetes 클러스터와 GCP 버킷 설정을 권장함
Google의 새로운 릴리스가 즉시 사용 가능하여 기쁨
- Gemini Flash 2.0이 Advent of Code 문제에서 Gemini Pro 1.5를 능가함
- Flash 2.0이 컴파일 오류를 수정함
"agentic"이라는 단어가 불쾌하게 느껴짐
- "versatile", "multifaceted", "autonomous" 같은 단어가 더 적절함
Gemini 2 모델은 오디오 및 이미지 생성 기능을 지원함
- 이미지 생성은 1월에 일반적으로 제공될 예정임
- 컴퓨터 비전 작업이 LLM을 통해 가능해질 것임
Gemini 2가 4o를 챗봇 아레나에서 앞서고 있음
"agentic"이라는 단어가 부적절하다고 생각함
- 대부분 시스템 프롬프트와 도구로 구성된 파이프라인임
iPhone의 Safari 브라우저에서 Google AI Studio를 통해 Gemini 2.0 Flash에 접근함
- 카메라를 통해 본 것을 정확히 식별함
- 영어와 일본어 텍스트를 읽을 수 있음
- 피아노 음을 시각적으로 식별했지만, 소리만으로는 불가능했음