10P by neo 5달전 | favorite | 댓글 4개
  • 크롬 127 버전부터 window.ai 를 통해서 Gemini Nano AI 모델을 브라우저에서 사용가능하게 제공
  • 챗봇 데모 사이트는 Next.js + Vercel AI SDK를 이용하여 작성되었음
  • 사용 예제
import { streamText } from "ai";  
import { chromeai } from "chrome-ai";  
  
const { textStream } = await streamText({  
  model: chromeai(),  
  prompt: "what is a large language model?",  
});   

https://developer.chrome.com/docs/ai/built-in
사용해 보려면 별도 신청이 필요하네요.

Hacker News 의견
  • Apple의 AI 전략을 웹 사용자에게도 적용할 수 있는 기능을 브라우저에 기본 탑재하는 것은 긍정적임

    • 로컬 모델을 사용하여 프라이버시와 보안을 강화할 수 있음
    • Google이 이를 잘 구현하면 매우 흥미로울 것임
  • Vercel이 window.ai를 발표하면서 Chrome API 대신 자체 추상화를 보여줌

    • window.ai API는 매우 간단하여 래퍼가 필요하지 않음
    • 예제 코드:
      const model = await window.ai.createTextSession();
      const result = await model.prompt("What do you think is the meaning of life?");
      
  • Google의 API에 모델을 지정할 수 없는 것은 큰 결함임

    • 모델이 계속 업그레이드되면 테스트와 유지보수가 어려울 것임
    • 제안된 코드:
      const supportedModels = await window.ai.getSupportedModels();
      if (supportedModels.includes("gemini-nano:0.4")) {
        const model = await window.ai.createTextSession("gemini-nano:0.4");
        // ...
      }
      
  • 웹사이트가 사용자 CPU를 분산 LLM 처리에 사용하는 것은 문제임

  • window.ai API에 대한 공개 문서가 부족함

    • Gemini Nano 모델이 어떤 버전인지 명확하지 않음
  • 현재의 기술로는 instruct 모델이 base 모델보다 덜 유용함

    • LoRAs 실행, 온도 조절, 프롬프트 템플릿 설정 등의 기능이 필요함
    • 기술이 빠르게 변화하고 있어 브라우저에 통합하기에는 시기상조일 수 있음
    • 모델을 인터페이스와 분리하여 다른 로컬 모델도 사용할 수 있게 해야 함
  • 표준화가 부족함

    • Microsoft의 WebNN과 같은 접근이 필요함
    • Apple의 Metal을 WebGPU로 노출하려는 시도처럼 다른 벤더들이 이를 실현해야 함
  • Chrome의 "Create theme with AI" 기능이 랜덤 테마 선택과 차이가 없음

    • pixabay에서 랜덤 이미지를 반환하는 API를 만들 계획임
  • 일반 목적의 모델은 크기가 클수록 더 유용함

    • 특정 작업에 맞게 미세 조정된 온디바이스 모델이 더 정확함
  • eval(window.ai("js code to remove all adds in the following page" + document.documentElement.outerHTML))

https://huggingface.co/wave-on-discord/gemini-nano
참고로 모델 파일은 얼마전에 추출되었습니다.