4P by neo 2023-10-05 | favorite | 댓글 2개
  • 'FontoGen'이라는 폰트 생성을 위한 생성형 머신러닝(ML) 모델 구축
  • 모델은 폰트 설명을 입력으로 받아 폰트 파일을 출력으로 제공
  • 저자는 2023년 AI의 부상에 영감을 받아 텍스트에서 SVG 생성을 탐색하게 되었고, 이로 인해 폰트 생성 아이디어를 얻음
  • IconShop2 논문을 참고하여 모델을 구축하였고, SVG 생성과 비슷하게 폰트 생성이 가능함을 발견
  • 모델은 텍스트 임베딩 다음에 폰트 임베딩이 이어지는 시퀀스로 훈련된 시퀀스-투-시퀀스 모델
  • 텍스트 임베딩은 사전 훈련된 BERT 인코더 모델을 사용하여 생성되었고, 폰트 임베딩은 폰트를 토큰 시퀀스로 변환하여 생성
  • 모델은 16개의 레이어와 8개의 블록으로 구성된 자동 회귀 인코더 전용 트랜스포머로, 총 73.7백만 개의 파라미터를 가짐
  • 저자는 BigBird3 주의를 사용하여 초기 프롬프트에 집중하고 N개의 이전 토큰을 관찰하여 여러 이전 글리프의 스타일을 포착
  • 모델은 GPT-3.5를 사용하여 다양한 유형의 설명을 몇 가지 키워드로 요약한 71k개의 고유 폰트 데이터셋에서 훈련
  • 훈련 과정은 127시간 소요되었으며, 검증 손실이 거의 개선되지 않을 때 중단
  • 저자는 데이터셋 전처리 단계로 가능한 한 많이 이동함으로써 성능을 세 배 향상
  • 저자는 디자이너가 생성한 단일 글리프를 기반으로 모든 다른 글리프를 생성하기 위해 모델을 기존 폰트 편집기에 통합하는 등의 잠재적인 미래 응용을 제안

귀여운 폰트를 만들어줘

Hacker News 의견
  • gpt-4 코드 해석기는 글리프의 흑백 png를 svg로 변환할 수 있으며, 이는 이미지 생성 모델과 결합하여 폰트를 생성하는 데 사용될 수 있습니다.
  • Godel Escher Bach의 저자인 Douglas Hofstader는 일반 AI 없이는 폰트 생성이 불가능하다고 믿었습니다.
  • Letter Spirit 프로젝트는 그리드에 제한된 "gridfonts"라는 스타일이 통일된 글꼴을 디자인함으로써 예술적 창의성을 모델링하는 것을 목표로 합니다.
  • ML 모델에 의해 생성된 폰트의 정밀도에 대한 우려가 있으며, 선이 완벽하게 평행하지 않고 모서리가 정확히 90도가 아닌 등의 문제가 있습니다.
  • 픽셀을 150x150 고유의 bin으로 표현하는 접근법은 이상적이지 않다고 보며, 대신 convnet을 사용하고 출력을 추적하는 것이 제안되고 있습니다.
  • 이러한 접근법으로 새로운 폰트, 특히 매우 스타일화된 폰트의 생성이 더욱 실현 가능해질 수 있습니다.
  • 모델은 safetensor가 아닌 ckpt이며, 이는 일부 사용자가 이를 시도해 볼지 여부에 영향을 줄 수 있습니다.
  • 확산 모델이 텍스트를 그리는 데 어려움을 겪음에도 불구하고, 이 방법은 이 애플리케이션에 잘 작동합니다.