1P by GN⁺ | ★ favorite | 댓글 1개
  • Claude Science는 생명과학 연구자가 분석 실행, 데이터베이스 검색, 데이터 전처리, 결과 작성까지 한 워크벤치에서 이어가도록 만든 공개 베타 앱임
  • 그림·표·노트북은 생성 코드, 실행 환경, 대화 기록을 함께 남겨 나중에 재현·수정·검증할 수 있음
  • 로컬 노트북, Linux 장비, HPC 로그인 노드, 클라우드 VM에서 실행되며 SSH, Slurm, Modal을 통해 작업 제출과 관리를 지원함
  • 유전체학, 단일세포, 프로테오믹스, 구조생물학, 화학정보학을 대상으로 하며 60개 이상 과학 데이터베이스와 NVIDIA BioNeMo 도구에 연결 가능함
  • macOS와 Linux에서 Pro, Max, Team, Enterprise 플랜으로 사용할 수 있지만, 베타 앱이므로 조직 배포 전 문서 검토와 관리자 설정이 필요함

과학 연구용 Claude 워크벤치

  • Claude Science는 새 모델이 아니라 공개 베타 앱이며, 사용자의 플랜에 포함된 기존 Claude 모델을 사용함
  • 새로 더해진 부분은 Claude 주변의 과학 도구, 데이터베이스 연결, 컴퓨트 통합으로, 사용자의 인프라에서 전체 분석을 실행할 수 있게 함
  • macOS와 Linux용으로 제공되며, 페이지에서 각 운영체제용 다운로드를 안내함
  • 목표는 과학 데이터베이스, 연구 도구, ELN, 단백질·구조 모델, HPC를 하나의 연구 워크벤치로 묶는 것임

재현 가능한 결과물과 검토 흐름

  • Claude Science는 단백질, 구조, 분자 등을 네이티브로 볼 수 있게 하며, 결과를 생성 코드까지 추적할 수 있음
  • 그림, 표, 노트북에는 다음 정보가 함께 저장됨
    • 결과를 만든 정확한 코드
    • 실행 환경
    • 결과를 만든 대화
  • 저장된 결과물은 몇 달 뒤에도 재현, 편집, 방어할 수 있음
  • 단백질, 정렬, 유전체 트랙, 화학 구조, PDF를 추가 설치 없이 네이티브 형식으로 확인할 수 있음
  • 백그라운드 리뷰어는 잘못된 인용, 추적 불가능한 수치, 기반 코드와 일치하지 않는 그림을 표시함
  • 사용자는 그림에 주석을 달아 수정이나 질문을 요청할 수 있고, 에이전트는 해당 그림을 만든 코드를 읽어 직접 수정함
  • 분석 결과 작성은 렌더링된 Markdown과 LaTeX 미리보기를 보면서 진행할 수 있음

컴퓨트와 실행 환경

  • 각 분석에 필요한 실행 환경을 관리하며, 실행 위치는 노트북, Linux 장비, HPC 로그인 노드가 될 수 있음
  • 배치 스크립트를 작성한 뒤 사용자의 머신이나 HPC 클러스터에 SSH로 제출·관리하거나 Modal 계정으로 작업을 실행함
  • 설치 위치는 데이터가 있는 곳에 맞출 수 있음
    • 노트북
    • 연구실 Linux 장비
    • HPC 로그인 노드
    • 클라우드 VM
  • 브라우저에서 연결해 사용할 수 있음
  • 작업은 로컬 커널, SSH를 통한 Slurm 클러스터, Modal 계정에서 실행됨
  • 변수, 데이터프레임, 로드된 모델은 분석 전체에서 메모리에 유지되어 반복 작업을 빠르게 진행할 수 있음

생명과학 도메인별 작업

  • Claude Science는 유전체학, 단일세포, 프로테오믹스, 구조생물학, 화학정보학 등을 지원하며, 문헌을 읽고 60개 이상 과학 데이터베이스를 질의할 수 있음
  • 주요 활용 예시는 다음과 같음
    • Single-cell RNA-seq 분석: 조직 전체의 수백만 개 세포를 클러스터링·주석 처리하고, 표면 마커 유전자를 찾으며, 각 그림을 생성 코드까지 추적함
    • 계통발생·진화 분석: ortholog 정렬, 최대가능도 트리 추론, 기능성 잔기의 계통발생 매핑을 하나의 재현 가능한 세션에서 수행함
    • 단백질 구조와 언어 모델 작업: 예측 구조를 가져오고 도메인과 임상 변이를 얹은 뒤 3D에서 대화형으로 탐색함
    • 화학정보학과 분자 설계: 생물활성 데이터를 검색하고, 속성·유사도를 계산하며, 2D 스케처에서 구조를 그리거나 다듬음
  • 파이프라인은 재사용 가능한 skill로 저장할 수 있고, 연구실 선호 도구는 connector로 연결해 이후 세션에서 자동으로 사용할 수 있음
  • 완전히 출처가 붙은 indication dossier를 제공하며, 각 프로그램의 근거를 구성하는 skill 세트를 확장 중임

기존 연구실 스택과의 연결

  • Connector는 내부 API, ELN, 맞춤형 파이프라인을 워크플로에 가져와 Claude Science가 연구실의 기존 도구와 함께 작동하게 함
  • 기존 Python, R, shell 워크플로는 처음부터 다시 만들 필요 없이 읽고, 실행하고, 확장할 수 있음
  • 과학 도구, 플랫폼, 도메인 특화 오픈 모델은 skill 또는 connector로 플러그인될 수 있음
  • Claude Science는 특정 도구를 대체하기보다 전문 도구들이 함께 작동하는 통합 워크벤치 역할을 함

모델·도구·데이터 연결

  • 일반 AI 어시스턴트가 생물학을 논의하는 수준을 넘어, Claude Science는 파이프라인 실행, 과학 데이터베이스 탐색, 클러스터 작업 오케스트레이션, 이전 세션 기록 추적을 지원함
  • 앱에는 유전체학, 단일세포, 프로테오믹스, 구조생물학, 화학정보학 등을 위한 분석 specialist가 포함됨
  • 도메인 특화 오픈 모델과 60개 이상 과학 데이터베이스에 네이티브로 연결할 수 있음
  • NVIDIA의 BioNeMo Agent Toolkit skill을 사용해 BioNeMo의 생명과학 모델과 라이브러리에 연결함
    • 포함 예시는 Evo 2, Boltz-2, OpenFold3임

데이터 위치와 검증

  • Claude Science 앱은 사용자의 인프라에서 실행되며, 원시 데이터셋과 컴퓨트는 로컬에 남음
  • 프롬프트와 모델 응답에 포함된 콘텐츠는 Anthropic의 표준 보존 정책에 따라 처리됨
  • 팀별 요구사항은 영업 문의를 통해 논의할 수 있음
  • 모든 산출물은 다음 정보를 포함함
    • 생성에 사용된 정확한 코드
    • 실행 환경
    • 수행 작업의 평문 설명
    • 결과로 이어진 대화
  • 백그라운드 리뷰어는 결과가 표시되기 전에 증거로 추적할 수 없는 주장을 표시함

플랜, 연구실 할인, 엔터프라이즈 배포

  • Claude Science는 macOS와 Linux에서 Pro, Max, Team, Enterprise 플랜으로 제공되는 베타 앱
  • Team과 Enterprise 사용자는 관리자가 먼저 활성화해야 함
  • 연구실용 할인 Claude Team plan for research labs는 Claude Science 앱 접근을 포함함
    • 대상은 학술 기관과 비영리 연구기관의 활동 중인 과학 연구실임
    • 생의학·기초과학 연구실과 화학, 수학, 컴퓨터과학, 물리학 등 hard sciences가 우선순위에 포함됨
    • 자격은 연구실 책임자를 통해 검증됨
  • 영리 기업, 계약 연구기관, 산업 R&D 팀은 Team and Enterprise plans를 참고해야 함
  • Enterprise 플랜은 SSO, SCIM 프로비저닝, 커스텀 역할, 사용량 분석을 제공함
  • 베타 상태이므로 관리자는 배포 전 문서를 검토해야 함
  • 문서는 설치, 도구·컴퓨트 연결, Team·Enterprise 관리자 설정을 다룸

댓글과 토론

Hacker News 의견들
  • 이번 출시물에 포함된 연결 도구 중 하나인 Biomni HPC를 만들었고, 이 문제에 꽤 오래 매달려 왔음. Anthropic에서도 일했지만 이 제품을 맡은 건 아님
    다른 댓글들처럼 이건 데이터 과학용이지만, 그래프를 만들고 논문을 쓰는 것보다 더 많은 일을 할 수 있음. 연구자의 기관 클러스터를 포함해 여러 데이터베이스와 계산 도구에 통합됨
    이것만으로도 가치가 큼. 바이오 스타트업에서 이 문제로 고생하다가 스타트업을 창업했는데, 이런 도구와 데이터베이스 통합은 어렵고 시간이 많이 듦. 이 제품의 결과가 LLM용 훌륭한 API 구축뿐이라 해도 큰 긍정적 영향이 될 것임. 계산 유전체학에서 쓰는 많은 데이터베이스는 아직도 FTP로만 접근 가능함
    LLM은 이런 도구와 데이터베이스를 탐색하는 데 특히 잘 맞음. 매우 전문적이지만 맥락 안에서 배운 기술로 처리하기 좋은 단순 작업이 많음. 예전 고객이던 생물정보학자들이 LLM으로 이 문제를 푸는 초기 모습을 보고 2024년에 Anthropic에 합류하게 됨
    또 이 패턴은 본질적으로 데이터 과학에만 묶이지 않음. 일부 과학 분야에서는 습식 실험실이나 CRO와도 통합할 수 있고, 지금은 여기에 시간을 쓰고 있음
    이런 방식의 과학이 모든 것을 해결하진 않지만 특정 영역에서는 유용함. 예를 들어 많은 희귀질환 연구는 근본적 돌파구보다 연구자 관심의 병목 때문에 진전이 느림
    https://x.com/phylo_bio/article/2029233694775624096
    비교하자면 OpenAI의 과학 제품인 Prism은 사실상 Crixet 인수로 얻은 LaTeX 편집기에 가까웠음

    • 이게 여러 에이전트 기술을 포함하거나 설정하는 것과 무엇이 다른지 궁금함. 아니면 유용한 기본값을 많이 조합한 것이 이 제품의 핵심인지 알고 싶음
    • AI를 데이터 소스에 직접 연결하는 방식은, 로컬에서 직접 실행할 코드를 받는 것보다 훨씬 복잡해질 수 있음
      기관 정책, 적용 법규, NIH 데이터 저장소 같은 데이터 접근·저장 요건을 맞춰야 하고, 기관과 AI 제공업체 사이의 법적 계약도 필요할 수 있음. 적어도 아직은 손대기 어려움
    • 이런 작업에서 LLM의 허구 생성을 걸러내려면 어떻게 검증하는지 궁금함
    • 언젠가 Claude Science에서 훨씬 나은 시각화를 보고 싶음. 단순 그래프나 단백질·화학 구조를 넘어서, 교육용 느낌의 threejs와 셰이더 기반 장면이면 좋겠음. 문헌 검토의 많은 논문에 이런 기능이 붙으면 멋질 듯함
    • 이전에 Biomni를 지능형 작업공간에 통합해 봤음: https://blog.codesolvent.com/2025/07/ai-assistant-with-biome...
      흥미가 있으면 이야기해도 좋음
  • 여기서 가장 흥미로운 점은 Claude Science가 로컬 서버와, 브라우저에서 그 서버에 연결하는 웹 기반 UI를 실행한다는 것임
    Claude Code나 Cowork처럼 UI가 호스트 머신에 더 강하게 결합돼 컴퓨터 사용 같은 기능이 가능해지는 구조와는 꽤 다름
    전략은 알아볼 수 있을 것 같음. 흥미로운 데이터에 연결된 대부분의 제약 환경은 매우 강하게 잠겨 있어서, MacBook을 소스 데이터에 그냥 연결할 수 없음
    마찬가지로 UK Biobank나 NIH All of Us 같은 대규모 유전체 바이오뱅크 데이터셋 접근은 Trusted Research Environment(TRE)라는 원격 데이터 분석 플랫폼을 통해서만 허용되고, 보통 인터넷 접근도 제한됨. 데스크톱 앱 실행은 쉽지 않지만, 이런 환경은 대개 JupyterLab이나 VS Code를 실행하고 UI를 최종 사용자에게 터널링하는 방식은 지원함. All of Us TRE를 만든 팀을 전에 이끌었음
    Claude Science는 모든 걸 다 하는 Claude 메가 앱이라기보다, 이런 제약된 데이터 환경 안에서 서버를 띄우고 UI만 사용자 브라우저로 프록시하는 형태로 상상하기 쉬움. 제약 연구개발 환경에서 채택되려면 이 점이 중요할 것임
    다만 RStudio, JupyterLab, VS Code를 매일 쓰는 중간 수준 계산 과학자들에게 Claude Science는 꽤 낯선 형태의 제품일 수 있음. 기존 데이터 과학 작업대 도구를 대체할지, 함께 쓰일지, 아니면 결국 감싸는 형태가 될지 궁금함

    • 업무에서 계산 과학 성격의 작업을 많이 하는 입장에서, Claude Code와 표준 Python 데이터 라이브러리를 조합하면 매우 강력했고 작업 흐름이 크게 빨라졌음
      지질 회사의 데이터 분석가로 흥미로운 센서 데이터를 다루는데, 빠른 분석이나 시각화가 필요할 때 Claude가 내가 한 시간쯤 걸려 정리할 코드를 몇 분 만에 써줌. 관련 라이브러리를 충분히 알아서 코드를 읽고 검증할 수 있다는 점이, 블랙박스 AI를 맹목적으로 쓰는 것과 중요한 차이임
      다만 지금 Claude Code와 VS Code의 Jupyter는 잘 맞지 않음. Claude가 수정할 때마다 노트북 전체를 처음부터 다시 실행하게 만듦. 그래서 노트북에서 한발 물러나 Claude가 독립 스크립트를 쓰게 하고, 나중에 그걸 예쁜 노트북으로 다시 합치는 데 시간을 쓰고 있음
    • 흥미로운 아키텍처라는 데는 동의하지만, 강하게 통제된 서버에서 어떻게 작동할지는 잘 모르겠음
      Mac에서 연결할 수 없다면, 서버에서 에이전트가 요청을 보내는 것도 허용하지 않을 가능성이 큼
  • 내 분야인 RNAi 기반 생물농약의 계산 설계에서 어떻게 되는지 시험해 봤음
    서부 옥수수 뿌리벌레의 DvSnf7 전사체를 표적으로 하는 설계를 한 번에 만들게 했고, 접근은 꽤 순진했음. 박사 1년 차가 할 법한 방식이었지만 작업 자체는 해냈음
    포유류 설계 규칙을 사용했다거나 오프타깃 검사가 제한적이라는 식의 한계도 함께 짚었음. 아주 나쁘진 않지만 훌륭하지도 않음. 결함을 지적하자 AI는 더 잘 알고 접근할 수 있었다고 판단했음. 그 다음 Opus 4.8 안전 시스템이 세션을 플래그 처리함

    • 이걸 실제로 긍정적 영향에 쓸 수 있다고 생각한다면, 본인이나 소속 기관·회사가 OpenAI와 Anthropic의 바이오 프로그램에 지원하는 게 좋음
    • 요즘은 농담이 저절로 만들어지는 수준임
      이 주제의 핵심 논문 10편과 일반 분야 교과서 10권을 모아서 OCR이나 텍스트 추출로 일반 텍스트로 바꾼 뒤, omp.sh 같은 더 나은 에이전트 하네스로 같은 작업을 해보는 걸 권함
      /goal set create biopesticide targeting the DvSnf7 transcript of western corn rootworm
      실수하지 말 것
  • “Science”라고 했을 때 데이터 과학을 뜻한다고는 생각하지 않았는데, pandas 코드와 그래프로 가득한 UI는 그렇게 보임
    과학 분야에 초점을 둔다 해도 Jupyter Notebook 2.0처럼 보인다는 점까지 고려하면, 발표에서 덜 가치 있는 부분일 가능성이 큼
    데이터 시각화를 이미지로 이해하는 사용 사례는 그동안 무시돼 왔고, 최신 LLM은 제대로 된 탐색적 데이터 분석도 점점 잘하고 있음. 그래도 이력서를 업데이트해야 할지도 모르겠음

    • 많은 자연과학·사회과학 분야가 결과와 시각화를 만들기 위해 허술한 matplotlib 코드를 쓰지만, 꼭 데이터 과학이라고 부르지는 않음
      내가 본 것만 놓고 보면 수학·물리·생물·언어학 사람들이 쓴 코드보다 Claude가 생성한 코드를 언제든 택하겠음. Claude가 데이터 분석 중 엄청 큰 실수를 하는 것도 봤지만, 이미 코딩하는 대부분의 학자보다 더 신뢰할 만할 가능성이 큼
    • 영상 기준으로는 생물정보학을 더 염두에 둔 것 같음. 용어 정의에 따라 데이터 과학 우산 아래 들어갈 수는 있지만, 일반적으로 그렇게 부르지는 않음
      어떤 과학인지는 도구 체인이 아니라 다루는 내용이 결정함
    • 단백질과 화학 구조 시각화 같은 것도 언급하긴 함
    • 이런 새 제품들이 전부 소련 우주 프로그램 선전물처럼 보이기 시작함. 정말 새로운 게 있긴 한지 모르겠음
  • LLM 이전에는 내가 팔로우하던 기술 그룹들이 어떤 주제를 언제 무엇에 써야 하는지 활발히 토론했고, 그런 토론이 “괜찮은 아이디어 같으니 구현해도 손해는 없겠다”는 식으로 많은 프레임워크와 도구를 낳았다고 봄
    안타깝게도 요즘은 모든 것이 LLM을 중심으로 돌고, 어떤 식으로든 LLM을 작동시키는 법만 이야기함. 애초에 그 그룹들이 논의하려고 만들어진 주제 자체는 거의 다루지 않음
    과학도 곧 같은 일을 겪을까 두려움. 실제로 논의돼야 할 주제 대신 LLM 이야기가 자리를 차지하게 될 수 있음

    • LLM에는 이미 수천억 달러가 들어갔음
      기존 자산을 어떻게든 활용하지 못하면 투하자본수익률이 좋아 보일 리 없음
      찬성 논리는 아니고, 결국 경영진은 그런 수익률 지표를 보는 주주들에게 답해야 한다는 뜻임
    • LLM은 대체로 쓸모가 별로 없고, 사람들이 그걸 깨닫고 있음
  • 이 발표 덕분에 Linux용 Claude Desktop이 열린 것 같음: https://code.claude.com/docs/en/desktop-linux

    • 아쉽게도 Arch 기반 배포판은 지원하지 않음. 왜 Flatpak으로 패키징하지 않았는지 궁금함
  • 비슷한 도구들을 써봤는데 인상적이긴 해도, LLM이 너무 자주 가짜지만 그럴듯한 데이터를 만들어 놓고 진짜인 척함
    올바른 곳에서 데이터를 가져오는 것처럼 보이도록 모의 데이터베이스 커넥터까지 세팅하지만, 실제로는 합성 데이터를 쓰는 꽤 깊은 수준의 조작도 포함됨
    이 제품은 그걸 어떻게 막는지 궁금함

  • 바이오과학 쪽으로 가면 LLM을 타락한 모델처럼 만들던 회사가 여기 아니었나?

  • 과학용 Claude Cowork 같은 건가, 즉 기술에 덜 익숙한 사용자를 위한 제품인지 궁금함
    코딩 배경이 있는 과학자라면 그냥 Claude Code를 일반적으로 쓰고 자신이 고른 스택과 통합하는 걸 선호할 것 같지만, Claude Science의 편안함과 사용성이 결국 이길 수도 있음

    • lebovic이 답했지만, 이건 단순히 Claude Cowork가 아니고 특히 HPC 클러스터 관련 연결과 기능이 있음
      예전에 있던 국립연구소 팀이 이걸 시스템에 통합하고 Claude Code 사용을 아예 포기하는 모습은 충분히 상상됨
  • 이름을 Claude-bio-big-bucks라고 불러야 할 것 같음
    지구과학, 물리학, 공학은 어떻게 되는 건가? 커넥터와 기술이 전부 생물학과 제약 쪽뿐임

    • 돈 버는 데 집중하는 회사들이 생명과학만 겨냥하지 않길 바란다면, 생명과학에 쏟아붓는 돈과 비슷한 규모로 다른 모든 분야에도 자금을 대면 됨
      트럼프 이전 기준 NSF 연간 예산은 약 60억~80억 달러였고, NIH 연간 예산은 약 500억 달러였음. 바로 그 차이임