이 모델 좀 치네요
여건이 되셔서 llama.cpp 로 돌려보실 분들은 아래 글타래의 댓글에 있는 프롬프트를 따로 적용해주셔야 합니다. 아니면 여는 <think> 없이 중간에 </think> 하나만 달랑 나오는 문제가 있습니다.
https://huggingface.co/stepfun-ai/Step-3.5-Flash-GGUF-Q4_K_S/…

llama-server \  
  옵션생략 \  
  --jinja \  
  --chat-template-file 경로/step3p5_flash_chat_template.jinja  

네, 맞습니다! 해당 링크의 오픈라우터 API 를 바탕으로 모델교체는 용이합니다.
(다만, 충전비용에 5% 가량 추가 비용이 발생해서 토이프로젝트 수준에서 편리하게 사용 가능합니다)

GLM4.7 성능도 실제 사용해보면서 체크하고, 적용할 수 있도록 계획해보겠습니다:)

프롬프트 엔지니어링에서 컨텍스트 엔지니어링으로의 전환이 핵심인데, 실무적으로는 "관심사의 분리"가 답인 것 같습니다.

페르소나, 행동 규칙, 메모리를 각각 다른 파일로 관리하면 context rot을 줄이는 데 효과적이죠. 모놀리식 프롬프트보다 필요한 파일만 로드하는 게 attention budget에 훨씬 유리하니까요. 그래서 OpenClaw(또는 그와 유사한 프레임워크)들이 페르소나(SOUL.md), 행동 규칙(AGENTS.md), 메모리(MEMORY.md)를 각각 관리 하는 것 같습니다.

여담으로 L모사는 하박상후로 유명하죠..
한번 임원이 되면 대우가 상상초월이라고 건너건너 들었습니다

newbie1004 | 2일전 | parent | on: AI 뱀파이어 (The AI Vampire) (steve-yegge.medium.com)

업무시간 끝나면 머리에 쥐납니다

정말 도움 많이 되는 글이네요

시장의 롱 테일이 슈퍼 로오오오오오옹 테일로 바뀌면서 시장이 오히려 죽을지 아니면 성장할지 같은거도 흥미로운 연구거리가 될 것 같습니다.

대규모 프로젝트를 바이브 코딩으로 해냈다는 의미가 있겠지만,
말씀하신대로 gcc는 학습된 내용일 것이기 때문에 다소 부적절한 것도 맞다고 생각합니다.

이 영상에도 비슷한 얘기가 나옵니다. https://www.youtube.com/watch?v=6QryFk4RYaM

산업혁명기 실업문제가 잘 알려지지 않은이유중 하나는 벼랑끝으로 내몰린게 가장 힘없던 식민지의 사람들이였기 때문이죠

이미 gcc 관련 지식은 무단이든 아니든 다 수집해서 학습된 모델일텐데 llm 성능을 보여주는 것으로도 부적절해보입니다..

이정도의 대규모도 일관적으로 바이브 코딩이 가능하다는걸 보여주는거 아닐까요?
https://news.hada.io/topic?id=26555
https://news.hada.io/topic?id=26446

최근에 사운드트랙 뽑으려고 suno 구독했었는데
간단한 사용케이스에서는 구독료를 줄일 수 있겠네요

예술의 가치는 결과물이 아니라 의도에 있음
단순한 연필 그림이라도 진심이 담겼다면, AI로 만든 화려한 이미지보다 더 감동적임
“내가 직접 그렸다”는 말에는 의지와 이야기가 담겨 있음

우리는 창작물을 볼 때 머릿속으로 자연스럽게 심상을 그립니다. 동시에 '이사람은 어떤 마음과 생각으로 이걸 만들었을까?'를 추론하기도 하죠.

학교 국어 시간에 주구장창 하던 '작가의 의도 파악'도 결국 이런 감각을 기르는 훈련이고요.

그런데 AI 작업물을 볼 떄는 어떤 문제를 붙들고 골똘히 오래 고민하거나 시행착오를 거치는 사람의 모습보다는, 화면 앞에서 슬롯머신 돌리듯이 "이걸 개선하라", "이걸 고쳐라", "X를 추가해라" 같은 프롬프트를 던지는 사람의 장면이 먼저 그려집니다.

그래서인지 AI 작업물을 볼 때, 그 과정이 주는 이야기나 긴장감이 덜하고 재미가 없습니다.

읽고도 뭔소리인지 모르겠는건 저뿐인가요.. gcc를 바이브코딩 했는 소리 아닌지

진짜 독자:

Claude Code 같은 “장시간 실행되는 에이전트”를 만드는 사람들
(특히 제품/플랫폼 엔지니어, LLM 인프라 엔지니어)

누가 보면 제일 도움되냐?
✅ 1) AI 에이전트 제품 만드는 팀

  • IDE 에이전트 (Claude Code, Cursor, Copilot Workspace 류)
  • 리서치 에이전트
  • 장시간 작업하는 자동화 에이전트

✅ 2) LLM 비용/지연 최적화하는 엔지니어

  • 이 글은 사실상: “프롬프트 캐싱 최적화가 곧 제품 성능/비용이다”
  • 인프라 쪽 사람이 보면 바로 감 옵니다.

✅ 3) MCP 도구 잔뜩 붙이는 사람

  • tool 추가/삭제가 캐시 깨는 문제
  • plan mode 구현을 “도구로 모델링”하는 문제

반대로, 일반 유저는 거의 안 봄

“프롬프트 잘 쓰는 법” 같은 글이 아니라

“프롬프트를 제품 아키텍처 레벨에서 어떻게 다뤄야 하는가”

한 줄로 정리

LLM을 “채팅”이 아니라 “프로덕션 시스템”으로 만드는 사람을 위한 글입니다.

답변 감사합니다 .오픈 라우터는 https://openrouter.ai/ 이 서비스 말씀하시는 것 인가요? 한국어 RAG에 사용할 수준의 모델이라고 말씀하신 부분은 제가 잘 모르는 내용이기는 한데 저는 GLM 4.7이 sonnet 4.5보다 제가 원하는 프롬프트에 일관되게 나은 한국어 답변을 해서 좀 신뢰가 올라간 상황입니다. 그래서 관심있게 봐주셔도 좋을 것 같습니다.