Ghost 기반 개인 블로그를 운영하고 있습니다. 포스트가 100개정도 쌓인 쯤에 서치 콘솔을 보기 시작했는데, 메인 페이지 말고는 crawled not indexed상태로 방치되어서 이것저것 해 보다가 반쯤 포기하고 있었는데, 글이 500개쯤 넘어가는 시점에서 갑자기 index가 되더라고요. 여전히 index되지 않은 포스트도 있고, 인덱스했다가 취소된 페이지도 있어서 기준이 뭔지 잘 모르겠는데, 아무튼 답답하긴 합니다.
답글 감사합니다! "서로 실수를 잡아준다"는 부분만 짧게 덧붙이자면, 모델들이 표면적인 관점은 달라도 같은 시기, 같은 코퍼스로 학습된 탓에 비슷한 종류의 실수는 같이합니다. 그러면 다수결로 합의가 되더라도 그 실수가 걸러지는게 아니라 오히려 강화가 될 수 있어요.
가능하시면 한번 측정해보시는거 추천드려요. 백테스트 데이터에서 모델 4개 의견이 (a) 일치했을때와 (b) 갈렸을 때의 사후 수익률 분포를 비교해보시면 (a)가 (b)보다 유의미하게 잘 나오면 다수결 효과가 실증되는거고 차이가 없거나 오히려 (b)가 낫다면 합의가 된 노이즈에 가깝다는 신호일거예요. 이미 구축하신 데이터로 바로 돌려볼 수 있는 가설이라 한번 보시면 재밋으실 것 같습니다!
의견 감사합니다! 말씀하신것처럼 4개의 모델이 있다고해서 신뢰도가 4배가 되는 것은 절대 아닙니다. 다만 서로간의 실수를 잡아줄수 있다 정도로 봐주시면 좋을거 같고, 재밌는 건 생각보다 같은 프롬프트와 데이터를 넣어도 각 모델이 분석하는 방법과 관점이 정말 많이 다릅니다. 4개 페르소나도 그런 부분을 분석해서 억지로 주입하지않도록 테스트를 많이 거쳤습니다. 아직 부족하지만 좀 더 신뢰적인 서비스가 되도록 더 발전시켜보겠습니다! 서비스 둘러보고 의견도 주셔서 정말 감사드립니다
서비스 한번 둘러봤어요. 만드신 노력은 보이는데 가혹한 비판도 받겠다고 하셔서 솔직히 적습니다.
모델 4개의 합의가 신뢰도를 높여준다는 전제 자체가 위험해 보여요. gpt, gemini, claude, deepseek 결국 비슷한 인터넷 데이터로 학습된 모델들이라 같은 종목 보면 비슷한 얘끼 합니다. 합의가 됐다 = 신뢰도 네 배가 아니라 같은 편향이 네 번 반복됐을 가능성이 더 큽니다. 앙상블의 효과는 모델끼리 독립적일떄 나오는데 범용 LLM끼리는 그게 보장이 안돼요
좋은 제안 감사합니다. 실제로 모든 모델이 추천한다고 수익률이 높은 종목은 아니더라고요. 저는 이부분을 리스크가 있을수록 수익률이 높다는 주식 특성과 연루지어 생각했었는데, 흥미로운 제안 감사합니다 :)
넵 맞습니다! 리포트 작성시 단기 중장기 추천 점수를 별도로 산정해서 반영한 결과 입니다. 단기는 기술적 지표와 뉴스 등 시그널이 더 강하게 반영되고 중장기는 펀더멘탈 개선이 더 반영됩니다
비자 마스터카드는 이제 검열 장치로 변모했기 때문에 좋은 변화라고 봅니봅니다
수 년 전에 티스토리 블로그에 이것저것 정리해뒀었는데 그쪽은 아직도 검색 결과에 잘 올라가고 조회수가 나오는데 개인 도메인은 인덱싱도 반 정도만 되고 잘 올라가지 않더라구요
쪼개는 것 자체가 힘들면 어떡하죠
Ghost 기반 개인 블로그를 운영하고 있습니다. 포스트가 100개정도 쌓인 쯤에 서치 콘솔을 보기 시작했는데, 메인 페이지 말고는 crawled not indexed상태로 방치되어서 이것저것 해 보다가 반쯤 포기하고 있었는데, 글이 500개쯤 넘어가는 시점에서 갑자기 index가 되더라고요. 여전히 index되지 않은 포스트도 있고, 인덱스했다가 취소된 페이지도 있어서 기준이 뭔지 잘 모르겠는데, 아무튼 답답하긴 합니다.
혹시 단기, 중장기 예측의 근거가 애널리스트들의 리포트일까요?
답글 감사합니다! "서로 실수를 잡아준다"는 부분만 짧게 덧붙이자면, 모델들이 표면적인 관점은 달라도 같은 시기, 같은 코퍼스로 학습된 탓에 비슷한 종류의 실수는 같이합니다. 그러면 다수결로 합의가 되더라도 그 실수가 걸러지는게 아니라 오히려 강화가 될 수 있어요.
가능하시면 한번 측정해보시는거 추천드려요. 백테스트 데이터에서 모델 4개 의견이 (a) 일치했을때와 (b) 갈렸을 때의 사후 수익률 분포를 비교해보시면 (a)가 (b)보다 유의미하게 잘 나오면 다수결 효과가 실증되는거고 차이가 없거나 오히려 (b)가 낫다면 합의가 된 노이즈에 가깝다는 신호일거예요. 이미 구축하신 데이터로 바로 돌려볼 수 있는 가설이라 한번 보시면 재밋으실 것 같습니다!
본문에
라고 써있네여
의견 감사합니다! 말씀하신것처럼 4개의 모델이 있다고해서 신뢰도가 4배가 되는 것은 절대 아닙니다. 다만 서로간의 실수를 잡아줄수 있다 정도로 봐주시면 좋을거 같고, 재밌는 건 생각보다 같은 프롬프트와 데이터를 넣어도 각 모델이 분석하는 방법과 관점이 정말 많이 다릅니다. 4개 페르소나도 그런 부분을 분석해서 억지로 주입하지않도록 테스트를 많이 거쳤습니다. 아직 부족하지만 좀 더 신뢰적인 서비스가 되도록 더 발전시켜보겠습니다! 서비스 둘러보고 의견도 주셔서 정말 감사드립니다
어쩌면 현재 모델들이 과적합 학습이 되어 있다는 뜻이고, 따라서 모델용량을 더욱 줄일 수 있는 여지가 남아 있다고 해석할 수도 있을 것 같습니다.
서비스 한번 둘러봤어요. 만드신 노력은 보이는데 가혹한 비판도 받겠다고 하셔서 솔직히 적습니다.
모델 4개의 합의가 신뢰도를 높여준다는 전제 자체가 위험해 보여요. gpt, gemini, claude, deepseek 결국 비슷한 인터넷 데이터로 학습된 모델들이라 같은 종목 보면 비슷한 얘끼 합니다. 합의가 됐다 = 신뢰도 네 배가 아니라 같은 편향이 네 번 반복됐을 가능성이 더 큽니다. 앙상블의 효과는 모델끼리 독립적일떄 나오는데 범용 LLM끼리는 그게 보장이 안돼요
경쟁 화이팅
Flash 가 너무 비싸요, 이제 전 오픈라우터 gemma 호스팅에서 영원히 살거에요
루비를 좋아하고 많이 쓰기도 했지만 지금은 딱히 써야할 이유를 찾을수가 없네요.
https://killedbygoogle.com/
Ruby는 세계적으로는 많이 쓰이는 편이지만 한국에서는 유독 안쓰여서 신기해요.
넵 감사합니다ㅎㅎ
이거 구글쪽 문제가 맞는거 같아요. 저도 운영중인 여러 사이트에서 동일하게 일어납니다.
그냥 아무 이유없이 구글이 인덱싱을 안하고 있어요. 언젠가 할지도 모른다고 하지만, 정말 언젠가일듯
Google의 AI가 조작되고 있다. 검색 거인은 조용히 반격 중
이런거는 처리 못하고, 잘 운영되는 사이트는 인덱싱 거부하고.. 게다가 AI 결과를 더 중시한다고 하니
구글이 어디로 가는지는 저도 잘 모르겠..
작명 센스가 너무 구림.......