Rafiki Research: Column_순도

2026년 4월 18일 토요일

<순도>

- 2026년 이후 데이터 –

* 2026년 이후 생성된 데이터는 90% 이상이 AI가 만들어낼 것이라는 예측이 있습니다. 그럴 것도 같은 게 유튜브 알고리즘이 플레이리스트를 찾아주길래 좋다고 들었는데, 댓글을 열었더니 AI가 만들었다고 적혀있었습니다. 그 다음부턴 안들었습니다.

* AI가 만든 데이터를 AI가 학습하면 현실 세계의 논리적 인과관계를 학습하는 게 아니라 이전 모델의 확률적 습관을 학습합니다. 원래 데이터셋에 있던 아웃라이어, 소수의견들은 소음으로 분류돼 삭제되고 결국 모델은 가장 대중적인 대답을 반복하게 됩니다.

* 이걸 모델의 자기포식적 장애라고 한다고 제미나이가 알려줬습니다.

- 2023년 이전 데이터 -

* 그래서 2023년 챗 GPT가 등장하기 이전 오염되지 않은 데이터의 가치가 상승하고 있는 중입니다. 구글이 괜히 고문서들을 수집한 게 아니고, 오픈AI가 얘기 안하고 뉴욕타임즈를 읽은 게 아닙니다.

* 디지털 고고학이라는 틈새 장르도 생겼는데, 2022년말까지 데이터는 AI가 만든 데이터랑 섞이지 않게 따로 보관합니다.

- 숙련된 전문가의 결정 –

* AI의 자기파멸을 막을 수 있는 유일한 약은 고숙련 전문가의, 의사결정 데이터입니다.

* 그래서 실력이 좋은 투자자, 의사, 변호사는 돈을 받고 AI와 대화하기도 합니다. 뛰어난 인간의 노하우의 가치는 오르면 올랐지 떨어지진 않을 것 같습니다.

* 투자도 나뉠 것 같은데, 알파가 거의 없는 상장시장의 전통자산은 사람이 하지 않을 것 같고, 알파가 큰 비상장시장의 비전통자산은 사람이 하게 될 것 같습니다.

좋은 주말 되십시오

Rafiki Research