- 넷플릭스의 90초 -
* 넷플릭스는 구독자가 접속하고 관심을 끌 수 있는 시간은 90초라고 주장합니다. 90초 안에 구독자를 동영상을 보게 하지 못하면
구독자는 볼 만한 게 없다고 느끼고 서비스를 해지할 위험이 커집니다.
* 그래서 넷플릭스는 구독자들이 추천 알고리즘을 사용하지 않으면 10억달러의 손실을 입을 것으로 추정합니다. 추천 알고리즘은 넷플릭스의
가장 중요한 자산입니다.
- 알고리즘 경진대회 -
* 2006년 DVD 대여점이었던
넷플릭스는 100만달러의 상금을 걸고 영화 추천 알고리즘 경진대회를 개최했습니다. 과학 커뮤니티들에 개최 사실을 알리고 1998년부터 2005년까지 수집한 1억건의 영화 평점 데이터를 제공했습니다.
* 우승 조건은 넷플릭스의 추천 알고리즘보다 10% 향상된 알고리즘을 만드는 것이었고 알고리즘이 추천한 영화가 평가자들로부터 높은 평점을 받는 것으로 성과를
측정했습니다. 1년 간 진행된 대회에서 참가팀들 간 연합을 거쳐 성능을 10.09% 향상시킨 ‘벨코의 실용 카오스 팀’이 우승했습니다.
* 넷플릭스는 우승한 알고리즘을 사용하지 않았지만 대회를 통해 중요한
사실을 발견했습니다. 알고리즘이 투자 대비 수익이 더 이상 높아지지 않는 순간을 포착할 수 있다는 것이었습니다.
- 시청 중이신가요? -
* 넷플릭스에서 몰아보기를 하고 있으면 넷플릭스 알고리즘이 중간에
‘시청 중이신가요?’를 묻습니다. 우리집 전기요금을 아껴주려는 게 아니라 데이터의 오염을 막기 위한 것입니다.
* 넷플릭스가 구독자들로부터 얻는 데이터 중 가치가 높은 데이터는
몇시간 보는지, 몇 점을 매겼는지, 장면을 반복해서 보는지, 장면을 넘겨서 보는지, 무슨 기기로 보는 지 등입니다. 나이, 성별은 좋은 데이터가 아닙니다.
- 아이디 공유 금지 -
* 넷플릭스 CEO 리드
헤이스팅스는 실적 컨콜에서 실적 개선을 위해 가장 먼저 아이디 공유를 중단시킬 것이라고 밝혔습니다. 일
잘하는 사람을 돈 많이 주고 빼오는 걸로 유명한 헤이스팅스가 돈 내고 보라는 말은 아니었을 겁니다.
* 이 사람 저 사람이 같이 쓰면서 데이터를 오염시키고 알고리즘을
무력화하지 말라는 의미입니다. 헤이스팅스는 투자도 줄인다고 발표했습니다. 알고리즘이 약해지면 투자를 줄이는 건 2008년에 세워 둔 원칙입니다.
* 넷플릭스가 추천 알고리즘의 문제를 해결했다고 발표할 때 주식을
사면 될 것 같습니다. 넷플릭스는 뭘 스트리밍해야 떠났던 구독자가 돌아올 지도 알고 있습니다. 지금은 데이터 조정 시간입니다.
좋은 주말 되십시오
댓글 없음:
댓글 쓰기