Life2Vec, 인간의 삶과 사망예측

https://www.nature.com/articles/s43588-023-00573-5

지난주, 덴마크공과대학에서 Nature에 Life2Vec이라는 인공지능에 관한 논문을 발표했습니다. 6월 달에 arXiv에서 우선 공개됐었는데 Nature에서도 최종적으로 통과됐습니다.
간략하게 요약하면 덴마크 전 국민에 대한 데이터를 제공받아 이를 기반으로 GPT에게 개개인의 삶을 소설로 쓰게 하고 앞으로의 삶에 대한 소설도 쓰라고 했을 때 어떤가를 연구했습니다.
특정 사안(4년 내 사망 확률 등)에 대해서는 기존의 연구결과와 동일한 결과를 도출했으며 특히 사망시점 예측은 78%의 정확도로 기존에 보험사들에서 사용하던 모델보다 약 10% 정도 우수한 성능을 보여줬다고 합니다.

흥미롭습니다. 연구 자체는 개선해야할 사항이 상당히 많을 것 같은데도 불구하고 단적으로라도 사람의 삶을 꽤 정확하게 예측할 수 있다는 것은 놀랍네요. 언제 죽을 것인가도 인류의 큰 공포였는데 곧 해소되는 미래가 올까요?

5개의 좋아요

글쎄요. 예측을 할 순 있겠다만, 그 예측은 개개인이 여태까지 살아온 방식대로 살아간다는 가정 하에 예측을 하는 것 같습니다. 하지만 개개인이 자신이 살아온 방식을 바꿔나갈 순 있겠죠. 고도비만이어서 성인병을 달고 살던 사람 다이어트 후 예측 수명이 늘어나는 것 처럼요. 그래서 이 인공지능이 말해줄 수 있는 것은 "너 이렇게 살면 이때 죽어!" 와 같은 말을 더 세련되게 할 뿐이지, "너는 이때 죽는다"와 같이 해석될 순 없을 것 같습니다.

2개의 좋아요

실제로 예측에 실패한 데이터를 살펴봤더니 사고나 자살 등 예측할 수 없는 사건들의 발생 때문이라고 합니다.

학습 데이터에도 이러한 습관 변경도 반영됩니다만 그것이 얼마나 강조되어 반영되는지는 모르겠습니다. 말씀하신 두 문장에 뉘앙스 차이는 있겠습니다만 공학자의 관점에선 크게 다른 문장은 아닌 것 같습니다....혹시 좀 더 자세한 뉘앙스 차이를 염두해 두시고 말씀하셨던 것일까요?

1개의 좋아요

자유의지를 염두에 두고 있습니다. 언제 죽을 것인지 알려주는다라는 것은, 그 사람이 어떤 행동을 하든 벗어날 수 없다는 뜻이겠죠. 반면, 특정한 생활습관을 유지했을 때 예측 수명을 말해준다는 것은 그 사람이 자신의 의지대로 그 수명을 바꿀 수 있다는 것으로 이해되네요. 만일 후자라면, 우리가 언제 죽을 것인지에 대한 정보를 많이 주는 것 같진 않습니다.

+) 우리가 언제 죽을 수 있는지 더 정확한 선택을 할 수 있다고 하면 말이 될 것 같습니다. 물론 자유의지가 있다는 가정 하에요.

1개의 좋아요

저는 후자가 많은 정보를 주지 못한다고 해도 수치적인 예측을 했다는 것은 꽤 놀랍다고 생각합니다. 잘못된 생활습관을 가지면 일반적으로 일찍 죽고 그 반대라면 오래 산다는 것은 누구나 알지만 그것을 수치적으로 정확하게 예측했다는 것은 또 시사점이 있어 보입니다.
+) 저도 자유의지를 통해 당신의 습관대로면 이대로 삶이 흘러가니 이러고 싶지 않다면 바꿔보라는 쪽으로 활용되길 바랍니다. 그게 아니라면....많이 암울한 상상이 펼쳐지네요. ㅠ

1개의 좋아요

공학의 입장에선 놀라울 수 있겠네요. 제 입장에선 보험회사 같은 곳에서도 어느 정도 예측을 하고 있었고, 그 예측에 발전을 한 것이기 때문에 크게 놀랍진 않네요. 여태까지 할 수 없었던 예측을 할 수 있게 된 것 보다는 원래 하던 예측을 더 잘하게 된 것이니깐요. 그래도 이런 공학적 발전이 있었으니, 저희가 이런 풍족한 삶을 누리게 된 것이라고 생각합니다.

1개의 좋아요

저도 사실은 보험회사에 사람 사망을 예측하는 모델이 있었구나가 더 놀랍긴 했습니다...ㅎㅎ

1개의 좋아요

아, 사실 제가 원래 공학도였는데, 그때 산업공학과 OR 쪽에 관심이 많았습니다. 그래서 이런 예측 모델들을 보던 때가 있었는데, 그래서 덜 신기하게 다가오는 것도 있을 것 같네요.

1개의 좋아요

아 그러면 그럴 수 있습니다. 저는 컴공이라서 응용 분야 모델을 보면 상당히 신선하게 느낍니다.

1개의 좋아요

(1)

저는 한 가지 궁금한 점이 생기네요.

  1. 예측의 우수성이 i. 모델의 우수성이냐 ii. 데이터의 우수성이냐.

적어도 요약해주신 글에 따르면, "덴마크 전 국민의 데이터"를 제공 받았다는 측면에서 기존 보험 회사들이 가진 데이터보다 훨씬 양적으로도, 질적으로도 우수한 데이터를 받은 것처럼 읽히는데, 그럼 예측의 우수성이 오히려 데이터의 우수성 때문에 발생한 것이지 않을까요?

arXiv 논문 결과란에는 같은 데이터에 대해 다른 모델을 비교하여 우수성을 입증했습니다. 이 부분에서 최대 11% 정도 기존 모델보다 예측도가 높았다는 내용이 국내 기사에선 보험 업계의 모델보다 우수하다라고 와전된 것 같습니다. 잘못된 내용으로 혼란을 드려 죄송합니다;;

1개의 좋아요