Open AI 는 지금 이걸하고 있습니다.


“Pioneering research on the path to AGI” 라는 문장은 “AGI(인공 일반 지능)로 가는 길에 선구적인 연구를 수행하다”라는 의미입니다.

인공 일반 지능(AGI)은 인간의 지능을 모방하거나 초월하는 인공지능을 의미하며, 이는 현재 인공지능 연구의 중요한 목표 중 하나입니다. 이 문장은 AGI를 향한 연구 분야에서 혁신적이고 선도적인 연구를 진행하고 있다는 것을 나타냅니다

최근리서치

Improving mathematical reasoning with process supervision


우리는 수학 문제 해결 분야에서 새로운 최고 기록을 달성하기 위해 모델을 훈련시켰습니다. 이를 위해 단순히 최종 정답을 맞추는 것에 보상을 주는 것이 아니라, 추론 과정의 각 단계가 올바를 때마다 보상을 주는 방식(“과정 감독”)을 적용했습니다. 이러한 접근 방식은 최종 결과만을 보상하는 방식(“결과 감독”)에 비해 성능을 향상시킬 뿐만 아니라, 중요한 정렬 효과도 가지고 있습니다. 즉, 이 방법은 모델이 인간이 인정하는 사고의 연쇄를 직접적으로 생성하도록 훈련시키는 것입니다.

이러한 결과가 수학 분야를 넘어서 얼마나 널리 일반화될 수 있을지는 아직 알려지지 않았습니다. 향후 연구에서 다른 분야에서의 ‘과정 감독’의 영향을 탐구하는 것이 중요하다고 생각합니다. 만약 이 결과들이 다른 분야에도 적용된다면, ‘과정 감독’이 ‘결과 감독’보다 더 높은 성능과 더 나은 조화를 동시에 제공하는 방법이 될 수 있다는 것을 발견할 수 있을 것입니다.

모든 것은 변한다.

유발 하라리