미국 스탠퍼드대와 워싱턴대 인공지능(AI) 연구진은 최근 발표한 연구 논문에서 50달러도 보다 저렴한 클라우드 컴퓨팅 비용으로 최첨단 AI 추론 모델을 훈련했다 고밝혔다. 연구진은 ‘s1’이라는 이름의 이 모델은 수학 및 코딩 능력 테스트에서 오픈AI의 ‘o1’(오원), 딥시크의 ‘R1’과 버금가는 성능을 보인다고 설명했다. o1은 오픈AI가 지난 2024년 처음 출시한 추론 모델이며, R1은 딥시크가 지난 2025년 1월 선보인 추론 모델로, o1과 성능이 비슷한 것으로 알려져 있다. s1 모델과 훈련에 사용된 데이터 및 코드는 개발자들이 코드와 파일을 저장하고 관리할 수 있도록 도와주는 웹 기반 플랫폼 깃허브(Github)에 공개됐다. 연구진은 s1을 개발하는 과정에서 ‘증류’라고 하는 기술적 과정을 통해 미세 조정을 했다고 설명했다. 증류는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해 유사한 기능을 개발하는 것을 뜻한다. s1은 구글의 최신 AI 모델인 제미나이 2.0 플래시 싱킹 익스퍼리멘털에서 증류했다. 연구진은 “s1 훈련에는 엔비디아 첨단 AI 칩인 H100 그래픽처리장치(GPU)를 사용해 30분도 걸리지 않았다.”며 “총 비용은
오픈AI는 지난 12일(현지시간) 블로그를 통해 추론 능력을 대폭 강화한 최신 모델 o1(오원) 프리뷰 버전과 미니 버전을 공개했다. 오픈 AI는 o1이 ‘딸기’라는 프로젝트를 통해 AI로는 처음으로 ‘대답하기 전에 생각하는’ 능력을 강화했다고 밝혔다. ‘사고 사슬’을 사용하여 생산적으로 사고하는 방법을 훈련하는 대규모 강화학습 알고리즘(LLM)을 적용한 결과다. o1은 복잡한 작업을 추론하고 과학, 수학, 코딩에서 이전 모델보다 더 어려운 문제를 풀었다. o1의 추론 능력을 평가하기 위해 사람들이 치루는 여러 시험을 풀어봤다. 2024년 미국 수학 올림피아드(AIME) 시험에서는 83%를 받았다. AIME에 응시한 학생 3만 명 기준으로 500위 정도의 실력으로 상당히 높은 수학적 능력을 지닌 것이다. 이전 모델인 GPT-4o는 12%에 그쳤다. 물리학, 화학, 생물학 분야의 전문성을 측정하는 GPQA 다이아몬드 테스트에서도 박사학위 전문가 수준을 능가했다. 단 이 결과는 o1이 박사 학위 전문가가 풀 수 있는 일부 문제 수준을 더 잘 풀었다는 의미이며 모든 면에서 박사 학위보다 더 유능하지는 않다고 밝혔다. AI의 성향을 추적하는 사이트인 AI트래킹은 노