복잡한 외교를 인공지능으로 해결하는 연구원
수세기 전, 외교의 미래에 의문이 제기되었습니다. 기술적 진보 – 라디오와 전신의 발명, 그리고 외교 정책 분야에서 대중의 개입. 최신 AI 메타 모델 대화에 활기를 불어넣으세요. CICERO는 기술 도시의 화두가 되었으며 국제 챗봇 외교도 멀지 않을 것입니다.
외교는 가장 강력한 AI도 CICERO가 등장하기 전까지 마스터할 수 없었던 예술입니다. 유명한 로마 연설가에게서 영감을 받은 키케로, Meta AI는 전략적 계획과 많은 다른 플레이어와의 구두 협상이 필요한 보드 게임인 Diplomacy에서 여러 사람을 이길 수 있는 모델을 선보였습니다. 연구원들은 이 작업이 가상 운동 코치와 심령술사를 위한 길을 열 수 있다고 말합니다.
~와 말하다 인도 분석 저널연구원, 아톨 폴 제이콥Meta AI가 인간 수준의 성과로 외교 모델 구축에 성공한 이야기를 공유했습니다.
Jacob은 대학 멘토를 통해 인공 지능에 참여했습니다. 조슈아 벤지오2018 Turing Award 수상자 Jacob은 CICERO 창립에 대해 “2019년에 MIT에서 박사 학위를 시작했는데 Noam Brown(수석 프로젝트 리더)이 내 고문들에게 외교의 큰 도전에 대해 이야기했습니다. 그는 포커 솔루션에 대한 이전 학술 기사에 성공적으로 기여했습니다.그래서 모두가 다음에 무엇을 궁금해하고 있었습니까? 결과는 외교였다.”
왜 외교인가?
수십 년 동안 인공 지능 에이전트가 모든 종류의 게임에서 인간을 능가하는 방법을 계산하면서 정복이 축적되었습니다. 제이콥은 “AI가 다루는 모든 게임은 훨씬 더 단순했습니다. 그때 Braun이 이 프로젝트를 만들고 Meta에서 더 똑똑한 엔지니어를 데려왔습니다.”라고 말했습니다. 이 연구의 목표는 다른 시스템과 환경에서 인간과 협력할 수 있는 시스템을 구축하는 방법을 발견하는 것이었습니다.
제이콥은 2020년 여름 팀이 접촉이 허용되지 않는 외교적 변형에 초점을 맞추면서 참여하게 되었습니다. “게임의 순전히 전략적인 측면에 초점을 맞춘 노프레스 외교라고 합니다. 의사소통은 있지만 보드의 움직임을 통해서만 가능하기 때문에 상당히 다릅니다. 언어 시스템에 대한 제 배경이 팀에 관심이 있었습니다.”
다른 인간 플레이어와 협상하고 조정하는 대화 시스템을 구축하는 것이 Jacob의 주요 관심사였습니다. 처음에 그는 모델의 두 가지 주요 구성 요소인 언어 구성 요소와 대화 구성 요소에 대해 작업했습니다.
신입생 때 그는 대화 구성 요소에 많은 시간을 보냈습니다. 팀은 의사소통이 가능하고 작업을 수행할 수 있는 프로토타입을 만들었지만 제대로 구현되지는 않았습니다. 그래서 1년 후인 2021년에 제이콥은 전략 요소를 다루는 팀의 다른 부분에 합류했습니다. 팀이 해야 할 일 중 하나는 인간의 합리성을 고려하는 것이었습니다.
외교 대 대화
외교 게임에는 수많은 도전 과제가 있습니다. Jacob에 따르면 첫 번째는 76명의 다른 플레이어와 언어를 사용하여 의사 소통하는 방법을 배우는 것이었고 그중 한 명은 이전에 이 설정을 연구했습니다. 다른 하나는 기술 수준이 다른 인간과 협력하는 방법을 이해하는 것이었습니다. 다른 채팅 에이전트처럼 넌센스를 뱉어 오늘 현장에서.
Jacob에 따르면 가장 큰 차이점은 오늘날 어떤 시스템도 인간 모델링을 처리할 수 없다는 것이며, 여기서 전략적 구성 요소가 등장합니다. 이러한 시스템의 대부분은 인간이 말하는 것을 반복합니다. 본질적으로 그것은 인간처럼 보이지만 인간이 어떻게 생각하는지 또는 인간이 응답으로 무엇을 말할지 결정하는 것과 같은 많은 추론을 할 수 없습니다.
가져왔다 마음의 이론 현장에서 그는 “우리의 전략적 구성 요소는 인간이 응답으로 무엇을 할 것인지 결정할 수 있으므로 대부분의 챗봇은 그것에 의존하지 않습니다. 이것이 현재 배치된 시스템의 약점입니다.”라고 말했습니다.
무엇 향후 계획?
제이콥은 특히 대화 요소와 관련하여 아직 해야 할 일이 많다고 생각합니다. 모델은 여전히 설정에 맞게 명확하게 해야 하는 비논리적인 사항을 말합니다. 그는 “우리는 그것을 고치기 위해 많은 일을 했지만 아직 해야 할 일이 더 많다고 생각한다”고 덧붙였다.
AlphaGo가 출시되었을 때 매우 Go 전용이었고 다른 보드 게임으로 확장했지만 사람들은 그것이 끝이라고 생각했습니다. 그러나 이 기술은 다음과 같은 많은 응용 분야를 가지고 있음이 밝혀졌습니다. 몬테카를로 트리 검색 이 알고리즘은 40개의 사용 사례에 사용됩니다.
“우리의 궁극적인 목표는 외교를 해결하는 것이었지만 그것이 이야기의 끝은 아닙니다. 우리는 새로운 기술을 개발하는 데 필요한 구성 요소가 아주 많을 것이라는 것을 알고 있었습니다. 따라서 이러한 다양한 구성 요소는 코드 생성에서 책임 있게 사용할 수 있는 구성 요소입니다. 미래의 정리 증명.” . 그가 끝냈다.
“많이 떨어집니다. 내성적입니다. 분석가. Coffeeaholic. 문제 해결 자. Avid 웹 전도자. Explorer.”