News Feed

"AI 한계 확인" 오픈AI 심플QA 테스트 결과, 대부분 모델 F 학점

컨텐츠 정보

  • 조회 779

본문

오픈AI는 최근 생성형 AI의 기반이 되는 LLM의 사실 정확성을 평가하기 위해 새롭게 개발한 벤치마크인 심플QA(SimpleQA)를 공개했다. 심플QA는 과학, 정치, 대중문화, 예술 등 다양한 분야에 걸친 4,326개의 질문으로 구성된 평가 도구로, 각 질문은 하나의 명확한 정답을 가지며, 독립적인 검토자가 이를 검증한다.  ⓒ ...

관련자료

댓글 0
등록된 댓글이 없습니다.