Humanity's Last Exam

Платформа бенчмарков для ИИ

Проект по созданию и тестированию сложных академических бенчмарков для оценки пределов возможностей ИИ, включая датасет Humanity's Last Exam с 2500 вопросами.

ИИ и нейросетиКак создать экзамен, который не пройдёт ИИ: Последний экзамен человечества

Узнайте, как разработать тест для проверки ИИ, который современные модели не проходят. Области знаний: математика, физика, древние языки. Методология Humanity's Last Exam с 2500 вопросов и принципами создания бенчмарка ИИ.

4 ответа 1 просмотр