Humanity's Last Exam
Платформа бенчмарков для ИИ
Проект по созданию и тестированию сложных академических бенчмарков для оценки пределов возможностей ИИ, включая датасет Humanity's Last Exam с 2500 вопросами.
ИИ и нейросетиКак создать экзамен, который не пройдёт ИИ: Последний экзамен человечества
Узнайте, как разработать тест для проверки ИИ, который современные модели не проходят. Области знаний: математика, физика, древние языки. Методология Humanity's Last Exam с 2500 вопросов и принципами создания бенчмарка ИИ.
4 ответа• 1 просмотр