تست جدید هوش عمومی AI توسط بنیاد Arc Prize
تست جدید هوش عمومی AI توسط بنیاد Arc Prize.
بنیاد Arc Prize، یک سازمان غیرانتفاعی که توسط پژوهشگر برجسته هوش مصنوعی فرانسوا شولت تأسیس شده است، در یک پست وبلاگی اعلام کرد که یک تست جدید و چالشبرانگیز برای اندازهگیری هوش عمومی مدلهای پیشرفته هوش مصنوعی ایجاد کرده است.
https://techcrunch.com/2025/03/24/a-new-challenging-agi-test-stumps-most-ai-models/
این تست جدید که **ARC-AGI-2** نام دارد، تاکنون بیشتر مدلها را به چالش کشیده است. مدلهای هوش مصنوعی "استدلالی" مانند o1-pro OpenAI و R1 DeepSeek در تست ARC-AGI-2 امتیازی بین ۱% تا ۱.۳% کسب کردهاند. مدلهای غیر استدلالی قدرتمند مانند GPT-4.5، Claude 3.7 Sonnet و Gemini 2.0 Flash نیز امتیازی حدود ۱% دارند.
آزمونهای ARC-AGI شامل مسائل معماگونهای هستند که در آنها هوش مصنوعی باید الگوهای بصری را از مجموعهای از مربعهای رنگی مختلف شناسایی کرده و "پاسخ" صحیح را تولید کند. این مسائل بهگونهای طراحی شدهاند که هوش مصنوعی را وادار کنند تا به مشکلات جدیدی که قبلاً ندیده است، سازگار شود.
0