بلاگ

تست جدید هوش عمومی AI توسط بنیاد Arc Prize. بنیاد Arc Prize، یک سازمان غیرانتفاعی که توسط پژوهشگر برجسته هوش مصنوعی فرانسوا شولت تأسیس شده است، در یک پست وبلاگی اعلام کرد که یک تست جدید و چالش‌برانگیز برای اندازه‌گیری هوش عمومی مدل‌های پیشرفته هوش مصنوعی ایجاد کرده است. https://techcrunch.com/2025/03/24/a-new-challenging-agi-test-stumps-most-ai-models/ این تست جدید که **ARC-AGI-2** نام دارد، تاکنون بیشتر مدل‌ها را به چالش کشیده است. مدل‌های هوش مصنوعی "استدلالی" مانند o1-pro OpenAI و R1 DeepSeek در تست ARC-AGI-2 امتیازی بین ۱% تا ۱.۳% کسب کرده‌اند. مدل‌های غیر استدلالی قدرتمند مانند GPT-4.5، Claude 3.7 Sonnet و Gemini 2.0 Flash نیز امتیازی حدود ۱% دارند. آزمون‌های ARC-AGI شامل مسائل معماگونه‌ای هستند که در آن‌ها هوش مصنوعی باید الگوهای بصری را از مجموعه‌ای از مربع‌های رنگی مختلف شناسایی کرده و "پاسخ" صحیح را تولید کند. این مسائل به‌گونه‌ای طراحی شده‌اند که هوش مصنوعی را وادار کنند تا به مشکلات جدیدی که قبلاً ندیده است، سازگار شود.