علم و دانش

هوش مصنوعی در آستانه کشف جهان؛ آزمایش OpenAI  برای سنجش مرزهای علم

ایده استفاده از هوش مصنوعی برای پیشبرد علم، سال‌هاست الهام‌بخش چهره‌های برجسته دنیای فناوری بوده است؛ از رویای «هوش برای حل همه‌چیز» گرفته تا وعده ایجاد «کشوری از نابغه‌ها در یک دیتاسنتر». حالا OpenAI  با معرفی FrontierScience   تلاش کرده نشان دهد هوش مصنوعی تا چه حد به ایفای نقش یک همکار علمی واقعی نزدیک شده است.

FrontierScience شامل پرسش‌هایی در فیزیک، شیمی و زیست‌شناسی در دو سطح است: سطح المپیادی که توانایی حل مسایل بسیار دشوار را می‌سنجد و سطح پژوهشی که توسط دانشمندان دکتری طراحی شده و مهارت‌هایی مانند استدلال باز، قضاوت علمی و پشتیبانی از تحقیقات واقعی را ارزیابی می‌کند. برخی از این پرسش‌ها آن‌قدر پیچیده‌اند که حل آن‌ها برای پژوهشگران انسانی هفته‌ها یا حتی ماه‌ها زمان می‌برد.

نتایج نشان می‌دهد پیشرفت مدل‌های هوش مصنوعی در این حوزه بسیار سریع بوده است.  GPT-5.2  در حال حاضر بهترین عملکرد را ثبت کرده و در سطح المپیادی به دقت بالای 77 درصد رسیده است، هرچند در سطح پژوهشی هنوز فاصله قابل توجهی با عملکرد انسانی دارد. با این حال، پژوهشگران OpenAI  معتقدند اگر مدل‌ها به نمرات نزدیک به کامل در این سطح برسند، می‌توانند سرعت و دامنه پیشرفت علمی را چند برابر کنند.

با وجود این خوش‌بینی، محدودیت‌هایی نیز وجود دارد.  FrontierScience تنها توانایی‌های متنی را می‌سنجد و آزمایش عملی، تحلیل تصاویر یا ویدیوها را در بر نمی‌گیرد. همچنین تعداد کم سوالات و نبود معیار مقایسه انسانی، ارزیابی دقیق را دشوار می‌کند. برخی دانشمندان نیز نسبت به قابلیت واقعی هوش مصنوعی در تولید ایده‌های نو تردید دارند و از سیل مقالات ضعیف تولیدشده با کمک مدل‌های زبانی ابراز نگرانی می‌کنند. با این حال، نمونه‌هایی مانند AlphaFold نشان می‌دهد هوش مصنوعی می‌تواند تأثیر عمیقی بر علم بگذارد. 

 

منبع خبــــــر

 

 


نوشته های مشابه

دکمه بازگشت به بالا

Adblock را متوقف کنید

بخشی از درآمد سایت با تبلیغات تامین می شود لطفا با غیر فعال کردن ad blocker از ما حمایت کنید